NVIDIA Hopper GPU 架構(gòu)采用全新 DPX 指令將動(dòng)態(tài)編程速度提升 40 倍

來源:投影時(shí)代 更新日期:2022-03-28 作者:佚名

    動(dòng)態(tài)編程算法應(yīng)用于醫(yī)療健康、機(jī)器人、量子計(jì)算、數(shù)據(jù)科學(xué)等多個(gè)領(lǐng)域。

    3 月 23 日在 GTC 上發(fā)布的 NVIDIA Hopper GPU 架構(gòu)利用全新 DPX 指令,將動(dòng)態(tài)編程速度提高多達(dá) 40 倍。動(dòng)態(tài)編程是一種應(yīng)用于基因組學(xué)、量子計(jì)算、路線優(yōu)化等領(lǐng)域算法中,用以解決問題的技術(shù)。

    DPX 是 NVIDIA H100 GPU 的內(nèi)置指令集,可幫助開發(fā)者編寫代碼,用以提高多個(gè)行業(yè)中動(dòng)態(tài)編程算法的速度,從而加速疾病診斷、量子模擬、圖形分析和路線優(yōu)化的工作流程。

    何為動(dòng)態(tài)編程?

    動(dòng)態(tài)編程是一種起源于 20 世紀(jì) 50 年代的熱門技術(shù),它通過遞歸和記憶化這兩種關(guān)鍵技術(shù)來解決復(fù)雜問題。

    遞歸是指將問題分解為較簡單的子問題,達(dá)到節(jié)省時(shí)間和計(jì)算量的目的。而記憶化則負(fù)責(zé)存儲(chǔ)這些子問題的答案,這些答案在解決主問題時(shí)會(huì)被重復(fù)使用多次。記憶化可提高效率,因此在主問題稍后需要這些答案時(shí)無需重新計(jì)算子問題。

    與 NVIDIA Ampere 架構(gòu) GPU 相比,DPX 指令在 NVIDIA H100 GPU 上將動(dòng)態(tài)編程算法的速度提升了 7 倍之多。在搭載四塊 NVIDIA H100 GPU 的節(jié)點(diǎn)中,速度還可以進(jìn)一步提升。

    用例涵蓋醫(yī)療健康、機(jī)器人、量子計(jì)算、數(shù)據(jù)科學(xué)

    動(dòng)態(tài)編程通常用于許多優(yōu)化、數(shù)據(jù)處理和組學(xué)算法中。迄今為止,大部分開發(fā)者都已在 CPU 或 FPGA 上運(yùn)行了此類算法,而 NVIDIA Hopper GPU 上,借助 DPX 指令,可實(shí)現(xiàn)大幅加速。

    組學(xué)

    組學(xué)涵蓋一系列生物領(lǐng)域,包括基因組學(xué)(側(cè)重于 DNA)、蛋白質(zhì)組學(xué)(側(cè)重于蛋白質(zhì))和轉(zhuǎn)錄組學(xué)(側(cè)重于 RNA)。這些領(lǐng)域?yàn)榧膊⊙芯亢退幬镅邪l(fā)等依賴于算法分析(可通過 DPX 指令加速)的關(guān)鍵工作提供了依據(jù)。

    例如,Smith-Waterman 和 Needleman-Wunsch 動(dòng)態(tài)編程算法用于 DNA 序列比對、蛋白質(zhì)分類和蛋白質(zhì)折疊之中。這兩種算法均使用評分的方法來測量不同樣本基因序列的比對情況。

    Smith-Waterman 可生成高度準(zhǔn)確的結(jié)果,但與其他比對方法相比,需消耗更多計(jì)算資源和時(shí)間。在搭載四塊 NVIDIA H100 GPU 的節(jié)點(diǎn)上使用 DPX 指令時(shí),科學(xué)家可將此進(jìn)程加快 35 倍,實(shí)現(xiàn)實(shí)時(shí)處理。其中,堿基識別和比對工作的速度與 DNA 測序相同。

    這種加速將有助于全球各地的醫(yī)院普及基因組分析,讓科學(xué)家朝著為患者提供個(gè)性化醫(yī)療的方向邁進(jìn)。

    線路優(yōu)化

    無論是行走于倉庫這樣動(dòng)態(tài)化環(huán)境中的自主機(jī)器人,還是需要將數(shù)據(jù)傳輸?shù)接?jì)算機(jī)網(wǎng)絡(luò)中多個(gè)接收端的發(fā)送者,都需要為多個(gè)移動(dòng)部件找到最優(yōu)線路,這一點(diǎn)至關(guān)重要。

    為了解決這一優(yōu)化問題,開發(fā)者使用 Floyd-Warshall 動(dòng)態(tài)編程算法來尋找地圖或圖形中所有成對目的地之間的最短距離。在搭載四塊 NVIDIA H100 GPU 的服務(wù)器中,與傳統(tǒng)的雙插槽 CPU 服務(wù)器相比,F(xiàn)loyd-Warshall 將速度提升了 40 倍之多。

    結(jié)合 NVIDIA cuOpt AI 物流軟件,這種線路優(yōu)化加速可用于工廠、自動(dòng)駕駛汽車中的實(shí)時(shí)應(yīng)用或抽象圖形中的地圖構(gòu)建和線路算法。

    量子模擬

    借助 DPX 指令,其他大量動(dòng)態(tài)編程算法均可在 NVIDIA H100 GPU 上實(shí)現(xiàn)加速。量子計(jì)算領(lǐng)域前景廣闊。在量子計(jì)算中,量子模擬的張量優(yōu)化算法會(huì)使用動(dòng)態(tài)編程。DPX 指令可以幫助開發(fā)者加快識別正確張量縮并順序的過程。

    SQL 查詢優(yōu)化

    另一個(gè)潛在應(yīng)用領(lǐng)域是數(shù)據(jù)科學(xué)。使用 SQL 編程語言的數(shù)據(jù)科學(xué)家通常需要在一組表上執(zhí)行多次“合并”運(yùn)算。動(dòng)態(tài)編程有助于找到這些合并的最佳順序,這通常可以節(jié)省大量執(zhí)行時(shí)間,從而加快 SQL 查詢速度。

 標(biāo)簽:人工智能 新品快訊
廣告聯(lián)系:010-82755684 | 010-82755685 手機(jī)版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時(shí)代網(wǎng) 版權(quán)所有 關(guān)于投影時(shí)代 | 聯(lián)系我們 | 歡迎來稿 | 網(wǎng)站地圖
返回首頁 網(wǎng)友評論 返回頂部 建議反饋
快速評論
驗(yàn)證碼: 看不清?點(diǎn)一下
發(fā)表評論