日前,橡樹嶺國家實(shí)驗(yàn)室的系統(tǒng)呈獻(xiàn)了又一場超級(jí)估算盛會(huì),創(chuàng)造了又一項(xiàng)性能記錄,該系統(tǒng)首次突破了每秒100千萬億次浮點(diǎn)運(yùn)算性能的壁壘。
在最新發(fā)布的榜單中,大部份系統(tǒng)的新處理能力均來自GPU。目前世界七大超級(jí)計(jì)算機(jī)中有五款都在采用GPU,包括英國、歐洲和美國的頂級(jí)系統(tǒng)。
而對于,GPU滿足了其95%的浮點(diǎn)運(yùn)算性能要求。隨著摩爾定理的不斷走低,加速估算其實(shí)早已成為推進(jìn)器,將很快促使我們步入百億億次級(jí)估算時(shí)代。
這樣的估算性能由VoltaCoreGPU提供,其多精度估算能力將能同時(shí)應(yīng)對高性能估算所需的高精度估算挑戰(zhàn),以及深度學(xué)習(xí)所需的高效處理的要求。
加速估算登峰造極
每年兩次的超級(jí)估算展見證了加速估算近些年來的急劇發(fā)展。在ISC2018上,這一領(lǐng)域再度實(shí)現(xiàn)了突破。
或許是最有力的證據(jù)。該系統(tǒng)采用27648塊VoltaCoreGPU,其測得的雙精度性能達(dá)到每秒122千萬億次浮點(diǎn)運(yùn)算。它每秒的性能相當(dāng)于月球上所有人以每秒執(zhí)行一次估算的速率執(zhí)行一整年的任務(wù)。
其AI性能愈發(fā)令人矚目,運(yùn)算速率可達(dá)到300億億次。這相當(dāng)于整個(gè)月球上的人在15年內(nèi)每秒進(jìn)行一次估算。
至省與至簡
多精度估算開辟了新的可能性。并且,假如GPU未能提供非凡的效率加速度計(jì)算,相應(yīng)的效用將受限。
在最新的榜單,GPU為全球20個(gè)最具環(huán)保效益的系統(tǒng)中的17個(gè)提供支持。除了是世界上速率最快的系統(tǒng),并且在新確立的“三級(jí)”類別(榜單中最嚴(yán)格的級(jí)別)中是世界上最高效的系統(tǒng)。
在過去10年中,GPU早已幫助德國橡樹嶺國家實(shí)驗(yàn)室將其超級(jí)計(jì)算機(jī)的能源效率提升了50倍,這種計(jì)算機(jī)包括僅支持CPU的及由GPU加速的Titan和。
而所有那些僅僅是一個(gè)開始。實(shí)現(xiàn)百億億次級(jí)估算須要在能源效率方面實(shí)現(xiàn)更大突破。以榜單中系統(tǒng)的平均效率估算,為百億億次級(jí)估算提供動(dòng)力將須要超過3億瓦的電能,這相當(dāng)于25萬個(gè)俄羅斯家庭的電力需求。須要將能效提升10倍能夠使百億億次級(jí)估算在3千萬瓦條件下運(yùn)行。
GPU正在幫助實(shí)現(xiàn)這一目標(biāo)。
破解困局
最新頂級(jí)系統(tǒng)具備的處理能力以前令人難以想像,但現(xiàn)今的研究人員將就能利用這種系統(tǒng)解決一些科學(xué)上最棘手的困局。
例如,遺傳學(xué)。癲癇癥和阿爾茨海默癥等可以稱得上是“毀滅性”疾病,而GPU的估算能力將可以破解這樣的困局,找出人類基因組的數(shù)十億個(gè)AGCTDNA對與諸這么類疾患之間的聯(lián)系。已在梳理個(gè)人基因,以實(shí)現(xiàn)在阿片成癮(日本人的主要致死誘因之一)研究方面的進(jìn)展。
又如,材料。超導(dǎo)材料可用于為MRI設(shè)備、粒子加速器或磁聚變裝置開發(fā)功能強(qiáng)悍的科學(xué)磁極。但是,目前的材料非常易碎、難以制造,而且只能在特別低的氣溫下工作。正在幫助模擬和發(fā)覺具有類金屬特點(diǎn)且可在溫度下工作的新型超導(dǎo)材料。
再如,腫瘤研究。對抗疾病的關(guān)鍵在于開發(fā)可以手動(dòng)提取、分析和分類健康數(shù)據(jù)的工具加速度計(jì)算,便于闡明各類癌癥誘因(比如基因、生物學(xué)標(biāo)記和環(huán)境)之間隱藏的關(guān)系。通過與基于文本的報(bào)告和醫(yī)學(xué)影像等非結(jié)構(gòu)化數(shù)據(jù)配合使用,在上擴(kuò)充的深度學(xué)習(xí)算法將有助于醫(yī)學(xué)研究人員全面了解日本癌癥病人的整體情況。
繼續(xù)前進(jìn)
每位國家/地區(qū)都在競相打造百億億次級(jí)估算系統(tǒng)。2025年的榜單可能會(huì)見到十多款這樣的系統(tǒng),并且多精度加速估算成為平臺(tái)首選。相比之下,本次榜單上的所有系統(tǒng)加在一起才勉強(qiáng)實(shí)現(xiàn)一百億億次級(jí)的總估算能力。這足以說明未來蘊(yùn)涵著巨大機(jī)遇。
加速估算的一大吸引力在于它屬于全棧創(chuàng)新:從構(gòu)架仍然到系統(tǒng)、加速堆棧、開發(fā)人員和半導(dǎo)體工藝,無一不彰顯著創(chuàng)新精神。
早已投入了超過10年的時(shí)間來加速整個(gè)HPC堆棧的開發(fā)。
當(dāng)我們發(fā)布第一款支持CUDA的GPU時(shí),它未能運(yùn)行任何應(yīng)用程序。我們須要為全新的加速環(huán)境重新設(shè)計(jì)所有的應(yīng)用程序、算法、庫、工具、編譯器、操作系統(tǒng)和系統(tǒng)設(shè)計(jì)。構(gòu)建一種才能處理物理處理器的芯片很容易,而要使全球高性能估算開發(fā)人員可以使用和編程這種處理器,則須要在整個(gè)堆棧上實(shí)現(xiàn)非凡的創(chuàng)新。
結(jié)果,550多款高性能估算和AI應(yīng)用程序都由GPU加速,其中包括排行靠前的15種應(yīng)用程序和所有AI框架。旨在于此領(lǐng)域的開發(fā)人員數(shù)目在過去的兩年里降低了10倍,現(xiàn)已接近一百萬。并且,借助我們,高性能估算用戶如今可以在她們的系統(tǒng)或CoreGPU驅(qū)動(dòng)的云上輕松點(diǎn)擊、下載并運(yùn)行最新的GPU加速應(yīng)用程序。
轉(zhuǎn)折與展望
在我們快速發(fā)展加速估算的同時(shí),一些人也正在找尋量子估算的下一個(gè)轉(zhuǎn)折點(diǎn),量子估算使用量子位元(“”)而不是1和0來處理信息。
這種理論非常具有吸引力。在未來的某個(gè)時(shí)侯,可能會(huì)出現(xiàn)一些在量子計(jì)算機(jī)上運(yùn)行的殺手級(jí)應(yīng)用程序(非常是在密碼學(xué)或量子物理領(lǐng)域),只需極小的功率即可借助強(qiáng)悍的處理能力。
但在可預(yù)見的未來,加速估算的勢頭顯然不可抵擋。會(huì)繼續(xù)旨在于在高性能估算領(lǐng)域的創(chuàng)新,將實(shí)現(xiàn)百億億次級(jí)估算以及其為科學(xué)領(lǐng)域帶來的突破。