全球最快AI超級計(jì)算機(jī)開動,每秒4百億億浮點(diǎn)運(yùn)算!正拼接最大宇宙3D地圖
2021-6-1 11:10:59????點(diǎn)擊:
來源:venturebeat
宇宙是在不斷膨脹的嗎?是的!而令宇宙不斷膨脹的「罪魁禍?zhǔn)住咕褪?span style="color:#FF4C00;">暗能量。
作為是宇宙中最神秘的物質(zhì),它看不見摸不著,為了捕捉它,人類在地球上建立了許多相關(guān)實(shí)驗(yàn),但都成效甚微。
但如今,一臺擁有強(qiáng)大AI性能的超級計(jì)算機(jī),或許能夠助我們一臂之力。
近日,英偉達(dá)和美國國家能源研究科學(xué)計(jì)算中心(NERSC)打開了一個「開關(guān)」——Perlmutte,該計(jì)算機(jī)被稱為世界上用于人工智能工作負(fù)載的最快的超級計(jì)算機(jī)。
這臺新的超級計(jì)算機(jī)以天體物理學(xué)家索爾-珀?duì)栺R特(Saul Perlmutter)的名字命名,擁有6144個英偉達(dá)A100 Tensor Core GPU,將負(fù)責(zé)拼接有史以來最大的可見宇宙3D地圖
不僅如此,Perlmutter 還將對「宇宙攝像機(jī)」暗能量光譜儀(DESI)的數(shù)據(jù)進(jìn)行處理,這是一種可以在一次曝光中捕獲多達(dá) 5,000 個星系的宇宙相機(jī)。
處理DESI巨量數(shù)據(jù),繪制最大的可見宇宙3D地圖
那么,宇宙的3D地圖該如何拼湊呢?
在不久前的5 月 17 日,DESI先行啟動,開始了為期五年的捕捉數(shù)據(jù)之旅。在此前的四個月試運(yùn)行期間,DESI已經(jīng)捕獲了 400 萬個星系的光譜,這超過了以往所有光譜調(diào)查的總和。
而Perlmutter要做的,就是對DESI的數(shù)據(jù)進(jìn)行匯總處理。
根據(jù)官網(wǎng)的介紹, Perlmutter 的 GPU 在一個晚上捕獲數(shù)十次曝光。在之前的系統(tǒng)上,準(zhǔn)備一年的數(shù)據(jù)以供發(fā)布可能需要數(shù)周或數(shù)月的時(shí)間,但 Perlmutter 將能夠在短短幾天內(nèi)完成任務(wù)。
「我對我們在準(zhǔn)備工作中在 GPU 上獲得的 20 倍加速感到非常滿意?!筃ERSC 的數(shù)據(jù)架構(gòu)師 Rollin Thomas 說,他正在幫助研究人員為Perlmutter準(zhǔn)備代碼。
Rollin Thomas難掩對Perlmutter性能的自信,因?yàn)镻erlmutter是世界上最大的 A100 驅(qū)動系統(tǒng),有超過 20 個應(yīng)用程序正準(zhǔn)備成為首批搭載 6,159 個NVIDIA A100 Tensor Core GPU 的應(yīng)用程序,在NERSC正式投入使用后,Perlmutter將為 7,000 多名研究人員提供近 4 exaflops 的 AI 性能。
暗能量主要是通過 2011 年諾貝爾獎獲得者 Saul Perlmutter 的工作發(fā)現(xiàn)的。
在物理宇宙學(xué)中,暗能量是一種充溢空間的、增加宇宙膨脹速度的難以察覺的能量形式。暗能量假說是當(dāng)今對宇宙加速膨脹的觀測結(jié)果的解釋中最為流行的一種。在宇宙標(biāo)準(zhǔn)模型中,暗能量占據(jù)宇宙68.3%的質(zhì)能
作為某種作用于時(shí)空結(jié)構(gòu)本身的能量,暗能量是種均勻的負(fù)壓力,會導(dǎo)致時(shí)空結(jié)構(gòu)膨脹。1998年,高紅移超新星搜索隊(duì)觀測組發(fā)表了Ia型超新星的觀測數(shù)據(jù),顯示宇宙在加速膨脹。隨之,1999年,超新星宇宙學(xué)計(jì)劃證實(shí)了該結(jié)果。該項(xiàng)工作于2011年獲得諾貝爾物理學(xué)獎。
但遺憾的是,目前我們對它的研究仍然不夠確切,DESI 的地圖為我們帶來了揭示暗能量奧秘的的新希望。
超級計(jì)算機(jī)融合 AI、HPC
毫無疑問,Perlmutter的作用將是無限的,除了拼湊宇宙的 3D 地圖,還能幫助探索綠色能源的亞原子相互作用等等。
NERSC的應(yīng)用性能專家Brandon Cook說:「過去不可能對像電池界面這樣的大系統(tǒng)進(jìn)行完全的原子模擬,但現(xiàn)在科學(xué)家們計(jì)劃用Perlmutter來做這件事?!?
我們知道,傳統(tǒng)的超級計(jì)算機(jī)幾乎無法處理幾納秒內(nèi)生成幾個原子模擬所需的數(shù)學(xué)運(yùn)算,無法使用 Quantum Espresso 等程序。但通過將其高度精確的模擬與機(jī)器學(xué)習(xí)相結(jié)合,科學(xué)家可以在更長的時(shí)間內(nèi)研究更多的原子。
這也是英偉達(dá) A100 中 Tensor Core 發(fā)揮其獨(dú)特作用的地方。它們加速了用于模擬的雙精度浮點(diǎn)數(shù)學(xué)運(yùn)算和深度學(xué)習(xí)所需的混合精度計(jì)算。
Perlmutter 基于包括 Slingshot 互連的 HPE Cray Shasta 平臺,這是一個具有 GPU 加速節(jié)點(diǎn)和僅 CPU 節(jié)點(diǎn)的異構(gòu)系統(tǒng)。該系統(tǒng)分兩個階段進(jìn)行安裝——最近揭幕的是第一階段,其中包括系統(tǒng)的 GPU 加速節(jié)點(diǎn)和暫存文件系統(tǒng);第 2 階段將在 2021 年晚些時(shí)候添加僅使用 CPU 的節(jié)點(diǎn)。
英偉達(dá)高級產(chǎn)品營銷經(jīng)理 Dion Harris 在今天發(fā)布的博客中表示:「這使 Perlmutter 成為地球上在 16 位和 32 位混合精度數(shù)學(xué) AI 使用中速度最快的系統(tǒng)。而且是目前為止,今年晚些時(shí)候在勞倫斯伯克利國家實(shí)驗(yàn)室的系統(tǒng)的第二階段或許更強(qiáng)。」
Perlmutter 的 A100 GPU 采用 Nvidia Tensor Core 技術(shù)和直接液體冷卻。另外,它也是 NERSC 的第一臺具有全閃存暫存文件系統(tǒng)的超級計(jì)算機(jī)。據(jù) NERSC 稱,35 PB 的 Lustre 文件系統(tǒng)將以超過 5 TB/秒的速度移動數(shù)據(jù),使其成為同類中最快的存儲系統(tǒng)。
Perlmutter 安裝的第一階段由 12 個 GPU 加速機(jī)柜組成,可容納 1,500 多個節(jié)點(diǎn)。今年晚些時(shí)候的第二階段將增加 12 個 CPU 機(jī)柜,超過 3,000 個節(jié)點(diǎn)。Phase 1 的每個 GPU 加速節(jié)點(diǎn)都有四個基于 NVIDIA Ampere GPU 架構(gòu)的 A100 Tensor Core GPU 以及 256GB 的內(nèi)存。每個 Phase 1 節(jié)點(diǎn)還有一個 AMD「Milan」 CPU。第一階段系統(tǒng)還包括非計(jì)算節(jié)點(diǎn) (NCN)、20 個用戶訪問節(jié)點(diǎn)(NCN-UAN – 登錄節(jié)點(diǎn))和服務(wù)節(jié)點(diǎn)。據(jù) NERSC 稱,一些 NCN-UAN 可用于部署容器化用戶環(huán)境,使用 Kubernetes 進(jìn)行編排。
第一階段機(jī)柜沒有連接門,直接液體冷卻系統(tǒng)的藍(lán)色和紅色線條
Phase 2 的每個 CPU 節(jié)點(diǎn)都將有兩個 AMD Milan CPU,每個節(jié)點(diǎn)具有 512GB 的內(nèi)存。Phase 2 系統(tǒng)還增加了 20 個登錄節(jié)點(diǎn)和 4 個大內(nèi)存節(jié)點(diǎn)。
支持多種編程環(huán)境,用計(jì)算極限探索宇宙極限
除了 CCE、GNU 和 LLVM 編譯器外,Perlmutter 編程環(huán)境還將采用 NVDIA HPC SDK(軟件開發(fā)套件),以支持多種并行編程模型,例如 MPI、OpenMP、CUDA 和用于 C、C++ 和 Fortran 代碼的 OpenACC。
雖然人類用肉身探索宇宙的能力有限,但計(jì)算機(jī)沒有這個障礙。
例如去年10月份,來自夏威夷大學(xué)馬諾阿分校天文研究所的一組天文學(xué)家就在AI神經(jīng)網(wǎng)絡(luò)的幫助下,創(chuàng)造了迄今為止最全面的「天文學(xué)成像目錄」,包括恒星、星系和類星體等。
該系統(tǒng)還測定了與星系的距離,最多只有3% 的誤差。根據(jù)夏威夷大學(xué)的說法,最終的成果是「世界上最大的恒星、星系和類星體三維成像目錄」
甚至,有來自微軟的物理學(xué)家用80頁論文證明「模擬矩陣」:宇宙是個自學(xué)成才的計(jì)算機(jī)。
進(jìn)化定律的自學(xué)成才系統(tǒng)(a self-learning system of evolutionary laws)
根據(jù)作者的觀點(diǎn),宇宙也演化出了類似深度學(xué)習(xí)框架的自發(fā)系統(tǒng)。
我們知道,深度學(xué)習(xí)框架就是一套積木,各個組件就是某個模型或算法的一部分,你可以自己設(shè)計(jì)積木的堆疊。
因此,我們是否可以想象,宇宙演化出法則的操作矩陣架構(gòu),其本身是從一個自動教學(xué)系統(tǒng)演化而來的,該系統(tǒng)產(chǎn)生于最可能的最小初始條件?
論文中,作者描述了幾個模型,這些模型均實(shí)現(xiàn)了「自導(dǎo)自演」:
有7,088個節(jié)點(diǎn)和7,304條邊的圖,由抽樣可能的未來構(gòu)成
生活中,物理定律的得出靠的是我們的觀察,所以原始物理定律將極其簡單,但經(jīng)過代代更迭,定律有了自我延續(xù)并具有學(xué)習(xí)和發(fā)展的能力。
也許,宇宙不是從大爆炸開始的,而僅僅是粒子之間的簡單相互作用。
文章圍繞受限玻爾茲曼機(jī)(restricted Boltzmann machine, RBM)討論。
受限玻爾茲曼機(jī)由Hinton等人提出,是一種生成式隨機(jī)神經(jīng)網(wǎng)絡(luò)。這個概念非常抽象,是一種類似物理學(xué)的機(jī)器學(xué)習(xí)模型。然而,受限玻爾茲曼機(jī)是最簡單的一類深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),
該架構(gòu)由兩層神經(jīng)元組成。一個是可見層(綠色),一個是隱藏層(藍(lán)色)。
了解宇宙未知的一面,一直是天文學(xué)家努力的方向。有了AI這個「隊(duì)友」,我們會不會加速通向探秘宇宙的星辰大海呢?
文章來源網(wǎng)絡(luò),僅為分享