AMD Instinct MI200系列加速器基于AMD CDNA 2架構(gòu),可為廣泛的HPC工作負(fù)載提供領(lǐng)先的應(yīng)用程序性能。 其中,AMD Instinct MI250X加速器可為雙精度(FP64)高性能應(yīng)用程序提供更強的性能,并為AI工作負(fù)載帶來超過380 teraflops的理論半精度(FP16)峰值,通過強大的性能進一步加速由數(shù)據(jù)驅(qū)動的研究。

AMD高級副總裁兼數(shù)據(jù)中心與嵌入式解決方案事業(yè)部總經(jīng)理Forrest Norrod表示:“AMD Instinct MI200加速器提供了領(lǐng)先的HPC和AI性能,幫助科學(xué)家在研究方面實現(xiàn)了跨時代的飛躍,同時極大地縮短了從最初的假設(shè)到發(fā)現(xiàn)的時間。憑借在架構(gòu)、封裝和系統(tǒng)設(shè)計方面的關(guān)鍵性創(chuàng)新,AMD Instinct MI200系列加速器是公司有史以來更為先進的數(shù)據(jù)中心GPU,為超級計算機和數(shù)據(jù)中心帶來卓越的性能,以幫助超級計算機和數(shù)據(jù)中心解決世界上的復(fù)雜難題?!?/p>

AMD加速Exascale時代

AMD與美國能源部、橡樹嶺國家實驗室和HPE合作共同設(shè)計的Frontier超級計算機,預(yù)計可提供超過1.5 exaflops的峰值計算性能。基于第三代AMD EPYC處理器以及AMD Instinct MI250X加速器,F(xiàn)rontier將通過大幅提高AI、分析和模擬的性能來推動科學(xué)發(fā)現(xiàn)的發(fā)展,幫助科學(xué)家進行更多計算、識別數(shù)據(jù)中的新模式,并開創(chuàng)新的數(shù)據(jù)分析方法,從而加速科學(xué)發(fā)現(xiàn)的速度。

橡樹嶺國家實驗室主管Thomas Zacharia說:“Frontier超級計算機是AMD、HPE和美國能源部之間強有力合作的結(jié)晶,它提供了一個具有Exascale能力的系統(tǒng),通過大幅提高人工智能、分析和模擬的性能,推動科學(xué)發(fā)現(xiàn)的發(fā)展?!?/p>

為HPC的未來提供動力

AMD Instinct MI200系列加速器與第三代AMD EPYC處理器和ROCm 5.0開放軟件平臺相結(jié)合,旨在推動Exascale時代新發(fā)現(xiàn),并解決從氣候變化到疫苗研究等種種最緊迫的新挑戰(zhàn)。

AMD Instinct MI200系列加速器關(guān)鍵特性和功能包括:

——AMD CDNA 2架構(gòu):相比AMD前代GPU,第二代矩陣核心加速的FP64和FP32矩陣運算可提供高達(dá)4倍的FP64理論峰值性能

——領(lǐng)先的封裝技術(shù):作為業(yè)界首個采用2.5D Elevated Fanout Bridge技術(shù)(EFB)的多芯片GPU設(shè)計,與AMD前代GPU相比,可提供1.8倍的核心數(shù)和2.7倍的顯存帶寬,以及業(yè)界領(lǐng)先的每秒3.2 terabytes的理論峰值顯存帶寬。

—— 第三代AMD Infinity Fabric技術(shù):多達(dá)8個Infinity Fabric鏈接將AMD Instinct MI200與節(jié)點中的第三代EPYC處理器和其他GPU相連,以實現(xiàn)統(tǒng)一的CPU內(nèi)存/GPU顯存一致性和系統(tǒng)吞吐量最大化,通過加速器的強大性能使CPU代碼更簡化。

專為Exascale科學(xué)而打造的軟件

AMD ROCm是一個開放的軟件平臺,可幫助研究人員借助AMD Instinct加速器的強大性能推動科學(xué)發(fā)現(xiàn)。ROCm平臺建立在開放移植的基礎(chǔ)上,支持跨多個加速器供應(yīng)商和架構(gòu)的環(huán)境。得益于ROCm 5.0,AMD擴展了其開放平臺:通過AMD Instinct MI200系列加速器為頂級HPC和AI應(yīng)用程序提供支持,為開發(fā)者增加了ROCm的可訪問性,并在關(guān)鍵工作負(fù)載中提供領(lǐng)先的性能。

借助AMD Infinity Hub,研究人員、數(shù)據(jù)科學(xué)家和終端用戶可以輕松地找到、下載并安裝在AMD Instinct加速器和ROCm上得到充分優(yōu)化和支持的眾多HPC應(yīng)用程序和ML框架。該項目門戶目前可支持AMD Radeon Instinct MI50、AMD Instinct MI100以及AMD Instinct MI200加速器,包括Chroma、CP2k、LAMMPS、NAMD、OpenMM在內(nèi)的等眾多應(yīng)用程序,以及TensorFlow和PyTorch這樣的ML框架。目前該項目門戶中的可支持列表還在不斷增加。

現(xiàn)有服務(wù)器解決方案

AMD Instinct MI250X和AMD Instinct MI250現(xiàn)已可在開放硬件計算加速器模塊或OCP加速器模塊(OAM)規(guī)范中使用。AMD Instinct MI210將在OEM服務(wù)器中的PCIe卡規(guī)范中使用。

目前AMD MI250X加速器已開始為HPE的HPE Cray EX超級計算機提供動力,預(yù)計2022年第一季度,包括華碩、ATOS、戴爾科技、Hewlett Packard Enterprise(HPE)、聯(lián)想和Penguin Computing and Supermicro等在內(nèi)的企業(yè)級市場主要OEM和ODM合作伙伴,將在其系統(tǒng)中使用其它AMD Instinct MI200系列加速器。

MI200系列參數(shù)

分享到

xiesc

相關(guān)推薦