雖然本次“神威藍光”沒有取得排名第一的成績,但對于國內(nèi)高性能計算領(lǐng)域來說具有非比尋常的意義:這是首臺全部采用國產(chǎn)CPU構(gòu)建的千萬億次超級計算系統(tǒng)。
中國計劃在天津、深圳、濟南建設(shè)3個國內(nèi)領(lǐng)先的超級計算系統(tǒng)研發(fā)、應(yīng)用中心。其中天津超算中心已經(jīng)裝備了排名第一的天河一號,而深圳超算中心也在去年裝備了曙光研制的星云超算系統(tǒng)。如今,濟南超算中心正式掛牌,而這套由浪潮幫助山東信息通信技術(shù)研究院打造的“神威藍光”系統(tǒng)采用了MPP萬萬億次體系架構(gòu),全水冷散熱方式,并且處理器全部采用了江南計算所研發(fā)的“神威1600A”多核處理器。
中科院軟件所張云泉教授對記者表示,中國超級計算機全自主研發(fā)具有重大意義,不論從高速網(wǎng)絡(luò)還是從國產(chǎn)化處理器在安全性和通用計算性方面已經(jīng)達到世界先進水平。另一方面,全國產(chǎn)化的獨立自主也標(biāo)志著我國高性能計算系統(tǒng)已經(jīng)可以走出國門,向其他國家出口。
全國產(chǎn)處理器顯“神威”
“神威藍光”超算系統(tǒng)是由國家并行計算機工程技術(shù)研究中心研制,獲得科技部863計劃支持,于2010年9月開始由浪潮集團承接該項目一同設(shè)計和建造而成的。該計算系統(tǒng)共計投資約6個億,建設(shè)周期2年,本次揭牌進入Top100榜單的屬于該系統(tǒng)的第一期工程。
從公布的數(shù)據(jù)上來看,“神威藍光”超算系統(tǒng)全部采用自主設(shè)計生產(chǎn)的處理器(ShenWei processor SW1600),系統(tǒng)共8704個CPU,峰值計算性能1.07016PFlops,持續(xù)性能795.9TFlops,Linpack效率74.37%,總功耗1074KW。
該系統(tǒng)采用了8700個神威SW1600微處理器,該處理器擁有16個計算核心,主頻在975~1100MHz之間——也得益于其流水線的減少,每個處理器的計算性能可以達到124.8~140.8Gflops。據(jù)介紹,該處理器的穩(wěn)定性遠勝于一般的x86集群,在Linpack測試中穩(wěn)定的跑了近9個小時,一次錯誤也沒有發(fā)生。
網(wǎng)絡(luò)方面,“神威藍光”采用了胖樹結(jié)構(gòu),節(jié)點間采用了來自Mellanox的QDR Infiniband網(wǎng)絡(luò),其傳輸速度高達40Gbps,MPI消息延遲則小于2us。其存儲系統(tǒng)的設(shè)計容量則達到了2PB,I/O理論帶寬是200GB/s,適用于可續(xù)計算、MPICC、UPC、Fortran、C++和SWCC等常規(guī)科研環(huán)境和通用編程語言的程序。
此外,由于神威SW1600處理器的低功耗,該系統(tǒng)每個機柜擁有1024顆CPU,結(jié)合多種節(jié)能技術(shù)和水冷技術(shù)其能效比達到了741.06MFlops/W。據(jù)了解,“神威藍光”的冷卻用水是內(nèi)部封閉循環(huán),并且是來自礦泉水廠處理過的純水。該技術(shù)與以往的水冷技術(shù)相比,由于是內(nèi)部循環(huán),因此節(jié)約了大量的水消耗和風(fēng)冷消耗。
另一個亮點在于“神威藍光”基于預(yù)警和數(shù)據(jù)挖掘的前瞻式主動容錯技術(shù),該技術(shù)大大提升了該系統(tǒng)的穩(wěn)定性和可靠性。而基于虛擬化的資源池結(jié)構(gòu)支持在線遷移功能,也大大方便了作業(yè)任務(wù)調(diào)度。
以下是“神威藍光”和“天河一號”以及“星云”系統(tǒng)的比較。