經過分析該榜單,IT168服務器頻道認為至少有以下五個新的關注點:
一、天河一號TOP100再奪魁,有望沖擊TOP500冠軍
在2010年5月底的國際TOP500排行榜上,曙光星云(Nebulae)系統(tǒng)憑借1.271PFlop/s的Linpack性能獲得了第二名的位置,這是中國超級計算機界在國際舞臺上有史以來取得的最好成績。時隔半年,本以為在今年的國內TOP100排行榜上,曙光星云會穩(wěn)拿冠軍,沒想到半年殺出了個程咬金,由國防科大生產的天河一號繼2009年之后再度奪魁。
在過去一年里,天河一號進行了大升級,目前的配置是14336顆英特爾六核至強X5670 2.93GHz CPU和7168顆Nvidia Tesla M2050 GPU和2048顆自主研發(fā)的八核飛騰FT-1000 CPU。處理內核數(shù)突破20萬顆,是去年24576顆的8.25倍。其實,天河一號不僅僅是升級,而是幾乎更新了整個結構,上一代采用的是英特爾四核CPU+ATI GPU,通過Infiniband互連,而新一代則是英特爾六核CPU+NVIDIA GPU+自主八核飛騰CPU,通過專有網絡互連。
天河一號的峰值計算性能達到了4.7Pflops,即每秒4.7千萬億次,是上一代的3.9倍,Linpack值達到2.507Pflops,達到上一代的4.4倍。與排名第二的曙光“星云”相比,天河一號的峰值性能是其1.57倍,Linpack性能是1.97倍。另外,通過采用雙精度性能更高的GPU后,天河一號的系統(tǒng)效率,即Linpack值與理論峰值的比率,也由原來的47%提高了現(xiàn)在的53.3%。
而且,值得一提的是,天河一號的Linpack性能比目前TOP500第一名的Cray機器還要高,是后者的1.425倍。因此,天河一號還非常有希望在11月中旬將要公布的新一期TOP500中取得冠軍地位,結果如何,讓我們拭目以待。
TOP10系統(tǒng)如下表所示:
二、10萬核以上的超大規(guī)模計算系統(tǒng)出現(xiàn),應用堪憂
在今年的TOP100排行榜上,出現(xiàn)了兩臺擁有10萬個處理內核以上的超級計算機系統(tǒng),這些內核包括普通的CPU核和GPU核。其中,天河一號的計算內核數(shù)更是超過了20萬顆,達到202752顆。TOP10系統(tǒng)采用的處理器核數(shù)如下表所示:
這種超大系統(tǒng)的出現(xiàn)對技術和應用兩方面都提出了很多挑戰(zhàn),包括計算效率、功耗、管理、I/O、占地面積、應用軟件等等,尤其是應用軟件可能會成為很大的瓶頸。據上海超算統(tǒng)計,2009年其使用16核以下的作業(yè)占到了60%,17-160核的作業(yè)占39%,160核以上僅僅占到1%。這也意味著很多大機器被各類超算中心買去之后,實際上都會拆分成若干塊分給不同單位或部門去使用,因此并沒在起到大機器應有的作用。
▲
要解決這個問題,一方面,我們需要開發(fā)出可以使用到千核以上的應用,以充分發(fā)揮大機器應有的作用;另一方面,其實也可以考慮將“HPC與云計算”更好結合,讓高性能計算資源池化和自動化,讓更多中小企業(yè)來使用。
三、GPU加速流行,其中5套進了TOP10
GPU加速已經成為做大系統(tǒng)的“絕招”。在最新的榜單上,采用CPU+GPU混合架構的高性能計算機就達到了7套之多(如下表所示),而且都是2010年新安裝的,其中有6套是英特爾CPU與NVIDIA GPU的搭配,另一套是英特爾CPU與AIT GPU的搭配。而且值得關注的是,在TOP10中,就有5套采用了CPU+GPU的結構。
英特爾與NVIDIA這對老冤家明爭暗斗,沒想到在用戶這里卻成了好搭檔。從大多數(shù)系統(tǒng)所使用的GPU來看,基于Fermi架構的NVidia Tesla C2050受到了一致的青睞。這也似乎意味著NIVIDA在經過幾年艱辛推廣之后,終于迎來了春天。
不過值得注意的是,GPU系統(tǒng)也并非完美無缺,除了軟件編程和移植比較難之外,計算系統(tǒng)效率低也是此次TOP100反映的一個現(xiàn)實。這7套GPU系統(tǒng)的計算效率都比較低,最低的只有18.3%,最高的也不過54%,而一般CPU集群的效率最高可突破90%,比如排名第20位的安裝在南京大學的IBM BladeCenter HS22刀片集群的效率就達到92%。
四、廠商集中化趨勢非常明顯,曙光和IBM占三分之二
從最新一期的TOP100來看,廠商的集中化趨勢非常明顯,表現(xiàn)在:一是有一些廠商退出了排行榜,比如SGI、銀河風云、蜆殼星盈等;二是份額越來越多的掌握在少數(shù)兩三家廠商手中,僅曙光和IBM兩家的份額之和就超過了62%,幾乎在重演2007年的市場格局。
▲
另外從發(fā)展趨勢來看,筆者統(tǒng)計了2007年-2010年的數(shù)據,發(fā)現(xiàn)曙光和IBM都在不斷擴大各自在HPC領域里的優(yōu)勢地位,尤其是IBM已經連續(xù)四年穩(wěn)步增長,曙光今年的增長幅度也尤其高,相反,HP的份額卻在不斷減少,一增一減形成了非常鮮明的對比。
▲
顯然,廠商的過度集中化,對于整個產業(yè)的健康發(fā)展并非好事,因為一方面市場需要競爭,從而可為用戶提供更高性價比的產品和服務,另一方面,產業(yè)也需要創(chuàng)新,特別是在云計算、物聯(lián)網的時代,需要有眾多的、有不同專業(yè)優(yōu)勢的大小廠商一起參與創(chuàng)新。
五、高性能計算在物聯(lián)網的應用值得關注
石油勘探、科學計算、互聯(lián)網、工業(yè)、電信、教育仍然是我國高性能計算的主力軍。不過,隨著許多新興行業(yè)的發(fā)展,也對大型超級計算機產生了新的需求,比如生物信息、視頻計算、動漫渲染、電子商務等。
▲
今年尤其值得關注的是HPC在物聯(lián)網領域里的應用——無錫物聯(lián)網云計算中心的曙光5000排在第80位。物聯(lián)網的發(fā)展會產生大量的數(shù)據需要計算處理,對超級計算機有著強烈的需求,雖然目前物理網還處于起步階段,但相信隨著物聯(lián)網的發(fā)展,會有越來越多的HPC系統(tǒng)出現(xiàn)。