近日,第41屆國際超級計算機TOP500榜單在國際超級計算大會(ISC13)上公布(詳情請見http://www.top500.org/),中國超級計算機“天河二號(Milky Way2)”以33.86 PFlops的實測峰值榮登榜首。
“微異構(gòu)架構(gòu)”提升系統(tǒng)可編程性
盡管“天河二號”肩負(fù)著奪冠的重大使命,但與往常一些只為了奪冠的超級計算機有所不同,“天河二號”更重要的任務(wù)是應(yīng)用——支持整個長三角地區(qū)的科學(xué)研究、企業(yè)計算,甚至一些大數(shù)據(jù)的應(yīng)用。因此,它對于可編程性要求非常高。
從系統(tǒng)架構(gòu)上來看,“天河二號”整個系統(tǒng)采用了32000顆英特爾E5 2600 V2系列,加上48000英特爾至強融核協(xié)處理器。這樣的架構(gòu),英特爾將其稱之為“微異構(gòu)架構(gòu)”。什么是“微異構(gòu)架構(gòu)”?英特爾(中國)服務(wù)器平臺產(chǎn)品經(jīng)理張振宇給出了這樣的解釋,“所謂‘微異構(gòu)架構(gòu)’就是采用單一編程模式的異構(gòu)”。
【圖2】英特爾(中國)服務(wù)器平臺產(chǎn)品經(jīng)理張振宇
這聽起來似乎很有誘惑力,因為對于許多高性能計算的客戶而言,無論是“CPU+GPU”的架構(gòu)還是“CPU+MIC”的架構(gòu),異構(gòu)編程畢竟是一個老大難。微異構(gòu)架構(gòu)并不是說CPU上的程序可以直接在CPU+MIC的架構(gòu)上使用,張振宇進一步談道,“客戶需要先將應(yīng)用程序在CPU上做并行優(yōu)化,之后才可以直接移植到至強融核上,這里面的優(yōu)化技巧和方法需要學(xué)習(xí)和熟悉”。
英特爾高性能計算產(chǎn)品線全面開花
英特爾每年都會在國際超級計算機大會上發(fā)布相應(yīng)的新品,去年發(fā)布了5100P,今年又發(fā)布了五款新的至強融核產(chǎn)品,包括 7100系列的7120P,7120X,31系列的3120P和3120A,還有5100系列的5120D。其中,7100最高的性能可以達到1.2T雙精度浮點計算。3100是最佳的性價比,5100是最通用的產(chǎn)品形態(tài),5120D是小型封裝,可以在OEM刀片系統(tǒng)里使用。
除了芯片之外,英特爾在HPC的各個領(lǐng)域也都陸續(xù)推出了相應(yīng)的產(chǎn)品,目前已經(jīng)形成了一個非常強大的產(chǎn)品線,包括Xeon Phi協(xié)處理器,英特爾Truescale和以太網(wǎng)的設(shè)備,同時還有正在研發(fā)的下一代互聯(lián)產(chǎn)品。此外,軟件方面,除了一些消息庫、并行軟件之外,英特爾今年還發(fā)布了一款新的并行文件系統(tǒng)——英特爾企業(yè)版Lustre。
Lustre最初來源于卡耐基梅隆大學(xué)的的研究員Peter Braam在NASD項目研究工作,其優(yōu)勢在于其可擴展性和可靠性,同時可滿足大規(guī)模并行集群存儲系統(tǒng)上的I/O需求。Intel去年收購了超級計算機集群解決方案文件系統(tǒng)Lustre的母公司W(wǎng)hamcloud。
“之前,在商業(yè)計算領(lǐng)域很少采用Lustre,因為它是一個開源軟件,在技術(shù)支持和體系架構(gòu)方面都不是很好,英特爾推出的企業(yè)版Lustre針對英特爾平臺進行優(yōu)化和打包,同時為客戶提供定制化的服務(wù),從而保證商業(yè)計算的可靠性和性能要求”,張振宇這樣談道。
Knights Landing針對應(yīng)用特征設(shè)計的兩種“造型”
據(jù)介紹,下一代英特爾至強融核處理器Knights Landing將采用14納米制程技術(shù),非常值得一提的是,Knights Landing有兩種設(shè)計選擇,既可以插在CPU插槽上,也可以放在PCIe插槽上。這樣設(shè)計的初衷就是充分考慮應(yīng)用特征,張振宇表示,“有一小部分應(yīng)用是百分之百高度并行的,這類應(yīng)用可以很好地在眾核上運行,不需CPU做串行計算再把計算結(jié)果交過來,不需要協(xié)調(diào)的工作,針對這一類應(yīng)用,可以把Knights Landing直接做成處理器,把Knights Landing當(dāng)Cluster來跑這類應(yīng)用,性能會非常好”。