筆者初次來計算所是1998年,參加一個關(guān)于PC維護方面的培訓;2002年曾過來組裝過一臺雙路Intel Xeon 2.4GHz CPU、SuperMicro主板+勤誠機箱的服務器,那次在樓里還路過了倪光南院士的辦公室。如今到這里采訪,原來的大門和招牌已經(jīng)被現(xiàn)在高樓前的地標所替代。
中國科學院計算技術(shù)研究所——英特爾聯(lián)合實驗室揭牌儀式昨天在京舉辦。旨在通過進一步擴大科技開放合作,提高我國科技發(fā)展國際化水平,在更高起點上推進自主創(chuàng)新,中國科學院計算技術(shù)研究所與英特爾正式簽署研究與發(fā)展合作協(xié)議,通過整合雙方資源優(yōu)勢,共同推動中國科學研究技術(shù)發(fā)展。中國科學院計算技術(shù)研究所所長孫凝暉博士與英特爾資深院士、數(shù)據(jù)中心及互聯(lián)系統(tǒng)事業(yè)部首席技術(shù)官、英特爾架構(gòu)事業(yè)部和數(shù)據(jù)中心及互聯(lián)系統(tǒng)事業(yè)部前瞻研究部總經(jīng)理 Stephen S. Pawlowski 先生參加了本次揭牌儀式。
本次簽署的研究與發(fā)展合作協(xié)議將會以英特爾與中國科學院計算技術(shù)研究所共同建立的聯(lián)合實驗室為平臺,憑借英特爾對于微處理器、芯片組、軟件和計算與互連產(chǎn)品的設計、制造與分發(fā)等優(yōu)勢,與中國科學院計算技術(shù)研究所在信息科技領(lǐng)域的研發(fā)資源整合,展開針對即將面世的英特爾集成眾核架構(gòu)(Intel MIC )平臺的領(lǐng)域編程與優(yōu)化、應用程序調(diào)優(yōu)以及開發(fā)數(shù)據(jù)中心評估基準,更加深入地探索高效的數(shù)據(jù)中心服務器體系結(jié)構(gòu),開發(fā)相應的硬件和軟件系統(tǒng),特別是基于英特爾至強處理器與英特爾集成眾核架構(gòu)的混合架構(gòu)系統(tǒng)。同時合作的研究方向還有通過基于英特爾至強處理器平臺針對基因測序的可重構(gòu)計算系統(tǒng)等。
大規(guī)模并行計算將不局限于HPC
ChinaByte比特網(wǎng):“我想問一下孫所長,您覺得使用Intel MIC(Xeon Phi)異構(gòu)計算的產(chǎn)品,與曙光6000這樣的CPU+GPU異構(gòu)HPC相比有哪些優(yōu)勢嗎?”
孫凝暉:“我們共同認為異構(gòu)計算,無論是Xeon級的超級計算機,還是數(shù)據(jù)中心級的超級計算機都是同樣的發(fā)展方式。通用的結(jié)構(gòu)在現(xiàn)在的能耗下追求效率,不僅僅是追求速度,它不能解決所有的問題。或者在極端負載下不是高效率,通用平臺只有在負載不那么極端的情況下做的挺好。我們認為這樣的異構(gòu)平臺應該是高性能計算的技術(shù),也能夠用到量大面廣的企業(yè)級計算。如果某一項主流的技術(shù)只用在高性能計算里是沒有生命力和市場的,這是我們共同的看法。
我們不去做特定于高性能計算領(lǐng)域的很狹小市場的技術(shù),這和計算所一貫追求的目標,有三個關(guān)鍵詞代表我們的技術(shù),算的快、應用廣、易產(chǎn)業(yè)化。我們研究的技術(shù),開發(fā)的技術(shù),一定要在這三個維度都能夠有所幫助,要算得快或者算得多,數(shù)據(jù)中心應用是算得多,第二是應用廣,不能只支持十個算法、兩個用戶,那這個是很難有前途的,第三要易于產(chǎn)業(yè)化,有些技術(shù)雖然很好,很多好技術(shù)但是最后死掉了,因為不易產(chǎn)業(yè)化。所以下一代的高性能計算機,十億次、百億次的一定是這樣的異構(gòu)平臺。
針對MIC我們要做三部分的工作:第一、算法和編譯器的研究,對性能進行優(yōu)化;第二、中國當前的數(shù)據(jù)中心用戶負載特征已經(jīng)比較明顯,我們想從中抽象出一些作為BenchMark,就像SPEC CPU2000(2006)和LINPACK是測試計算性能那樣,現(xiàn)在我們?nèi)狈τ跀?shù)據(jù)中心的基準測試;第三、縮短眾核用戶的開發(fā)周期。”
孫凝暉博士在揭牌儀式中講到:“這次與計算創(chuàng)新領(lǐng)域的全球領(lǐng)先廠商英特爾公司合作,將會結(jié)合英特爾公司在計算架構(gòu)和半導體技術(shù)方面的優(yōu)勢,并緊密結(jié)合中國國內(nèi)科研對高性能計算的需求,充分發(fā)揮各自的技術(shù)優(yōu)勢,為關(guān)鍵領(lǐng)域科學研究實現(xiàn)原創(chuàng)性重大突破提供創(chuàng)新引擎。”
TOP500僅是一項比賽,計算定制通用十年輪回
ChinaByte比特網(wǎng):“目前國際上的HPC TOP500,和國內(nèi)排名前幾位的系統(tǒng)中,都有以RISC架構(gòu)CPU作為主要計算單元,并包含部分自主知識產(chǎn)權(quán)(核心技術(shù))的系統(tǒng)入選。而曙光近些年研究和生產(chǎn)的超級計算機都是x86平臺。請問您站在計算所的角度,怎樣看待RISC架構(gòu)在編程和應用性方面的不同,以及自主知識產(chǎn)權(quán)對本國的意義?”
注:這個問題,我其實是想得到孫所長對江南所研發(fā)的神威藍光,以及富士通“京”這些產(chǎn)品的看法。
孫凝暉:“自主知識產(chǎn)權(quán)首先肯定非常重要,沒有自主技術(shù)根本沒有機會做領(lǐng)先的事情,這是毫無疑問的。這并不是中國獨有的問題,世界上任何一個領(lǐng)導型的國家或者領(lǐng)導型的企業(yè)一定要有自主知識產(chǎn)權(quán),所謂自主的核心技術(shù)、自己的核心部件,不然就是二流角色,是跟隨者角色,是價值鏈、產(chǎn)業(yè)鏈的末端。這和某一個技術(shù)選擇沒有關(guān)系,是兩個維度的事情。我們中國過去在這方面追求的太少了,我們能夠拿出來參與國際競爭的東西太少了,所以我們要更多地在這方面投入力量。
至于RISC這個問題,談不上誰好誰壞。我們以前可能是站在比較低的位置上看世界,覺得這個很奇怪,總是用階級斗爭的想法。其實這個世界是多樣性的,中國現(xiàn)在應該更加自信,我們應該站在國際舞臺上,站在更高的地方來俯視來看,這樣就一點也不奇怪了。不同的人、不同的用戶需求不同,都可以Enjoy在他們喜歡的東西里面。
你看TOP500僅僅是一項比賽,僅僅是奧運會的一個110米欄。我們無非是劉翔贏了一次金牌,但是可能下次摔倒。里面有一些機器贏得了奧運會的金牌,但并不代表它們有市場。當然除了這些滿足企業(yè)廣大用戶的機器,還有和國家安全有關(guān)的應用、有關(guān)的需求,美國有、中國有,那些應用并不需要考慮市場,所有世界大國都需要這樣的技術(shù),都在做類似的事情,可能TOP500里面有幾個高端機器是面向那個目標的,也是非常有價值的,應該全力以赴做的,但是不代表有市場,我們更多影響老百姓普通生活的那些東西也是非常重要的,iPhone難嗎?你會做嗎?它也是非常要緊的事情。所以這是不同維度的事情,都非常重要。”
還有記者朋友提問:“高性能計算應用領(lǐng)域根據(jù)行業(yè)不同軟件的差異化、定制化比較明顯,請問孫所長,以后有沒有專門針對于不同行業(yè)進行軟硬件系統(tǒng)的研究和優(yōu)化,或者說現(xiàn)在有沒有針對于行業(yè)應用的研究成果?”
孫凝暉:“現(xiàn)在有一個專業(yè)詞“Co-Design(定制設計)”,當計算機技術(shù)或者處理器技術(shù)發(fā)展很順利的時候不需要,就是摩爾定律很順利時我們只要等著就可以了,為什么今天需要(Co-Design)呢?今天這些技術(shù),尤其是半導體工藝的限制,所以我們把結(jié)構(gòu)弄的更加復雜,這其實是不可持續(xù)的??赡苓@十年沒有辦法,也許現(xiàn)在都在做(Co-Design)了,看未來十年二十年后,肯定另外一個進步會減少我們的工作量,讓用戶更容易達到他的性能?,F(xiàn)在沒有辦法,所以看到這么多的多核、眾核結(jié)構(gòu)。
其實用一個復雜的、并且是多樣的結(jié)構(gòu)來面對這些新需求、新應用,這其實是很糟糕的一個方式,但是這一段方式我們只有這樣做。我們看計算技術(shù)發(fā)展歷史都是這樣的,現(xiàn)在處在計算機是發(fā)展的低谷,我們看英特爾的利潤發(fā)展曲線應該是這樣的。在這樣的低谷上,中科院過程所有一臺機器就是Co-Design的機器,中科院最早和曙光合作,根據(jù)過程計算應用提供了非常適合它的硬件架構(gòu)、軟件架構(gòu)來支持。就舉科學院的例子,高能物理所,大家知道的核聚變點火工程、高能物理的對撞實驗,它的平臺也是Co-Design定制化的。
從去年開始我們找美國、日本這些領(lǐng)域的技術(shù)專家,都在研究算法如何,現(xiàn)在因為結(jié)構(gòu)復雜,算法變得更復雜了,以及算法怎么更好地適配現(xiàn)在的硬件?,F(xiàn)在好幾個橫向擴展(Scale-out)很復雜,片內(nèi)并行也很復雜,MIC是片內(nèi)并行維度的復雜,我們有更多的Cache的層次,里面更加復雜,還有片上的網(wǎng)絡,數(shù)據(jù)移動變得很重、很貴、很耗能,這又是一維復雜性。你說的問題是這十年來,學術(shù)界、企業(yè)界應該努力的方向。
我個人認為ExaScale級的計算一定不是這種我們現(xiàn)在看的曙光4000、曙光5000這樣通用的平臺。曙光6000用了異構(gòu)計算,不能說特別通用了,因為很多應用上面用不到(GPU)加速就不好;但另外一些應用就不是這樣的應用架構(gòu),你做一個4000、5000那樣通用的,所有的應用都能利用得很好。在ExaScale級的不現(xiàn)實,ExaScale級的系統(tǒng)一定是Co-Design的。當我們的器件發(fā)生巨大的變化,我肯定不如Pawlowski研究得更深刻,在微電子、半導體技術(shù)帶來巨大改變以后,我個人預測十年后可能會重新走向通用的曲線上。”
筆者猜測,到那時可能就是今天的CPU和協(xié)處理器(包括GPU和Intel MIC)進一步實現(xiàn)融合的時候。當然應該也包含軟件對異構(gòu)計算的普遍支持和優(yōu)化。