從TOP100說(shuō)開(kāi)去:中國(guó)超算在追趕中思考
計(jì)算機(jī)世界報(bào)記者 湯銘 發(fā)表于:12年11月06日 14:49 [轉(zhuǎn)載] 計(jì)算機(jī)世界
2012年10月28日~10月31日,全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)在湖南張家界召開(kāi)。從2005年開(kāi)始,這已經(jīng)是舉辦的第七屆年會(huì)了。在參會(huì)的代表看來(lái),高性能計(jì)算學(xué)術(shù)年會(huì)和其他的學(xué)術(shù)年會(huì)不太一樣。
中國(guó)計(jì)算機(jī)學(xué)會(huì)理事長(zhǎng)、清華大學(xué)鄭煒民教授表示,高性能計(jì)算學(xué)術(shù)年會(huì)之所以和其他一些學(xué)術(shù)會(huì)議相比顯得很特別,就是因?yàn)樗幌袷瞧渌臅?huì)議,只是吸引了院校、研究機(jī)構(gòu)的人員參加,而是吸引了產(chǎn)學(xué)研用,甚至包括業(yè)內(nèi)主流的商業(yè)廠商等各方面的代表來(lái)參加會(huì)議。
阿凡達(dá)和超級(jí)水稻
為什么高性能計(jì)算學(xué)術(shù)年會(huì)能吸引、這么多方面的人來(lái)參加?背后原因其實(shí)很簡(jiǎn)單,高新能計(jì)算已經(jīng)走入我們的生活。
國(guó)際高性能計(jì)算咨詢委員會(huì)主席Gilad Shainer在2012高性能計(jì)算咨詢委員會(huì)中國(guó)研討會(huì)上就表示,高性能計(jì)算已經(jīng)和我們的生活緊密相關(guān),不管是國(guó)防、航天這樣的國(guó)家層面的事務(wù),還是天氣預(yù)報(bào)、藥品研制這樣和平時(shí)生活息息相關(guān)的事情,高性能計(jì)算都在其中扮演了重要的角色。
即便對(duì)于本次學(xué)術(shù)會(huì)議舉辦地張家界來(lái)說(shuō),它也和高性能計(jì)算有著千絲萬(wàn)縷的關(guān)系。張家界誕生了中國(guó)第一個(gè)國(guó)家級(jí)森林公園,公園秀美壯麗的景色吸引了來(lái)自五湖四海的游客。其中就有一位很特別的游客,知名導(dǎo)演詹姆斯·卡梅隆?仿∪蘸髮(dǎo)演的著名電影《阿凡達(dá)》中,有一個(gè)重要場(chǎng)景哈利路亞山的原型就是張家界森林公園中的知名景點(diǎn)“南天一柱”!栋⒎策_(dá)》憑借驚艷的影視特效,一舉成為當(dāng)年最賣座的影片。而影片中的特效效果,就是由新西蘭Weta Digital公司的具有近6000個(gè)處理器核的高性能計(jì)算機(jī)來(lái)完成制作的。
張家界所在的湖南省,一直是中國(guó)重要的魚(yú)米之鄉(xiāng),同時(shí)也是中國(guó)超級(jí)水稻的研究中心。國(guó)家雜交水稻工程技術(shù)中心的研究人員將基因組數(shù)據(jù)庫(kù)和高性能計(jì)算相結(jié)合,尋找高產(chǎn)穩(wěn)產(chǎn)的超級(jí)水稻。2012年3月13日,國(guó)家雜交水稻工程技術(shù)中心還與華大基因簽署了長(zhǎng)期戰(zhàn)略合作的框架協(xié)議書(shū)。而后者自1999年成立以來(lái),一直在利用高性能計(jì)算技術(shù)進(jìn)行大規(guī);蚪M數(shù)據(jù)的處理。2012年 6月18日,在德國(guó)漢堡舉行的國(guó)際超級(jí)計(jì)算大會(huì)上,華大基因繼2011年后,第二次獲得“高性能計(jì)算創(chuàng)新優(yōu)秀獎(jiǎng)”。
從動(dòng)漫渲染到生物基因排序,正是這些不同類型的高性能計(jì)算應(yīng)用的不斷豐富,大大促進(jìn)了中國(guó)高性能計(jì)算的發(fā)展。10月29日,中國(guó)計(jì)算機(jī)學(xué)會(huì)高性能計(jì)算專委會(huì)秘書(shū)長(zhǎng)張?jiān)迫芯繂T在發(fā)布中國(guó)高性能計(jì)算Top100榜單時(shí)也提到,當(dāng)前高性能計(jì)算應(yīng)用呈現(xiàn)百花齊放局面;ヂ(lián)網(wǎng)服務(wù)、政府部門、工程、超算中心、云計(jì)算、電信、能源 、科學(xué)計(jì)算、游戲、電力、大氣氣象、服務(wù)提供商、視頻計(jì)算、教育、生物信息等十五個(gè)領(lǐng)域是中國(guó)主要的高性能計(jì)算應(yīng)用領(lǐng)域。
應(yīng)對(duì)百億億次的挑戰(zhàn)
各種應(yīng)用不斷涌現(xiàn)的直接結(jié)果,就是帶動(dòng)了中國(guó)高性能計(jì)算設(shè)備的制造能力不斷提升。從2009年天河一號(hào)突破千萬(wàn)億次,到2010年天河一號(hào)A登頂HPCTop500,再到2011年全國(guó)產(chǎn)的神威藍(lán)光超級(jí)計(jì)算機(jī)的出現(xiàn),一系列達(dá)到國(guó)際先進(jìn)水平的國(guó)產(chǎn)超級(jí)計(jì)算機(jī)相繼出現(xiàn)。
其實(shí)在高性能計(jì)算領(lǐng)域,大家對(duì)于計(jì)算能力的追求一直是“沒(méi)有最強(qiáng),只有更強(qiáng)”。一系列超級(jí)計(jì)算機(jī)誕生,讓整個(gè)行業(yè)把目標(biāo)又放在了下一個(gè)充滿挑戰(zhàn)的、計(jì)算能力達(dá)到百億億次(EFlops)的超級(jí)計(jì)算機(jī)上。
張?jiān)迫芯繂T認(rèn)為,到2013年中國(guó)會(huì)有計(jì)算峰值達(dá)到10Pflops的系統(tǒng)出現(xiàn),達(dá)到十億億次每秒(100Pflops)的超級(jí)計(jì)算機(jī)將在2014年到2015年間出現(xiàn)。
國(guó)防科技大學(xué)校長(zhǎng)楊學(xué)軍院士認(rèn)為,當(dāng)前核物理、材料化學(xué)、生命科學(xué)等方面的大規(guī)模應(yīng)用需求已經(jīng)帶來(lái)了對(duì)百億億次計(jì)算能力的超強(qiáng)需要。但是在需求的背后,還存在著多方面的挑戰(zhàn)。“從并行計(jì)算機(jī)體系結(jié)構(gòu)、微處理器體系結(jié)構(gòu)、存儲(chǔ)體系結(jié)構(gòu)、互聯(lián)技術(shù)到并行軟件,需要多層次多學(xué)科的共同發(fā)展,來(lái)實(shí)現(xiàn)百億億次的目標(biāo)。”楊學(xué)軍說(shuō),“另外值得思考的就是,硬件技術(shù)的發(fā)展在解決可靠性、能耗等方面的難點(diǎn)的同時(shí),又會(huì)帶來(lái)編程方面的壓力,特別是GPGPU異構(gòu)系統(tǒng)對(duì)于編程的壓力巨大。”
除了楊學(xué)軍院士所提到的這些阻擋百億億次超級(jí)計(jì)算機(jī)所成為現(xiàn)實(shí)的門檻外,目前業(yè)內(nèi)普遍認(rèn)為能耗也是阻礙著其成為現(xiàn)實(shí)的一個(gè)巨大難點(diǎn)。華中科技大學(xué)金海教授也表示,能耗和超大規(guī)模核心的組織與管理是實(shí)現(xiàn)百億億次計(jì)算的兩大障礙。
Gilad Shainer認(rèn)為,在當(dāng)前的技術(shù)條件下實(shí)現(xiàn)百億億次不是沒(méi)有可能,只是以目前技術(shù)搭建起來(lái)的系統(tǒng)可能需要驚人的投入,其對(duì)電力的消耗也是現(xiàn)在所不能接受的。有專家測(cè)算過(guò),如果以現(xiàn)有水平構(gòu)建百億億次的超計(jì)算機(jī),其能耗將會(huì)是三峽水庫(kù)發(fā)電量的三分之一。“因此,需要圍繞整個(gè)系統(tǒng)的多方面共同努力才能,在一種優(yōu)化的情況下實(shí)現(xiàn)百億億次的目標(biāo)。”Gilad Shainer說(shuō)。
Gilad Shainer的觀點(diǎn),也得到了其他一些業(yè)內(nèi)專家的支持。英特爾高級(jí)院士Steve Pawlowski在高性能計(jì)算學(xué)術(shù)年會(huì)的主題演講中,也特別強(qiáng)調(diào)了能耗對(duì)于實(shí)現(xiàn)百億億次高性能計(jì)算所帶來(lái)的挑戰(zhàn)。他指出:“需要高效的處理器、高效的內(nèi)存、高效的網(wǎng)絡(luò)、高效的并行程序以及可靠的系統(tǒng)來(lái)共同實(shí)現(xiàn)百億億次的目標(biāo)。”
呼喚超算國(guó)家計(jì)劃
記者從2008年就開(kāi)始參加高性能計(jì)算學(xué)術(shù)年會(huì),已經(jīng)連續(xù)參加了五屆。每一屆會(huì)議的規(guī)模都在不斷擴(kuò)大,這從一個(gè)側(cè)面反映出當(dāng)前高性能計(jì)算領(lǐng)域的發(fā)展正在不斷加速。記者觀察到,每年的大會(huì)上關(guān)于硬件體系架構(gòu)的發(fā)言卻是重頭戲。但是正如鄭煒民老師所說(shuō)的那樣,要想推進(jìn)高性能計(jì)算應(yīng)用的不斷發(fā)展,不但要有高新能的設(shè)備,還需要產(chǎn)、學(xué)、研、用各方面的力量來(lái)共同推動(dòng)。所以,在本次學(xué)術(shù)年會(huì)上,除了大量技術(shù)性發(fā)言外,記者特別關(guān)注了來(lái)自超算用戶的主題發(fā)言,并專門參加了超算中心分論壇。
目前,天津、濟(jì)南、長(zhǎng)沙、深圳等地的國(guó)家級(jí)的超算中心已經(jīng)相繼建成,并投入使用。國(guó)家超級(jí)計(jì)算濟(jì)南中心陳德訓(xùn)副主任告訴記者,自從2011年10月濟(jì)南中心的神威藍(lán)光超級(jí)計(jì)算機(jī)調(diào)試完成后,整個(gè)系統(tǒng)就沒(méi)有停過(guò),一直處在不間斷地工作狀態(tài)中。國(guó)家超級(jí)計(jì)算深圳中心黃強(qiáng)副主任也表示,從成立開(kāi)始,圍繞深圳當(dāng)?shù)禺a(chǎn)業(yè)的特點(diǎn),深圳中心在高能物理、生物技術(shù)、地球科學(xué)、動(dòng)漫、工業(yè)仿真等方面進(jìn)行了大量的工作。
在各大超算中心緊鑼密鼓地開(kāi)展各項(xiàng)工作的同時(shí),在本次學(xué)術(shù)年會(huì)上,記者也聽(tīng)到了關(guān)于超算發(fā)展的另外一種聲音,那就是“超算中心的發(fā)展也需要改革了”。
為什么會(huì)有這樣的聲音,記者采訪后發(fā)現(xiàn)其背后的原因存在著復(fù)雜的因素。
一位超算中心的負(fù)責(zé)人向記者表示,現(xiàn)在的情況來(lái)看,超算中心一般只能得到國(guó)家最初幾年的資金投入,之后就需要超算中心自己尋找一條自我造血、自我維持的道路。但是在這位負(fù)責(zé)人看來(lái),“自我尋找造血”對(duì)于超算中心是不現(xiàn)實(shí)的。
上海超算中心是我國(guó)最早建設(shè)的超級(jí)計(jì)算中心之一,中心李根國(guó)副主任也向記者表示,上海超算正在進(jìn)入一個(gè)需要改革的關(guān)鍵點(diǎn)了。“當(dāng)前中心運(yùn)維壓力越來(lái)越大,上海超算曾經(jīng)算過(guò)一筆賬,如果未來(lái)實(shí)現(xiàn)100PLops的計(jì)算規(guī)模,相應(yīng)的運(yùn)維費(fèi)用可能每年要達(dá)到1.8億元人民幣,但是這個(gè)數(shù)字是上級(jí)主管單位根本無(wú)法接受的。所以,我們只能將未來(lái)的發(fā)展規(guī)模定在5PLops的規(guī)模,主要圍繞上海當(dāng)?shù)氐钠髽I(yè)和高校提供服務(wù)。”
在運(yùn)維方面,李根國(guó)透露,上海超算也在計(jì)劃進(jìn)行一些市場(chǎng)化的嘗試,但是前提仍舊是公益性的服務(wù)占到中心工作的絕大多數(shù)。“目前上海超算中心80%的資源用在了科學(xué)研究,未來(lái)也不會(huì)少于70%,未來(lái)也會(huì)向科學(xué)計(jì)算的用戶適當(dāng)收費(fèi),剩下資源則投入到市場(chǎng)化的應(yīng)用中去。”
除了市場(chǎng)化的考慮,對(duì)于尋找自我造血的發(fā)展模式,李根國(guó)表示上海超算還在摸索與企業(yè)和高校打造一種全新的發(fā)展模式。一方面,上海超算中心計(jì)劃與一些企業(yè)打造一種共建的模式,特別是在一些商業(yè)應(yīng)用軟件方面,雙方共享、共建;另一方面,就是與高校合作,與高校內(nèi)小規(guī)模的超算平臺(tái)互動(dòng),從這個(gè)意義上實(shí)現(xiàn)資源整合。“上海超算中心的‘大’設(shè)備就像一個(gè)資源池,高校的這部分用戶在資源不夠而又無(wú)力擴(kuò)展的時(shí)候,可以從這個(gè)池中獲得資源上的支持,以保證這些高校計(jì)算平臺(tái)的可持續(xù)發(fā)展。”李根國(guó)說(shuō)。
在陳德訓(xùn)看來(lái),要讓超算中心實(shí)現(xiàn)持續(xù)性發(fā)展,必須得到國(guó)家更高層面的戰(zhàn)略支持。所以在陳德訓(xùn)的設(shè)想中,現(xiàn)在各地的超算中心有必要組成一個(gè)“超算聯(lián)盟”這樣的機(jī)構(gòu),不再是各個(gè)單位單打獨(dú)斗,而是在一起形成合力,為中國(guó)高性能計(jì)算發(fā)展做出自己的貢獻(xiàn)。W
專家聲音
超算中心所做的很多研究都是和國(guó)家的戰(zhàn)略發(fā)展息息相關(guān)的,所以有必要像發(fā)改委或自然基金委這樣的國(guó)家機(jī)構(gòu)制定相應(yīng)的發(fā)展戰(zhàn)略。
——中國(guó)計(jì)算機(jī)學(xué)會(huì)高性能計(jì)算機(jī)專委會(huì)主任 孫凝暉
曙光舉辦自己的超算大會(huì),與高校合作開(kāi)展并行編程的課程,其目的就是想打造一個(gè)完整的高性能計(jì)算生態(tài)環(huán)境。只有這個(gè)生態(tài)環(huán)境的健康發(fā)展,才能促進(jìn)整個(gè)高性能計(jì)算行業(yè)的健康發(fā)展。
——曙光公司副總裁、研發(fā)中心總經(jīng)理邵宗有
在一個(gè)高性能計(jì)算系統(tǒng)搭建好后,如何提高整機(jī)的開(kāi)機(jī)率、提高整機(jī)的利用率尤為關(guān)鍵,其中很重要的一個(gè)因素是提高運(yùn)維能力,在運(yùn)維做好之后再要做的就是針對(duì)應(yīng)用特性的的軟件優(yōu)化工作。
——并行科技 CTO 陳健
目前國(guó)內(nèi)在高性能計(jì)算領(lǐng)域存在著一種浮躁的情緒,以上海超算中心為例,很多用戶都不會(huì)靜下心來(lái)好好地在應(yīng)用程序開(kāi)發(fā)上多做一些功課。國(guó)外的很多超算中心的應(yīng)用項(xiàng)目都是可以調(diào)度上萬(wàn)個(gè)CPU核的;在國(guó)內(nèi),別說(shuō)調(diào)度上萬(wàn)個(gè),就是調(diào)度上千個(gè)CPU核心的應(yīng)用都是鳳毛麟角。要解決這樣的局面,必須在人才培養(yǎng)上下更大的功夫。
——上海超算中心副主任 李根國(guó)
數(shù)說(shuō)榜單
上榜系統(tǒng)總Linpack性能達(dá)到16PFlops;
上榜系統(tǒng)平均性能突破160TFlops,但是與國(guó)際水平差距進(jìn)一步擴(kuò)大;
前10名里4臺(tái)是CPU+GPU體系架構(gòu),而且全部來(lái)自前五名;
榜單中中國(guó)制造的機(jī)器數(shù)量占裝機(jī)數(shù)量的56%,比2011年的51%有小幅上升;
曙光在制造商機(jī)器數(shù)量份額中位居首位,達(dá)到了36%的比例。上榜高性能計(jì)算機(jī)制造商下降到8家,市場(chǎng)份額進(jìn)一步集中;
榜單中,有35%的系統(tǒng)是用于互聯(lián)網(wǎng)服務(wù)。綜合來(lái)看,互聯(lián)網(wǎng)服務(wù)、超算中心、工程、政府部門、云計(jì)算等是高性能計(jì)算主要用戶;ヂ(lián)網(wǎng)服務(wù)、云計(jì)算和工程計(jì)算方面的應(yīng)用增長(zhǎng)強(qiáng)勁;
上榜系統(tǒng)的性能門檻繼續(xù)大幅提升,達(dá)到49.5TFlops,是2011年的2.24倍。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.