清華大學(xué)陳文光教授同時(shí)還負(fù)責(zé)863高性能計(jì)算評(píng)測(cè)

陳文光表示,清華大學(xué)的高性能計(jì)算中心現(xiàn)在已經(jīng)有了一個(gè)較為清楚的測(cè)試設(shè)計(jì)思路:讓供應(yīng)商提供一個(gè)節(jié)點(diǎn)用以測(cè)試,該測(cè)試則僅針對(duì)處理和內(nèi)存速度,網(wǎng)絡(luò)和存儲(chǔ)等指標(biāo)則由其他方法進(jìn)行輔助確定。同時(shí),該測(cè)試必須是面向應(yīng)用的。

他表示,清華大學(xué)目前采用的測(cè)試方法至少可以在處理器和內(nèi)存的角度給出一個(gè)指導(dǎo)性的意見(jiàn),得到適合的處理器和內(nèi)存。此外,網(wǎng)絡(luò)目前一般選取40Gbps的Infiniband,但全連接還是部分連接,則要看預(yù)算和應(yīng)用模式來(lái)確定。

第二個(gè)難點(diǎn)則是選取哪些應(yīng)用程序來(lái)進(jìn)行測(cè)試,對(duì)此,陳文光認(rèn)為5-10個(gè)應(yīng)用程序用來(lái)測(cè)試即可,“從邏輯上來(lái)說(shuō),每個(gè)學(xué)校的潛在用戶可能有幾十上百程序,選擇最重要的用戶進(jìn)行測(cè)試,如清華就是氣象預(yù)報(bào)和氣象圖像,應(yīng)用個(gè)數(shù)不能太多,評(píng)測(cè)本身是有開(kāi)銷的,從經(jīng)驗(yàn)來(lái)說(shuō),5-10個(gè)應(yīng)用就能夠覆蓋學(xué)校應(yīng)用測(cè)試。測(cè)試的規(guī)模要縮小到一個(gè)節(jié)點(diǎn)上,讓應(yīng)用在一個(gè)節(jié)點(diǎn)的內(nèi)存上能夠跑起來(lái)即可。”——陳文光的測(cè)試僅限于一個(gè)節(jié)點(diǎn),而每個(gè)程序的執(zhí)行時(shí)間大致在1000秒左右。

第三個(gè)難點(diǎn)是如何把評(píng)測(cè)結(jié)果歸結(jié)為性能指標(biāo),陳文光認(rèn)為這并不困難,清華大學(xué)采用的是“相對(duì)性能法”:“把結(jié)果歸結(jié)為指標(biāo)其實(shí)并不難,將測(cè)試程序在一個(gè)參考系統(tǒng)上的執(zhí)行時(shí)間作為參考時(shí)間,使用SPECCPU的標(biāo)準(zhǔn)方法測(cè)試,將多個(gè)測(cè)試結(jié)果進(jìn)行幾何平均即可。”

不過(guò),目前的測(cè)試方法在網(wǎng)絡(luò)連接和IO存儲(chǔ)方面有些薄弱,,陳文光認(rèn)為,測(cè)試單個(gè)節(jié)點(diǎn),可以對(duì)處理器和內(nèi)存選型給予較好的指導(dǎo),但是對(duì)網(wǎng)絡(luò)的選取,已經(jīng)有一些國(guó)外的技術(shù)可以預(yù)測(cè)并行程序的性能,但現(xiàn)階段來(lái)看,還不是普及化的評(píng)測(cè)方法。

實(shí)際案例:HPC測(cè)試是如何完成的

為了能更好的說(shuō)明評(píng)測(cè)方法,陳文光以清華大學(xué)的一套實(shí)際HPC系統(tǒng)的購(gòu)買前測(cè)試過(guò)程,為與會(huì)聽(tīng)眾講解了更詳細(xì)的HPL測(cè)試方法。

“像清華探索4號(hào)HPC測(cè)試,我們是在單節(jié)點(diǎn)上做的Linpack,讓廠商各自調(diào)優(yōu),并規(guī)定整機(jī)HPL性能設(shè)定值必須達(dá)到的性能100TFlops,同時(shí)要達(dá)到一定的效率,尤其是并行效率。”陳文光表示,在測(cè)試過(guò)程中,他們選取了清華大學(xué)HPC應(yīng)用領(lǐng)域的最重要的五個(gè)程序:GEOSCHEM、SPIDER、GAMIL、VASP、MPI-DVDAC——這些都是在環(huán)境、生物、氣候、原子模擬等方面最流行的程序,同時(shí)也是清華大學(xué)最常用的軟件。

此外,在應(yīng)用測(cè)試的優(yōu)化工作方面,陳文光表示,雖然不允許FDO方式進(jìn)行優(yōu)化,但是“廠商的優(yōu)化能力體現(xiàn)在其技術(shù)實(shí)力和服務(wù)能力上。”如果廠商的優(yōu)化、服務(wù)能力不過(guò)關(guān),陳文光說(shuō),“HPC系統(tǒng)少不了麻煩原廠商,到那時(shí)候如果不行,就麻煩了。”

在陳文光介紹的例子中,共有六套系統(tǒng)參與到測(cè)試中來(lái),編譯環(huán)境為英特爾編譯器環(huán)境,在得出六套系統(tǒng)的測(cè)試結(jié)果之后,評(píng)測(cè)中心以測(cè)試的第一套系統(tǒng)作為基礎(chǔ),做其它五臺(tái)系統(tǒng)的幾何平均,從而得出相對(duì)公正的得分,其中綜合性能較好的節(jié)點(diǎn),將成為采購(gòu)的首選。

863高性能計(jì)算評(píng)測(cè)中心對(duì)英特爾的全線服務(wù)器處理器產(chǎn)品進(jìn)行了評(píng)測(cè)

值得注意的是,陳文光談到了有關(guān)功耗測(cè)試的內(nèi)容,“采購(gòu)?fù)度?000萬(wàn),每年的電費(fèi)400萬(wàn),因此對(duì)功耗測(cè)試非常重視。”因此,清華大學(xué)同樣進(jìn)行了系統(tǒng)滿載和空載時(shí)的功耗測(cè)試,從而比較出了更加低能耗,綠色節(jié)能的節(jié)點(diǎn)。

陳文光透露,正是在這樣的評(píng)測(cè)中,清華大學(xué)選擇了英特爾的至強(qiáng)7500、至強(qiáng)5600和安騰9300產(chǎn)品線,他表示,高性能計(jì)算評(píng)測(cè)中心目前已經(jīng)能夠達(dá)到“用什么就測(cè)什么”的發(fā)展階段,但這樣的發(fā)展,與原廠商,如英特爾的支持密不可分。

接受聽(tīng)眾提問(wèn)時(shí),陳文光表示,評(píng)測(cè)中心并不考慮系統(tǒng)的配置和產(chǎn)品具體信息,提交的HPC系統(tǒng)并不要求系統(tǒng)配置一定要一摸一樣,評(píng)測(cè)中心考察的,是“如何在一個(gè)節(jié)點(diǎn)上獲得更高的性能。”

此外,陳文光也表示,指令集的向量化優(yōu)化能夠大量的提高系統(tǒng)的性能。

分享到

cuihao

相關(guān)推薦