四川物探戴爾HPCC系統(tǒng)拓?fù)鋱D


 


 穩(wěn)定運(yùn)行彰顯優(yōu)異性能
  
    方案確定后,為確保本項(xiàng)目在實(shí)施過(guò)程中萬(wàn)無(wú)一失,戴爾為此成立了專(zhuān)門(mén)的項(xiàng)目組織機(jī)構(gòu),制訂了覆蓋產(chǎn)品出廠驗(yàn)收、發(fā)貨、到貨安裝、驗(yàn)收、項(xiàng)目交接、售后服務(wù)等全部環(huán)節(jié)的詳盡實(shí)施方案,并派出6個(gè)小組分別負(fù)責(zé)領(lǐng)導(dǎo)、調(diào)度、實(shí)施、技術(shù)支持與維護(hù)、項(xiàng)目協(xié)調(diào)與意見(jiàn)反饋和整理文檔任務(wù)。作為在本項(xiàng)目的負(fù)責(zé)人,四川物探計(jì)算機(jī)所所長(zhǎng)曾偉先生對(duì)此印象深刻:“要成功部署這樣大規(guī)模的HPCC系統(tǒng),供應(yīng)商必須擁有資深技術(shù)背景的專(zhuān)家團(tuán)隊(duì)、豐富的實(shí)踐經(jīng)驗(yàn),以及銜接緊密的工作鏈條,戴爾在這幾方面都有較強(qiáng)的優(yōu)勢(shì),最終確保了全部安裝工作如期完成并順利通過(guò)驗(yàn)收?!?BR>  
    2005年5月中旬,這套戴爾HPCC系統(tǒng)正式投入運(yùn)行,截止目前,四川物探已有三個(gè)地震處理項(xiàng)目移師到新的計(jì)算平臺(tái)上開(kāi)展。曾偉先生介紹說(shuō),“在正式運(yùn)行之前,我們?cè)谶@套HPCC系統(tǒng)上做過(guò)Linpack測(cè)試,它的浮點(diǎn)運(yùn)算速度高達(dá)每秒七千億次(700GFLOPS)。就目前實(shí)際運(yùn)行效果而言,整個(gè)系統(tǒng)運(yùn)行非常穩(wěn)定,數(shù)據(jù)處理速度非常快,能夠支持我們開(kāi)展更多、更大的三維疊前深度偏移計(jì)算。”
  
    具體而言,這套戴爾HPCC系統(tǒng)的優(yōu)異之處主要體現(xiàn)在以下三個(gè)方面:
  
    首先,戴爾新一代服務(wù)器實(shí)現(xiàn)了系統(tǒng)整體性能的顯著提升。PE1850是基于帶有800MHz總線的英特爾至強(qiáng)處理器和英特爾E7520芯片組的新一代雙路服務(wù)器,它集成了一系列全新的和增強(qiáng)的平臺(tái)技術(shù),例如:與傳統(tǒng)的PCI相比,新的PCI Express I/O技術(shù)設(shè)計(jì)有更低的內(nèi)存和I/O延遲以及更高的帶寬,在地震資料處理這樣的計(jì)算和I/O密集型應(yīng)用環(huán)境中,能夠提供充分利用處理器功能所需的數(shù)據(jù)傳輸速度;此外,新一代DDR2-400內(nèi)存帶寬更大,延遲更短,并能夠降低40%的功耗;而超線程(HT)技術(shù)帶來(lái)的線程級(jí)并行計(jì)算能力,則有助于提高處理器利用率,從而改進(jìn)整個(gè)系統(tǒng)的響應(yīng)時(shí)間和響應(yīng)效率。這些技術(shù)賦予了它支持高性能計(jì)算所需的卓越的計(jì)算性能和響應(yīng)能力,也為四川物探進(jìn)一步開(kāi)拓地震資料處理業(yè)務(wù)奠定了堅(jiān)實(shí)的硬件基礎(chǔ)。
  
    其次,合理的網(wǎng)絡(luò)架構(gòu)為大規(guī)模數(shù)據(jù)傳輸提供恰如所需的I/O性能。針對(duì)計(jì)算網(wǎng)絡(luò)、管理網(wǎng)絡(luò)和存儲(chǔ)系統(tǒng)對(duì)于帶寬資源的不同需求,本系統(tǒng)量身定制了三種方案:
  
    應(yīng)用功能強(qiáng)大的CISCO 4507核心交換機(jī)支持計(jì)算節(jié)點(diǎn)之間、計(jì)算節(jié)點(diǎn)與I/O節(jié)點(diǎn)之間的通訊,不僅如此,在數(shù)據(jù)傳輸任務(wù)最密集的I/O節(jié)點(diǎn)中,還特別將其雙千兆網(wǎng)卡采用Teaming技術(shù)連接到該核心交換機(jī)中,這樣,一方面可利用多網(wǎng)卡同時(shí)工作來(lái)提高網(wǎng)絡(luò)速度,另一方面則實(shí)現(xiàn)了不同網(wǎng)卡之間的負(fù)載均衡(Load balancing)和網(wǎng)卡冗余(Fault tolerance),從而大大提高了系統(tǒng)整體的I/O性能。
  
    對(duì)于I/O壓力稍輕的管理網(wǎng)絡(luò),方案選擇了戴爾百兆交換機(jī)來(lái)支持通訊,既滿(mǎn)足了應(yīng)用的需要,又有效控制了IT投資支出,同時(shí)管理網(wǎng)絡(luò)獨(dú)立運(yùn)行,不占用計(jì)算網(wǎng)絡(luò)的帶寬,從而真正實(shí)現(xiàn)了帶外(Out of band)管理;而對(duì)于數(shù)據(jù)存取最為頻繁的存儲(chǔ)網(wǎng)絡(luò),方案采用了DELL|EMC DS-16B2光纖交換機(jī)來(lái)連接I/O節(jié)點(diǎn)與后臺(tái)存儲(chǔ),2GB的全光纖通道為海量地震資料的輸入輸出提供了充裕的帶寬資源。
  
    第三,海量存儲(chǔ)資源系統(tǒng)得到最充分的利用。本項(xiàng)目中,擁有30TB存儲(chǔ)空間的DELL|EMC CX700身兼二職:一方面支持本套HPCC中的數(shù)據(jù)存儲(chǔ),另一方面,還將為四川物探已有的4套較小規(guī)模的HPCC系統(tǒng)提供重要數(shù)據(jù)的備份服務(wù),從而進(jìn)一步加強(qiáng)數(shù)據(jù)的安全保障。目前,這套新的HPCC系統(tǒng)已通過(guò)骨干交換網(wǎng)與原有的4套HPCC系統(tǒng)相連,以此構(gòu)建起了一個(gè)超大規(guī)模的高性能計(jì)算集群,備份計(jì)劃正在有序進(jìn)行。
  
    談到未來(lái)的發(fā)展,曾所長(zhǎng)表示,未來(lái)幾年內(nèi)四川物探HPCC系統(tǒng)將陸續(xù)擴(kuò)展到3000個(gè)節(jié)點(diǎn)以上,“我們不僅要發(fā)展成為國(guó)內(nèi)最大的山地地震勘探工程與技術(shù)服務(wù)商,而且還要努力在技術(shù)上趕超世界先進(jìn)水平。憑借先進(jìn)強(qiáng)大的HPCC系統(tǒng),我們會(huì)爭(zhēng)取盡早實(shí)現(xiàn)這一目標(biāo),并努力為西部油氣開(kāi)發(fā)做出更大貢獻(xiàn)?!?BR>  
  

分享到

多易

相關(guān)推薦