SGI全球高級(jí)副總裁兼首席技術(shù)執(zhí)行官吳永琳
SGI刀片定位高性能計(jì)算
談到SGI,人們更熟悉的是該公司的大機(jī)產(chǎn)品,其產(chǎn)品歷來在高性能計(jì)算領(lǐng)域享有很高的聲譽(yù)。而此次發(fā)布的SGI Altix ICE綜合了SGI高性能領(lǐng)域的優(yōu)勢(shì),提供給用戶一套高度集成,低功耗的刀片計(jì)算解決方案。據(jù)SGI表示,Altix ICE 8200是第一套真正專為高性能計(jì)算(HPC)應(yīng)用以及大規(guī)模集群工作流設(shè)計(jì)的刀片式服務(wù)器。
據(jù)SGI全球高級(jí)副總裁兼首席技術(shù)執(zhí)行官吳永琳介紹,SGI Altix ICE適用于大規(guī)模、各式工作流,能夠?yàn)槭褂谜咛峁╉敿?jí)的性價(jià)比、電源和空間使用效率、可靠性和易管理性。
如何做到節(jié)能高效
一些HPC的用戶特別是超大規(guī)模和大規(guī)模HPC的用戶已經(jīng)把能耗(每瓦特計(jì)算性能 Flops/W)和占地面積(每平方米計(jì)算性能Flops/m2)作為HPC的重要指標(biāo)在產(chǎn)品選擇過程中予以和峰值、效率等傳統(tǒng)評(píng)價(jià)指標(biāo)一樣的關(guān)注。這也使得HPC廠家必須把減少能耗和占地面積的節(jié)約型HPC作為產(chǎn)品的重要發(fā)展方向來研究。
吳永琳指出,在數(shù)據(jù)中心配置大規(guī)模集群計(jì)算環(huán)境時(shí),SGI Altix ICE可以將其對(duì)空間和電力的要求降到最低。Altix ICE通過其超高的計(jì)算密度構(gòu)架,單位面積上的計(jì)算性能比其他廠商的刀片系統(tǒng)超出了40%。單一SGI® Altix® ICE 8200機(jī)架,可以配置512 Intel® Xeon®處理器核,即6TFLOPS(每秒6萬億次浮點(diǎn)運(yùn)算)的計(jì)算性能。
新平臺(tái)的高計(jì)算密度幫助用戶克服了服務(wù)器在房間雜亂堆置的問題。集成的刀片形式使得系統(tǒng)的服務(wù)和維修比以往更加容易。SGI為其新平臺(tái)提供了優(yōu)越、無線纜的刀片機(jī)箱( IRU )設(shè)計(jì),并且板上集成InfiniBand網(wǎng)卡(infiniband等接口做到了PCB中,減少了連接線纜),進(jìn)一步減少了系統(tǒng)故障點(diǎn)。SGI Altix ICE 8200 的部件采用冗余設(shè)計(jì),例如熱插拔電源和冷卻部件。
吳永琳告訴記者,一般的刀片服務(wù)器,在電流進(jìn)入機(jī)柜的時(shí)候,電能就已經(jīng)損耗了48%以上。而SGI Altix ICE通過突破性的智能節(jié)能設(shè)計(jì),在12V直流電的情況下有超過90%的使用效率,刀片級(jí)使用效率超過87%,機(jī)柜級(jí)使用效率超過76% 。在一套10TFLOPS的系統(tǒng)上,每年可以幫助用戶節(jié)約超過53000美元的能源費(fèi)用。并且SGI Altix ICE通過預(yù)先集成并測(cè)試的工廠安裝使得用戶可以“通電即用”,讓用戶不必關(guān)心系統(tǒng)的安裝與管理,而專心在自己的工作上。
新平臺(tái)采用了SGI引以為傲的第三代水冷設(shè)計(jì)??用戶配置大規(guī)模和高密度產(chǎn)品的完美選擇。流水通過唯一的部件帶走SGI Altix ICE 產(chǎn)生的95%以上的熱量。在全球已經(jīng)有超過250套水冷設(shè)備安裝用于現(xiàn)有的SGI Altix 系統(tǒng)。對(duì)于那些為數(shù)據(jù)中心提供電力,同時(shí)還要保持足夠冷卻來延長(zhǎng)使用壽命的客戶而言,這樣的效果可以每年節(jié)約成百上千萬的資金。
SGI Altix ICE 8200
集群如何處理
HPC集群廣泛用于大規(guī)模計(jì)算領(lǐng)域,但是如何將它們整合在一起卻越來越困難。
“我們?cè)偃膹目蛻裟锹牭?,第一代的集群系統(tǒng)已經(jīng)不能提供更多的生產(chǎn)力了,盡管他們的性能仍然擁有潛力,也就是說系統(tǒng)的理論峰值和實(shí)際使用之間存在著很大的鴻溝。同時(shí),這些使用集群系統(tǒng)的組織還在努力的適應(yīng)使用、支持、電力和制冷的復(fù)雜性。”SGI的CEO Robert Bo Ewald說?!癝GI Altix ICE擁有新一代的系統(tǒng)構(gòu)架??部分像cluster,部分像MPP??因此會(huì)挖掘出系統(tǒng)的最大潛能,相當(dāng)程度的提高HPC系統(tǒng)可靠性,適用型和可服務(wù)性,并且提供更高的功耗效率,只占用很小的面積?!?BR>
如何達(dá)到更高計(jì)算密度
SGI與Intel聯(lián)合設(shè)計(jì)出新的高度集成的“Atoka”主板,實(shí)現(xiàn)了驚人的計(jì)算密度提高。新一代的“Atoka”主板,專為HPC市場(chǎng)設(shè)計(jì),因此每塊SGI Altix ICE刀片可以配置兩個(gè)雙核或四核的Intel Xeon處理器和最高32GB的內(nèi)存。
為了確保實(shí)現(xiàn)最佳的應(yīng)用性能和可伸縮性,新平臺(tái)的特點(diǎn)支持兩個(gè)高帶寬,低延時(shí)的雙倍傳輸速率( DDR ) InfiniBand背板,即使是部署規(guī)模數(shù)以千計(jì)的處理器,也能讓節(jié)點(diǎn)和機(jī)架間通訊交換速度更快。通過指定千兆以太網(wǎng)來執(zhí)行管理任務(wù),SGI將DDR InfiniBand連接20gb/second的計(jì)算流量解放出來。為了動(dòng)態(tài)連接的最優(yōu)化,新系統(tǒng)還采用了分層網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),無需外部網(wǎng)絡(luò)交換機(jī)。
存儲(chǔ)如何解決
SGI Altix ICE是無盤式刀片架構(gòu),因此提供“刀片外”集中的存儲(chǔ)資源。通過將存儲(chǔ)從計(jì)算刀片上移除,并且基于SGI infinitestorage存儲(chǔ),SGI允許客戶選擇最適合自己計(jì)算環(huán)境的存儲(chǔ)方案,滿足特定應(yīng)用的需求。這個(gè)“刀片外”的磁盤設(shè)計(jì)也進(jìn)一步降低了成本,重量和功耗,同時(shí)提高可靠性。
軟件解決方案
具有二十年開發(fā)經(jīng)驗(yàn)的“開電即用”解決方案, SGI 可以制作這樣的系統(tǒng),她能夠提升用戶的應(yīng)用能力,并且在一天之內(nèi),可以以沒機(jī)架6TFLOPS 的計(jì)算能力快速提升生產(chǎn)力。
SGI Altix ICE的即時(shí)生產(chǎn)力的本質(zhì)是SGI集成的軟件解決方案。其中的一個(gè)重要的組成部分就是每臺(tái)SGI Altix ICE 8200系統(tǒng)的軟件預(yù)先安裝,其中含有軟件包的兩個(gè)集群管理軟件的選項(xiàng):
SGI Tempo,,它能夠極大的加速開元的OSCAR 應(yīng)用,同時(shí)允許管理員輕松的管理和監(jiān)控所有的刀片、底盤、機(jī)架和整個(gè)系統(tǒng)。通過分等級(jí)的管理途徑, SGI使用戶最優(yōu)化他們的網(wǎng)絡(luò)連接和特殊工作流的最佳的適應(yīng);管理不同級(jí)別的數(shù)據(jù),不論是單一還是孤立的問題和資料都能統(tǒng)一管理并且操簡(jiǎn)便;簡(jiǎn)單的替換或者增加組成;將VLAN管理和底層網(wǎng)絡(luò)管理與應(yīng)用網(wǎng)絡(luò)區(qū)管理分開來。
Scali Manage,它嫩夠最優(yōu)化部署和SGI Altix ICE系統(tǒng)的不間斷管理,通過綜合最完整 、完善、最具擴(kuò)展性的集群管理和高可用的商業(yè)監(jiān)測(cè)系統(tǒng)。
編輯評(píng)論:刀片服務(wù)器的普及已是大勢(shì)所趨,分析人士指出,普通的企業(yè)用戶在未來將會(huì)成為刀片的主要市場(chǎng)。要想占據(jù)市場(chǎng)領(lǐng)先地位,產(chǎn)品必須多元化,滿足不同層次的用戶需求。SGI要想在刀片領(lǐng)域拓展勢(shì)力,還需要結(jié)合其技術(shù)優(yōu)勢(shì),豐富其產(chǎn)品線,為用戶帶來更多類型的高性能刀片服務(wù)器。