曙光E級超算原型機
各國對E級超級計算機的競逐,標志著高性能計算發(fā)展進入一個新的歷史階段。然而,擺在全球高性能計算專家面前的一個難題是,在提升計算速度、搭建超大規(guī)模計算集群的同時,如何降低系統(tǒng)功耗?按照國際公認標準,E級超算的功耗應(yīng)低于20MW,即便適當放寬要求,系統(tǒng)功耗也不應(yīng)超過30MW。
翻越“功耗墻”的必由之路
全球領(lǐng)先的高性能計算機制造商曙光也正參與在E級超算設(shè)備研發(fā)的大潮中。作為國家“十三五”高性能計算專項支持的開展E級超算系統(tǒng)研制的3家單位之一,曙光在SC16大會上亮出了解決E級計算“功耗墻”的法寶——采用全浸沒相變冷卻技術(shù)來解決整套系統(tǒng)的散熱問題。
“E級高性能計算機研制,是國家‘十三五’高性能計算專題中的一項重要工作。這套系統(tǒng)密度高、功耗大,最終單機柜功率密度可達60kW、全系統(tǒng)總功耗或?qū)⑦_到30MW,對冷卻系統(tǒng)的能流密度和系統(tǒng)PUE值都提出了嚴峻的挑戰(zhàn)?!?數(shù)據(jù)中心產(chǎn)品事業(yè)部總工程師沈衛(wèi)東說。
他解釋說,對于下一代超級計算機,傳統(tǒng)的風冷技術(shù)已難以實現(xiàn)對系統(tǒng)的高效散熱,而由于液態(tài)冷卻液的散熱效率比空氣高上千倍,所以給液冷技術(shù)帶來兩大好處:一是液冷技術(shù)突破了CPU的散熱瓶頸并大幅提升了設(shè)備功率密度,而是減少室內(nèi)側(cè)傳熱總溫差從而去掉空調(diào)設(shè)備及壓縮機,允許全年自然冷卻,從而大幅降低PUE值。
目前市場上已開發(fā)的液冷服務(wù)器大多為冷板式即間接式液冷服務(wù)器。但是,從長遠角度看,直接冷卻式液冷能解決更高熱流密度的散熱問題。直接冷卻式又稱浸沒式冷卻,冷卻液與被冷卻對象直接接觸,冷卻效率更高。
“從目前國內(nèi)外最新的研究進展來看,使用液態(tài)冷卻液替代空氣來對計算機設(shè)備進行冷卻,是未來計算機設(shè)備的一場技術(shù)革命?!鄙蛐l(wèi)東說,降低數(shù)據(jù)中心能耗的技術(shù)手段有很多,但要應(yīng)對E級超算的“功耗墻”,已經(jīng)不是簡單地優(yōu)化數(shù)據(jù)中心建設(shè)問題,必須革命性地改變計算機等設(shè)備的冷卻方式,而成熟高效的浸沒式液冷技術(shù)將是翻越E級超算功耗墻的不二之選。
“曙光液冷”的技術(shù)儲備
近年來,曙光與世界知名企業(yè)合作逐漸增多,并致力于液冷技術(shù)的產(chǎn)業(yè)革命。通過曙光液冷技術(shù)開發(fā)團隊潛心攻關(guān)、突破瓶頸,如今,積淀的液冷技術(shù)已經(jīng)由量變引起質(zhì)的飛躍。截至目前,曙光已申請液冷相關(guān)專利40余項,并將掌握的技術(shù)專利轉(zhuǎn)化成420原型機、W560-LI全浸式液冷系統(tǒng)、浸沒式液冷展示機等液冷先驅(qū)產(chǎn)品。
早于2015年9月,曙光就發(fā)布了國內(nèi)首款可量產(chǎn)化的TC4600E-LP液冷服務(wù)器,并順利實現(xiàn)量產(chǎn)和商用,在液冷技術(shù)的市場化實踐上走在了前列。而真正彰顯曙光在液冷技術(shù)上領(lǐng)先地位的,則是隨后在全浸沒式液冷技術(shù)上的突破。
沈衛(wèi)東介紹,曙光的浸沒式液冷技術(shù)是通過將主板浸沒在電氣絕緣、化學(xué)穩(wěn)定、無毒、無腐蝕性、低溫室效應(yīng)的冷卻液中,利用冷卻液的沸騰汽化帶走熱量,冷卻液蒸汽在頂端冷凝,在重力作用下滴落回到腔體中,在腔體內(nèi)部完成冷卻循環(huán),實現(xiàn)了真正意義上的浸沒式冷卻。
液冷技術(shù)前景誘人
全浸沒式液冷相變技術(shù)由于采用了特殊的冷卻液,可以大大提高散熱的熱流密度——它能夠為單機柜功率密度高達100kW的服務(wù)器設(shè)備進行高效冷卻。可以想象,當數(shù)據(jù)中心單機柜的熱流密度進一步增加時,浸沒式液冷便會得到廣泛的應(yīng)用。
“全浸式相變冷卻技術(shù)為更高密度的節(jié)點設(shè)計掃除了障礙,可使機房面積降低到原來的十分之一。”沈衛(wèi)東說,浸沒式液冷可廣泛應(yīng)用于超級計算機和普通服務(wù)器的散熱,為超算中心和大型數(shù)據(jù)中心的散熱問題提供一個優(yōu)異的解決方案。
因此,盡管液冷服務(wù)器仍有設(shè)備維護專業(yè)性要求高、產(chǎn)業(yè)化初期成本較高等問題存在,面臨著相應(yīng)的機房建設(shè)和運維標準尚未建立、產(chǎn)業(yè)鏈尚不完善等現(xiàn)狀,但這些技術(shù)和市場方面的障礙無法阻擋用戶對整個數(shù)據(jù)中心更低TCO及更高投資回報率的追求,以及亟需解決的E級計算“功耗墻”的要求,因此在大規(guī)模數(shù)據(jù)中心和高性能計算應(yīng)用領(lǐng)域,液冷完全替代風冷指日可待。