蘇州科技大學
百萬億次超算服務蘇州科大固體微結(jié)構研究
蘇州科技大學是由中央與地方共建、江蘇省蘇州市共建、以江蘇省管理為主的高等院校。學校自建校以來培養(yǎng)了包括中國科學院院士周錫元、中國工程院院士葉可明在內(nèi)的8萬余名本??茖W生以及2000余名全日制碩士研究生。
作為學校引進和自身培養(yǎng)相結(jié)合而形成的研究團隊–固體微結(jié)構研究團隊,主要致力于研究凝聚態(tài)物質(zhì)中不同尺度層次,不同類型微結(jié)構組態(tài)、分布、相互作用及形成和轉(zhuǎn)變規(guī)律,揭示它們與宏觀物理性質(zhì)間的內(nèi)在聯(lián)系,并將理論研究,計算機模擬與當代先進實驗手段相結(jié)合,探索、設計和制備各種類型的微結(jié)構材料,研究其物理機制和新效應,為發(fā)展新型微結(jié)構材料以及器件奠定基礎。
為了更好的進行固體微結(jié)構應用研究,蘇州科技大學提出了需要一套百萬億次計算能力的超級計算機作為研究支撐。
浪潮應對固體微結(jié)構超算平臺復雜需求
根據(jù)應用的需求,蘇州科技大學需要建成的超算平臺具備高性能、高擴展、低功耗的特點,并對計算節(jié)點、GPU節(jié)點、IO節(jié)點等做了較細致的需求規(guī)劃,最終要求整套集群系統(tǒng)Linpack實測效率必須≥70%。
針對此次固體微結(jié)構超算平臺設備采購項目需求,結(jié)合多年來對科學計算領域高性能應用的深刻理解,浪潮推出了浪潮天梭TS10000高性能集群系統(tǒng),本集群具有計算性能優(yōu)越、功耗控制領先、監(jiān)控管理系統(tǒng)方便易用、系統(tǒng)開放易于擴展、服務體系完善等特點,同時采用全密閉冷池方案、行間制冷,可以對整個集群進行集中監(jiān)控和管理、自動化運維。
CPU+GPU異構計算架構:集群采用目前主流的CPU+GPU架構,使計算能力更加可靠、高效。CPU計算節(jié)點采用浪潮高效能刀片計算節(jié)點,每臺配置2顆14nm Broadwell架構的CPU。GPU計算節(jié)點采用浪潮旗艦GPU節(jié)點,每臺配置1塊K40M GPU卡。該服務器基于“IFA+效能動三角”產(chǎn)品設計理念,結(jié)構設計緊湊靈活、高可靠、高性能。使整體集群計算能力突破百萬億次大關,成為蘇南地區(qū)高校最大規(guī)模的超算平臺。
綠色節(jié)能:同時,蘇科大固體微架構超算集群的功耗與散熱也是嚴格低于國家標準的??紤]到日趨嚴峻的環(huán)境問題,浪潮作為IT企業(yè)的綠色衛(wèi)士也是特別考慮到了這一問題。浪潮在滿足蘇科大超算集群百萬億次要求的前提下,對服務器和機房的功耗做出了嚴格的把控。爭取做到集群的每一瓦特都不浪費,最終使集群的每瓦特計算能力達到Green 500的水平。為蘇科大建設綠色超算集群。
大內(nèi)存胖節(jié)點:固體微結(jié)構模擬對節(jié)點的內(nèi)存要求十分苛刻,而且通用計算節(jié)點由于配置內(nèi)存較小,無法滿足固體微結(jié)構模擬對內(nèi)存的需求,效率上會大大降低。然而胖節(jié)點避免了這一缺陷,大大滿足了集群對大內(nèi)存的需求。所以浪潮針對蘇州科技大學在計算物理上的大內(nèi)存需求配置NF8460M4四路服務器,每節(jié)點配置超大容量內(nèi)存,提高了單機的并行計算能力,使固體微結(jié)構模擬在最短時間內(nèi)獲得最可靠的數(shù)據(jù)。
應用優(yōu)化:蘇州科技大學的數(shù)理學院的凝聚態(tài)物理方向是以二維非晶碳材料、鈣鈦礦氧化物和磁致冷材料等凝聚態(tài)物質(zhì)為研究對象,系統(tǒng)的研究多體系中光致電輸運機理、非晶碳薄膜制備及性能優(yōu)化、磁性材料新相探索等,最終實現(xiàn)設計和發(fā)展新型的碳基半導體器件、氧化物氣敏器件和磁電存儲器件。在集群中通過GPU加速卡模擬計算凝聚態(tài)物質(zhì)中大量粒子的運動方式,可有效的幫助院系研究凝聚態(tài)物質(zhì)的原子結(jié)構、電子結(jié)構以及相關的各種物理性質(zhì),使應用研究獲得質(zhì)的飛躍。
浪潮為蘇州科技大學設計構建的超算平臺滿足了用戶需求,使原來數(shù)天數(shù)小時才能運行出的結(jié)果,現(xiàn)在數(shù)分鐘即可得到更加精確的數(shù)據(jù),大幅提高了蘇州科技大學固體微結(jié)構超算集群的計算速度及精度。