“目前大型超級(jí)計(jì)算機(jī),特別是準(zhǔn)E級(jí)或未來的E級(jí)系統(tǒng),在系統(tǒng)規(guī)模、擴(kuò)展性、成本、能耗、可靠性等方面仍面臨著嚴(yán)峻挑戰(zhàn)。本次發(fā)布的硅元交換機(jī)是全球首款采用Torus架構(gòu)的高速網(wǎng)絡(luò)交換機(jī)產(chǎn)品,基于它構(gòu)建的超級(jí)計(jì)算機(jī)互連網(wǎng)絡(luò)系統(tǒng)具有領(lǐng)先的性能、超強(qiáng)的擴(kuò)展能力、極佳的容錯(cuò)能力,是邁向E級(jí)的最佳網(wǎng)絡(luò)技術(shù)路線?!笔锕夤綡PC產(chǎn)品事業(yè)部總經(jīng)理李斌介紹說。

與傳統(tǒng)胖樹網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)相比,強(qiáng)調(diào)鄰近互連的Torus直接網(wǎng)絡(luò)在擴(kuò)展性上具有明顯的優(yōu)勢(shì),且網(wǎng)絡(luò)成本和系統(tǒng)規(guī)模呈線性關(guān)系。另外,因?yàn)榫哂泻芏嗳哂鄶?shù)據(jù)通路和采用動(dòng)態(tài)路由,Torus網(wǎng)絡(luò)也具有天然的容錯(cuò)性優(yōu)勢(shì),這些都是超大規(guī)模系統(tǒng)所需要的網(wǎng)絡(luò)特性,也是國(guó)際主流的高速網(wǎng)絡(luò)技術(shù)發(fā)展方向。

李斌介紹說,曙光公司早在2015年的硅立方高性能計(jì)算機(jī)中就已實(shí)現(xiàn)了三維的3D-Torus。目前,曙光的Torus網(wǎng)絡(luò)技術(shù)研究又有了突破性進(jìn)展。Torus網(wǎng)絡(luò)的維度從3D進(jìn)化到了6D,提高Torus維度能有效降低大規(guī)模系統(tǒng)的最長(zhǎng)網(wǎng)絡(luò)跳數(shù)。在軟件層面,支持6D-Torus的無死鎖動(dòng)態(tài)路由算法已經(jīng)經(jīng)過實(shí)際環(huán)境檢驗(yàn);在硬件層面,本次發(fā)布的Torus硅元交換機(jī)就是一項(xiàng)重要的硬件實(shí)現(xiàn)。

“硅元”是指Torus高維直接網(wǎng)絡(luò)中的一個(gè)單元,一個(gè)硅元內(nèi)部采用3D-Torus拓?fù)浣Y(jié)構(gòu),多個(gè)硅元可以構(gòu)建更高維的4D/5D/6D-Torus直接網(wǎng)絡(luò)。將一個(gè)3D-Torus硅元集成到一臺(tái)模塊化交換機(jī),能夠極大提高系統(tǒng)集成度和密度,減少網(wǎng)絡(luò)線纜,降低部署復(fù)雜度,降低成本。本次發(fā)布的Torus硅元交換機(jī)可以支持多達(dá)192個(gè)100Gb高速網(wǎng)絡(luò)端口,Torus硅元交換機(jī)之間通過400Gb專用接口進(jìn)行互連。

通過這樣的硬件實(shí)現(xiàn),也提高了Torus高速網(wǎng)絡(luò)技術(shù)的覆蓋范圍,一些中小規(guī)模的高性能計(jì)算系統(tǒng)也可以更便捷地享用這項(xiàng)先進(jìn)技術(shù)。

值得一提的是,本次發(fā)布的Torus硅元交換機(jī)還支持冷板式直接液體冷卻,這標(biāo)志著曙光的液體冷卻技術(shù)從計(jì)算設(shè)備延展到了網(wǎng)絡(luò)系統(tǒng)。液冷技術(shù)對(duì)提高大規(guī)模網(wǎng)絡(luò)系統(tǒng)的集成度和可靠性、降低能耗等方面同樣可以發(fā)揮重要的作用。

高性能計(jì)算和人工智能蓬勃發(fā)展的背后不僅需要計(jì)算能力的支撐和推動(dòng),也離不開高速互連網(wǎng)絡(luò)的保駕護(hù)航。未來,曙光將在計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等核心技術(shù)方面進(jìn)行持續(xù)創(chuàng)新,逐步發(fā)展成為中國(guó)新形象、新技術(shù)創(chuàng)新力量的名片之一。

更多曙光相關(guān)資訊,歡迎搜索微信公眾號(hào)“中科曙光/sugoncn”,關(guān)注曙光公司官方微信。

—完—

分享到

zhupb

相關(guān)推薦