華為聚焦于算力基礎(chǔ)設(shè)施和算網(wǎng)深度融合這兩大方向,近年來(lái)持續(xù)賦能IDC向AIDC轉(zhuǎn)型。華為中國(guó)政企大企業(yè)系統(tǒng)部總經(jīng)理劉濤表示主要體現(xiàn)在:

一、技術(shù)賦能。通過AI芯片、智能無(wú)損網(wǎng)和廣域網(wǎng)算力調(diào)度等技術(shù),幫助客戶提升智算數(shù)據(jù)中心競(jìng)爭(zhēng)力,降低運(yùn)營(yíng)成本。這是技術(shù)方面的賦能。

場(chǎng)景化方案。一方面提供智能化智算數(shù)據(jù)中心設(shè)計(jì)、算力網(wǎng)絡(luò)調(diào)度平臺(tái),這個(gè)調(diào)度平臺(tái)包括了數(shù)據(jù)中心資源調(diào)度和跨地域資源動(dòng)態(tài)分配等。特別是助力客戶承接“東數(shù)西算”的國(guó)家級(jí)項(xiàng)目,因?yàn)檫@種調(diào)度都是長(zhǎng)距離傳輸。

生態(tài)協(xié)同。聯(lián)合IDC運(yùn)營(yíng)商等合作伙伴,共建算力生態(tài),開放API接口和統(tǒng)一編排工具,支持客戶快速推出“算力即服務(wù)”產(chǎn)品。

四、綠色智能運(yùn)維。通過人工智能算法預(yù)測(cè)結(jié)合數(shù)字孿生技術(shù)實(shí)現(xiàn)鼓掌秒級(jí)定位,幫助客戶智算數(shù)據(jù)中心的高可用性。我們知道大集群里面的光模塊經(jīng)常容易壞,華為可以提供自動(dòng)識(shí)別光模塊的進(jìn)灰或失效,能及時(shí)進(jìn)行定位。

最終華為將以算力普遍存在、以網(wǎng)強(qiáng)算、生態(tài)開放為核心,助力第三方數(shù)據(jù)中心服務(wù)商提升算力交付能力,降低客戶進(jìn)入門檻,共同驅(qū)動(dòng)數(shù)字經(jīng)濟(jì)的綠色化和智能化升級(jí)。

在算力需求激增的背景下,網(wǎng)絡(luò)成為制約效能的“隱形瓶頸”。0.1%的丟包率可能導(dǎo)致50%的算力浪費(fèi),跨地域調(diào)度延遲超過3毫秒即影響模型收斂效率。

華為中國(guó)政企部系統(tǒng)部MKT與解決方案銷售部總經(jīng)理肖學(xué)崗對(duì)記者表示,華為面向于昇騰AI,提出面向智算融合的升級(jí)。為了實(shí)現(xiàn)網(wǎng)絡(luò)技術(shù)的創(chuàng)新,讓算力發(fā)展提供更大的效能,華為將從幾個(gè)方面入手來(lái)提升我們的昇騰的生態(tài),以及智算融合,為算網(wǎng)融合構(gòu)建高效的智算中心。

一、構(gòu)建智算網(wǎng)絡(luò)多級(jí)的可靠能力。通過全局的負(fù)載均衡,設(shè)備異常啟動(dòng)優(yōu)化和光模塊的檢測(cè)和抗損能力提升,構(gòu)建智算網(wǎng)絡(luò)多級(jí)的可靠能力。

、構(gòu)建零丟包的無(wú)損網(wǎng)絡(luò)。在智能訓(xùn)練過程中,0.1%的丟包率會(huì)導(dǎo)致超過50%的算力損失。持續(xù)丟包,還會(huì)有訓(xùn)練任務(wù)中斷的風(fēng)險(xiǎn)。華為通過部署無(wú)損網(wǎng)絡(luò),引入了智能流量調(diào)度算法,根據(jù)實(shí)時(shí)的訓(xùn)練模型,可以動(dòng)態(tài)調(diào)整傳輸速率。實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)流量的實(shí)時(shí)精準(zhǔn)控制,確保在網(wǎng)絡(luò)擁塞時(shí),不會(huì)出現(xiàn)丟包現(xiàn)象,我們解決了丟包的時(shí)延問題。同時(shí)我們還采用了400G和800G的高速網(wǎng)絡(luò)設(shè)備,確保數(shù)據(jù)傳輸?shù)乃俣群头€(wěn)定性,提升了整體的性能。

、實(shí)現(xiàn)網(wǎng)絡(luò)智能調(diào)度。在智能訓(xùn)練過程中,一旦發(fā)生網(wǎng)絡(luò)故障,如果沒有智能化的運(yùn)維手段。通過人工方式進(jìn)行故障排查,定位時(shí)間長(zhǎng),且故障恢復(fù)速度慢,會(huì)導(dǎo)致算力的浪費(fèi)和可用率低。部署算力感知網(wǎng)絡(luò)和智能管控平臺(tái),通過AI算法預(yù)測(cè),結(jié)合數(shù)字孿生技術(shù),實(shí)現(xiàn)故障的秒級(jí)定位、設(shè)備零丟包和超時(shí)延可視,實(shí)現(xiàn)算力網(wǎng)絡(luò)的智能化運(yùn)維和智能能力,提升系統(tǒng)整體的穩(wěn)定性和可用率。

“我們通過以上構(gòu)建了智算網(wǎng)絡(luò)多級(jí)的可靠能力,零丟包、無(wú)損網(wǎng)絡(luò)和算網(wǎng)智能調(diào)度的措施,能夠有效解決網(wǎng)絡(luò)波動(dòng)帶來(lái)的一系列算力使用的問題,充分發(fā)揮算力的最大效能,提升智算中心的整體性能,” 肖學(xué)崗提到。

據(jù)悉,華為通過“算力網(wǎng)絡(luò)大腦”整合跨地域資源,構(gòu)建了“1ms時(shí)延圈”,將算力利用率從40%提升至75%,客戶采購(gòu)成本降低30%,幫助更多客戶享受到高效、便捷的算力服務(wù)。 

生態(tài)共建:從“單點(diǎn)突破”到“全域賦能”

華為的智算戰(zhàn)略始終以“開放協(xié)同”為核心。據(jù)了解,在推動(dòng)算力伙伴體系建設(shè)方面,華為昇騰推出了昇騰萬(wàn)里伙伴計(jì)劃,向伙伴提供開發(fā)激勵(lì)。

劉濤補(bǔ)充到,昇騰通過提供開發(fā)激勵(lì),還有算力激勵(lì)、營(yíng)銷激勵(lì),助力伙伴和客戶實(shí)現(xiàn)商業(yè)成功。也針對(duì)于軟件類伙伴,分為普通應(yīng)用軟件類和大模型方向軟件類伙伴,基于伙伴的資質(zhì)、市場(chǎng)貢獻(xiàn)、產(chǎn)業(yè)貢獻(xiàn)和能力要求,華為給予不同的等級(jí)和權(quán)益。比如有技術(shù)開發(fā)類激勵(lì)、營(yíng)銷激勵(lì)和算力激勵(lì),這都是對(duì)于不同等級(jí)伙伴的激勵(lì)。

圍繞“原生”,昇騰AI每年投入超過10億元專項(xiàng)資金,以“技術(shù)+商業(yè)”即技術(shù)和客戶需求,雙輪驅(qū)動(dòng)生態(tài)繁榮。面向技術(shù)生態(tài),通過培養(yǎng)布道師,體系化賦能開發(fā)者,面向商業(yè)生態(tài),通過發(fā)展雙模式,協(xié)同伙伴拓展行業(yè)場(chǎng)景。一方面助力伙伴更深入地理解行業(yè),另外賦能伙伴更匹配場(chǎng)景需求的產(chǎn)品。

結(jié)語(yǔ)

未來(lái),通過構(gòu)建“以客戶為中心”的“伙伴+華為”體系,華為將以技術(shù)賦能幫助頭部IDC(互聯(lián)網(wǎng)數(shù)據(jù)中心)從“機(jī)柜租賃商”向“智能算力服務(wù)商”升級(jí)轉(zhuǎn)型。當(dāng)算力成為數(shù)字經(jīng)濟(jì)的“第一生產(chǎn)力”,中國(guó)智算產(chǎn)業(yè)正站在從“規(guī)模擴(kuò)張”向“質(zhì)量躍升”的關(guān)鍵拐點(diǎn)。

華為的實(shí)踐表明,唯有以技術(shù)創(chuàng)新為矛、以生態(tài)協(xié)同為盾,構(gòu)建“算-網(wǎng)-存-智”深度融合的產(chǎn)業(yè)新范式,才能在全球算力競(jìng)爭(zhēng)中贏得戰(zhàn)略主動(dòng),為千行百業(yè)數(shù)字化轉(zhuǎn)型注入持續(xù)動(dòng)能。

分享到

nina

相關(guān)推薦