在近日舉行的華為全聯(lián)接大會(huì)2025上,華為正式發(fā)布全球最強(qiáng)算力超節(jié)點(diǎn)和集群,依托靈衢,將多臺(tái)物理機(jī)器深度互聯(lián),實(shí)現(xiàn)邏輯層面“像一臺(tái)機(jī)器一樣學(xué)習(xí)、思考與推理”,重新定義了高效、穩(wěn)定、可擴(kuò)展的大規(guī)模有效算力新范式。

靈衢以“協(xié)議歸一”“全量資源池化”“平等協(xié)同”等特性,突破計(jì)算機(jī)網(wǎng)絡(luò)與體系結(jié)構(gòu)的邊界,重新定義超節(jié)點(diǎn)架構(gòu),為智能時(shí)代的算力需求提供全新解決方案。

從單芯片局限到算力重構(gòu):靈衢的研發(fā)起點(diǎn)

在算力需求呈指數(shù)級(jí)增長(zhǎng)的今天,單芯片的算力天花板日益明顯,多樣化算力協(xié)同成為行業(yè)共識(shí)。華為集群計(jì)算總經(jīng)理朱照生表示,華為早在數(shù)年前就明確了核心戰(zhàn)略:通過(guò)超節(jié)點(diǎn)與互聯(lián)技術(shù),突破單芯片算力瓶頸,提升整個(gè)計(jì)算系統(tǒng)的價(jià)值。

這一戰(zhàn)略的落地,源于華為對(duì)計(jì)算系統(tǒng)四大核心痛點(diǎn)的深刻洞察:

性能線(xiàn)性度難題:傳統(tǒng)計(jì)算系統(tǒng)在擴(kuò)展節(jié)點(diǎn)規(guī)模時(shí),性能往往無(wú)法隨節(jié)點(diǎn)數(shù)量同步增長(zhǎng),N個(gè)節(jié)點(diǎn)的實(shí)際性能可能僅為0.1N,資源浪費(fèi)嚴(yán)重;

系統(tǒng)可用性挑戰(zhàn):節(jié)點(diǎn)規(guī)模擴(kuò)大后,運(yùn)行可靠性下降,故障恢復(fù)效率低,難以滿(mǎn)足企業(yè)級(jí)應(yīng)用的穩(wěn)定性需求;

資源利用率瓶頸:?jiǎn)涡酒芰τ邢?,?nèi)存、帶寬、計(jì)算資源分散,無(wú)法通過(guò)池化實(shí)現(xiàn)高效調(diào)度,導(dǎo)致資源閑置;

產(chǎn)業(yè)協(xié)同壁壘:不同廠(chǎng)商的硬件組件協(xié)議不互通,需額外“翻譯”成本,軟件生態(tài)碎片化,難以形成規(guī)?;?yīng)。

為解決這些問(wèn)題,華為從2019年正式立項(xiàng)靈衢項(xiàng)目,整合了公司在IT基礎(chǔ)設(shè)施、數(shù)據(jù)中心接口開(kāi)發(fā)、集群工程等領(lǐng)域的數(shù)十年積累——從鯤鵬、昇騰處理器到DPU、Switch、SSD存儲(chǔ)介質(zhì),華為先將靈衢協(xié)議集成到自研硬件的研發(fā)流程中,通過(guò)硬件迭代反哺協(xié)議優(yōu)化,最終實(shí)現(xiàn)靈衢1.0的產(chǎn)品化落地,并完成大規(guī)模集群交付驗(yàn)證,達(dá)到工業(yè)化可信標(biāo)準(zhǔn)。

技術(shù)解構(gòu):突破邊界的“協(xié)議綜合體”

靈衢的核心創(chuàng)新,在于打破了計(jì)算機(jī)網(wǎng)絡(luò)與計(jì)算機(jī)體系結(jié)構(gòu)的“墻”,構(gòu)建了一套融合兩者優(yōu)勢(shì)的協(xié)議棧,形成了獨(dú)特的超節(jié)點(diǎn)架構(gòu)。

從協(xié)議棧結(jié)構(gòu)來(lái)看,靈衢呈現(xiàn)出鮮明的“雙層基因”:

底層:計(jì)算機(jī)網(wǎng)絡(luò)的“骨架”:物理層、鏈路層、網(wǎng)絡(luò)層沿用計(jì)算機(jī)網(wǎng)絡(luò)的成熟概念,但進(jìn)行了針對(duì)性創(chuàng)新,確保數(shù)據(jù)傳輸?shù)膹V覆蓋與高可靠,解決了“光的距離”難題——通過(guò)協(xié)議優(yōu)化,實(shí)現(xiàn)跨機(jī)柜光互聯(lián)時(shí)仍保持電信號(hào)級(jí)別的可靠性,通信距離可達(dá)100-200米,突破傳統(tǒng)電信號(hào)2米的傳輸限制;

上層:計(jì)算機(jī)體系結(jié)構(gòu)的“靈魂”:傳輸層負(fù)責(zé)數(shù)據(jù)的可靠點(diǎn)對(duì)點(diǎn)傳輸,支撐超節(jié)點(diǎn)規(guī)模擴(kuò)展;事務(wù)層則涵蓋內(nèi)存訪(fǎng)問(wèn)、信息通信、管理等核心功能,搭配UMMU(靈衢內(nèi)存與權(quán)限管理)、UBM(靈衢總線(xiàn)管理)等模塊,提供與傳統(tǒng)計(jì)算機(jī)架構(gòu)一致的編程入口,讓開(kāi)發(fā)者無(wú)需適配新語(yǔ)言即可調(diào)用資源。

基于這套協(xié)議棧,靈衢超節(jié)點(diǎn)架構(gòu)提煉出六大關(guān)鍵特征,徹底區(qū)別于傳統(tǒng)松散節(jié)點(diǎn)集群:

1、總線(xiàn)級(jí)互聯(lián):構(gòu)建統(tǒng)一總線(xiàn),將CPU、NPU、GPU、MEM、SSU、DPU、Switch等均視為超節(jié)點(diǎn)內(nèi)部組件,實(shí)現(xiàn)同質(zhì)互聯(lián),消除交互阻礙;

2、全量池化:所有異構(gòu)資源(計(jì)算、存儲(chǔ)、帶寬)均可池化調(diào)度,開(kāi)發(fā)者可通過(guò)共享內(nèi)存方式直接調(diào)用,符合馮·諾依曼架構(gòu)的最短路徑原則;

3、平等協(xié)同:不同組件間無(wú)“主從”之分,無(wú)論是處理器間通信還是集群擴(kuò)展,均遵循同一套協(xié)議,避免“翻譯”損耗;

4、協(xié)議歸一:超節(jié)點(diǎn)內(nèi)部、超節(jié)點(diǎn)之間無(wú)需切換協(xié)議,無(wú)轉(zhuǎn)換開(kāi)銷(xiāo),支持大規(guī)模組網(wǎng);

5、高可用性:從物理層到事務(wù)層內(nèi)置故障恢復(fù)機(jī)制,確保萬(wàn)卡甚至十萬(wàn)卡集群的穩(wěn)定運(yùn)行;

6、組件貨架化:開(kāi)放協(xié)議規(guī)范,任何廠(chǎng)商的組件均可即插即用,降低產(chǎn)業(yè)協(xié)同門(mén)檻。

與行業(yè)內(nèi)現(xiàn)有場(chǎng)景化互聯(lián)協(xié)議(如PCIe、CXL、NVLink等)相比,靈衢的核心優(yōu)勢(shì)在于“全覆蓋”——后者多針對(duì)特定場(chǎng)景(如GPU互聯(lián)、內(nèi)存擴(kuò)展)設(shè)計(jì),功能存在缺失,而靈衢通過(guò)一套協(xié)議即可滿(mǎn)足計(jì)算、存儲(chǔ)、通信等全場(chǎng)景需求,相當(dāng)于為算力基礎(chǔ)設(shè)施提供了一套“普通話(huà)”,替代了此前五花八門(mén)的“方言”。

產(chǎn)業(yè)落地:從技術(shù)驗(yàn)證到生態(tài)共建

經(jīng)過(guò)數(shù)年迭代,靈衢已從實(shí)驗(yàn)室走向商用,形成兩大典型部署形態(tài),兼顧兼容性與創(chuàng)新性:

原生超節(jié)點(diǎn)部署:所有組件通過(guò)靈衢協(xié)議直接互聯(lián),Switch不再僅是交換節(jié)點(diǎn),而是作為處理單元參與算力協(xié)同,最大化發(fā)揮多樣化算力價(jià)值;

兼容現(xiàn)有基礎(chǔ)設(shè)施:通過(guò)UBOE模式,靈衢可作為UDP應(yīng)用運(yùn)行在客戶(hù)已有的以太網(wǎng)、TCP/IP環(huán)境中,無(wú)需改造現(xiàn)有硬件;同時(shí),華為申請(qǐng)的“UB類(lèi)型”硬件,支持傳統(tǒng)TCP/IP應(yīng)用直接接入超節(jié)點(diǎn),與外部資源基于TCP/IP、RoCE互通。

目前,靈衢1.0已在華為內(nèi)部及頭部互聯(lián)網(wǎng)客戶(hù)的384卡超節(jié)點(diǎn)中完成規(guī)模驗(yàn)證,客戶(hù)反饋集中在三大維度:

運(yùn)維層面:超節(jié)點(diǎn)簡(jiǎn)化了布線(xiàn)與管理,單柜算力密度提升,但也對(duì)機(jī)房供電(從傳統(tǒng)2.5kW機(jī)柜升級(jí)至50kW以上)、散熱(熱流密度超100W/cm2)提出更高要求——華為已提前布局,兩年前便實(shí)現(xiàn)單柜583kW的技術(shù)驗(yàn)證,并提出未來(lái)2-3年200-300kW機(jī)柜為合理演進(jìn)方向;

開(kāi)發(fā)層面:開(kāi)發(fā)者無(wú)需受限于單臺(tái)服務(wù)器的8卡約束,可在384卡甚至更大規(guī)模的超節(jié)點(diǎn)中自由設(shè)計(jì)模型并行、專(zhuān)家并行策略,模型開(kāi)發(fā)空間大幅擴(kuò)展;

業(yè)務(wù)層面:大模型推理的token輸出時(shí)延顯著降低,從“逐字蹦出”向“閃電加載”邁進(jìn),用戶(hù)體驗(yàn)提升;同時(shí),數(shù)據(jù)庫(kù)(如OLTP)、推薦系統(tǒng)等傳統(tǒng)場(chǎng)景也從靈衢的高帶寬、低時(shí)延特性中獲益,業(yè)務(wù)吞吐量提升。

更值得關(guān)注的是靈衢的開(kāi)放生態(tài)進(jìn)展。盡管華為是靈衢的開(kāi)創(chuàng)者,但從2025年HC大會(huì)發(fā)布靈衢2.0至今,已有多家IT廠(chǎng)商、處理器廠(chǎng)商、IP廠(chǎng)商主動(dòng)尋求合作——核心原因在于華為不僅開(kāi)放了從物理層到事務(wù)層的完整協(xié)議規(guī)范(可在靈衢官網(wǎng)下載),還聯(lián)合第三方打造了協(xié)議驗(yàn)證測(cè)試儀,能精準(zhǔn)檢測(cè)硬件的帶寬、時(shí)延、物理層波形等指標(biāo),解決了“符合規(guī)范”的核心痛點(diǎn)。

朱照生強(qiáng)調(diào),靈衢的生態(tài)路徑清晰:先以企業(yè)標(biāo)準(zhǔn)推動(dòng)商用驗(yàn)證,讓客戶(hù)獲得實(shí)際價(jià)值;再聯(lián)合第三方成立公立認(rèn)證機(jī)構(gòu),確保組件兼容性;最終逐步從企標(biāo)升級(jí)為團(tuán)標(biāo)、甚至國(guó)標(biāo),形成全產(chǎn)業(yè)共建的生態(tài)?!拔覀儾幌M`衢僅綁定華為硬件,而是希望所有有能力的廠(chǎng)商參與進(jìn)來(lái),通過(guò)競(jìng)爭(zhēng)提升整個(gè)算力基礎(chǔ)設(shè)施的競(jìng)爭(zhēng)力。”

未來(lái)展望:超節(jié)點(diǎn)沒(méi)有“天花板”,算力生態(tài)無(wú)“邊界”

當(dāng)被問(wèn)及“超節(jié)點(diǎn)是否越大越好”“靈衢是否僅適用于推理”等問(wèn)題時(shí),華為的回答展現(xiàn)了對(duì)產(chǎn)業(yè)趨勢(shì)的判斷:

超節(jié)點(diǎn)規(guī)模無(wú)固定“甜點(diǎn)”:回顧近十年AI發(fā)展,所有對(duì)算力、模型規(guī)模的預(yù)測(cè)均偏保守。華為計(jì)劃2026年底將靈衢超節(jié)點(diǎn)規(guī)模提升至8192卡,后續(xù)逐步擴(kuò)展至15488卡,目的是為模型廠(chǎng)商提供無(wú)約束的硬件平臺(tái),避免人為設(shè)定規(guī)模上限制約創(chuàng)新;

靈衢是全場(chǎng)景解決方案:無(wú)論是大模型訓(xùn)練(提升收斂速度與精度)、推理(降低時(shí)延),還是傳統(tǒng)數(shù)據(jù)庫(kù)、推薦系統(tǒng),只要存在多節(jié)點(diǎn)協(xié)同需求,靈衢均可發(fā)揮價(jià)值——它的定位是“算力基礎(chǔ)設(shè)施的通用協(xié)議”,而非單一場(chǎng)景的“優(yōu)化工具”。

從更長(zhǎng)遠(yuǎn)來(lái)看,靈衢的意義不僅在于技術(shù)創(chuàng)新,更在于推動(dòng)算力產(chǎn)業(yè)的“范式轉(zhuǎn)移”:過(guò)去,算力基礎(chǔ)設(shè)施的核心是“單芯片性能競(jìng)賽”;未來(lái),隨著靈衢等互聯(lián)技術(shù)的成熟,“系統(tǒng)協(xié)同效率”將成為競(jìng)爭(zhēng)關(guān)鍵。當(dāng)不同廠(chǎng)商的硬件能通過(guò)統(tǒng)一協(xié)議無(wú)縫協(xié)同,當(dāng)軟件開(kāi)發(fā)者能自由調(diào)度全量池化資源,整個(gè)算力產(chǎn)業(yè)將擺脫“碎片化”困境,進(jìn)入“協(xié)同創(chuàng)新”的新階段。

正如朱照生用“普通話(huà)”類(lèi)比靈衢:“方言有其歷史合理性,但統(tǒng)一語(yǔ)言能提升整個(gè)社會(huì)的溝通效率。靈衢要做的,就是讓算力基礎(chǔ)設(shè)施的所有組件‘講同一種話(huà)’,最終為智能時(shí)代的發(fā)展掃清算力障礙?!?/p>

分享到

lixiangjing

算力豹主編

相關(guān)推薦