徐直軍在演講中強(qiáng)調(diào),算力過(guò)去是、未來(lái)也將繼續(xù)是人工智能發(fā)展的關(guān)鍵,尤其對(duì)于中國(guó)的人工智能而言更是如此。基于中國(guó)現(xiàn)有可獲得的芯片制造工藝,華為正努力打造“超節(jié)點(diǎn)+集群”的算力解決方案,以滿足持續(xù)高速增長(zhǎng)的AI算力需求。

文字編輯|宋雨涵

1

全球最強(qiáng)“超節(jié)點(diǎn)+集群”

深度解讀其內(nèi)涵

“超節(jié)點(diǎn)”:邏輯上的單一超級(jí)計(jì)算機(jī)

華為提出的“超節(jié)點(diǎn)”概念,是指由多臺(tái)物理服務(wù)器通過(guò)高速互聯(lián)緊密耦合而成的一個(gè)邏輯上的單一計(jì)算節(jié)點(diǎn)。雖然在物理上由多臺(tái)機(jī)器組成,但通過(guò)先進(jìn)的互聯(lián)和協(xié)同技術(shù),這個(gè)超節(jié)點(diǎn)可以像一臺(tái)超級(jí)計(jì)算機(jī)那樣統(tǒng)一地進(jìn)行機(jī)器學(xué)習(xí)、思考和推理。簡(jiǎn)單來(lái)說(shuō),超節(jié)點(diǎn)實(shí)現(xiàn)了大規(guī)模分布式硬件在軟件層面的高度集成與協(xié)同,讓成百上千個(gè)計(jì)算單元如同一個(gè)整體般高效運(yùn)作。

在此次大會(huì)上,華為發(fā)布了最新一代的AI超節(jié)點(diǎn)產(chǎn)品——Atlas 950 SuperPoD和Atlas 960 SuperPoD。其中,Atlas 950 SuperPoD可支持多達(dá)8192張昇騰AI加速卡,Atlas 960 SuperPoD則支持高達(dá)15488張昇騰卡。

這兩款超節(jié)點(diǎn)在總算力、內(nèi)存容量、互聯(lián)帶寬等關(guān)鍵指標(biāo)上均處于全球領(lǐng)先地位,在未來(lái)多年都將是世界上算力最強(qiáng)的超節(jié)點(diǎn)。發(fā)布了兩款重磅超節(jié)點(diǎn)產(chǎn)品,代表當(dāng)前全球最高算力水平:

產(chǎn)品型號(hào)Atlas 950 SuperPoDAtlas 960 SuperPoD
支持昇騰卡數(shù)量8192張15488張
FP8算力8 EFLOPS30 EFLOPS
FP4算力16 EFLOPS60 EFLOPS
互聯(lián)帶寬16.3 PB/s34 PB/s
機(jī)柜數(shù)量160個(gè)未披露
典型性能訓(xùn)練:491萬(wàn)tokens/秒<br>推理:1960萬(wàn)tokens/秒未披露
上市時(shí)間已發(fā)布2026年

Atlas SuperCluster超級(jí)集群

基于上述超節(jié)點(diǎn),華為進(jìn)一步構(gòu)建了規(guī)模更為龐大的超級(jí)集群系統(tǒng):

2

“靈衢”互聯(lián)協(xié)議:

突破大規(guī)?;ヂ?lián)瓶頸

要將成千上萬(wàn)臺(tái)服務(wù)器、數(shù)十萬(wàn)顆芯片整合成一個(gè)協(xié)同工作的整體,高速互聯(lián)網(wǎng)絡(luò)是關(guān)鍵中的關(guān)鍵。傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡(luò)多采用以太網(wǎng)或InfiniBand交換機(jī)級(jí)聯(lián),隨著節(jié)點(diǎn)數(shù)量增加,網(wǎng)絡(luò)延遲和帶寬瓶頸會(huì)愈發(fā)明顯。

華為此次發(fā)布的“靈衢”(UnifiedBus)高速互聯(lián)協(xié)議,正是為了解決大規(guī)模AI集群的互聯(lián)難題。靈衢協(xié)議是一種面向超節(jié)點(diǎn)的全新互聯(lián)架構(gòu),它采用了跨機(jī)柜全光互聯(lián)技術(shù),將傳統(tǒng)的電信號(hào)互聯(lián)升級(jí)為光互聯(lián),大幅提升了帶寬并降低了延遲。

據(jù)介紹,靈衢2.0在Atlas 950 SuperPoD中實(shí)現(xiàn)了34 PB/s的總互聯(lián)帶寬。這意味著集群內(nèi)部任意兩個(gè)計(jì)算節(jié)點(diǎn)之間都能以接近“無(wú)限帶寬”的方式通信,數(shù)據(jù)在超節(jié)點(diǎn)內(nèi)的傳輸幾乎不受瓶頸限制。

同時(shí),全光互聯(lián)避免了傳統(tǒng)電纜傳輸中的信號(hào)衰減和電磁干擾問(wèn)題,使延遲降低到極致。華為宣稱,靈衢互聯(lián)的速度比當(dāng)前互聯(lián)網(wǎng)骨干網(wǎng)快了一個(gè)數(shù)量級(jí),在連接數(shù)千顆加速器時(shí)依然能夠保持可靠的高速低延遲通信。這種“網(wǎng)絡(luò)即總線”的設(shè)計(jì),使得整個(gè)超節(jié)點(diǎn)如同擁有一個(gè)全局共享的高速總線,所有計(jì)算單元都可以像訪問(wèn)本地內(nèi)存一樣高效地交換數(shù)據(jù)。

更值得稱道的是,華為選擇開(kāi)放靈衢2.0的技術(shù)規(guī)范,邀請(qǐng)產(chǎn)業(yè)鏈伙伴共同參與生態(tài)建設(shè)。這意味著未來(lái)其他廠商也可以基于靈衢協(xié)議開(kāi)發(fā)光模塊、交換芯片、網(wǎng)卡等相關(guān)產(chǎn)品,從而形成一個(gè)圍繞高速互聯(lián)的開(kāi)放產(chǎn)業(yè)生態(tài)。

在當(dāng)前全球科技競(jìng)爭(zhēng)加劇的背景下,華為的這一舉措顯示出戰(zhàn)略眼光:通過(guò)開(kāi)放標(biāo)準(zhǔn)來(lái)壯大自身生態(tài),既可降低對(duì)外部技術(shù)的依賴,又能吸引更多合作伙伴,共同做大中國(guó)自主的AI基礎(chǔ)設(shè)施蛋糕。靈衢協(xié)議的推出和開(kāi)放,有望逐步打破美國(guó)廠商在高端數(shù)據(jù)中心互聯(lián)領(lǐng)域的壟斷,為中國(guó)乃至全球的算力網(wǎng)絡(luò)提供一個(gè)新的選擇。

3

產(chǎn)業(yè)影響:

重塑AI算力版圖

華為此次發(fā)布的“超節(jié)點(diǎn)+集群”算力方案,在全球AI產(chǎn)業(yè)界引發(fā)了巨大震動(dòng),其影響將是多方面的:

長(zhǎng)期以來(lái),美國(guó)企業(yè)在AI芯片和算力基礎(chǔ)設(shè)施領(lǐng)域占據(jù)主導(dǎo)地位,英偉達(dá)的GPU幾乎成為AI訓(xùn)練的代名詞。然而,華為的Ascend昇騰芯片和Atlas超算方案正迅速崛起,打破了這一格局。憑借Atlas 950/960 SuperCluster所展示的算力實(shí)力,華為已經(jīng)站到了全球AI算力金字塔的頂端。這不僅提升了中國(guó)在全球AI競(jìng)賽中的話語(yǔ)權(quán),也讓其他國(guó)家看到了除美國(guó)方案之外的另一種可能。

其次,它加速了中國(guó)AI產(chǎn)業(yè)的自主化進(jìn)程。在中美科技摩擦背景下,獲取最先進(jìn)的半導(dǎo)體工藝和芯片受到限制,這一度被認(rèn)為是中國(guó)AI發(fā)展的短板。然而華為通過(guò)“以規(guī)模補(bǔ)性能”的創(chuàng)新路徑,成功繞開(kāi)了部分限制,用現(xiàn)有工藝實(shí)現(xiàn)了世界領(lǐng)先的算力水平。

這極大地提振了中國(guó)科技界的信心:即便在高端芯片制造上暫時(shí)落后,也可以通過(guò)系統(tǒng)創(chuàng)新和協(xié)同優(yōu)化來(lái)彌補(bǔ)差距。此次發(fā)布的超節(jié)點(diǎn)和集群,其核心部件(如昇騰芯片、鯤鵬CPU、靈衢互聯(lián)等)均為國(guó)產(chǎn)自主設(shè)計(jì),標(biāo)志著中國(guó)在AI基礎(chǔ)設(shè)施核心技術(shù)上的自主可控取得了重大進(jìn)展。這將進(jìn)一步帶動(dòng)上下游產(chǎn)業(yè)鏈的發(fā)展,包括國(guó)產(chǎn)芯片制造、光通信器件、基礎(chǔ)軟件等領(lǐng)域,形成良性循環(huán)。

華為的方案在架構(gòu)上大膽創(chuàng)新,將原本用于超級(jí)計(jì)算機(jī)的大規(guī)模并行技術(shù)引入商用數(shù)據(jù)中心領(lǐng)域,開(kāi)創(chuàng)了“超節(jié)點(diǎn)”這一新的基礎(chǔ)設(shè)施形態(tài)。這一創(chuàng)新可能引發(fā)行業(yè)的跟隨和模仿,促使更多廠商探索通過(guò)系統(tǒng)級(jí)架構(gòu)創(chuàng)新來(lái)提升算力的方法。例如,全光互聯(lián)、液冷高密度集成、軟硬件深度協(xié)同等技術(shù),未來(lái)有望在業(yè)界得到更廣泛的應(yīng)用。

未來(lái)展望:華為的算力雄心

面對(duì)此次發(fā)布的震撼成果,華為對(duì)未來(lái)充滿信心。徐直軍表示,依托全球最強(qiáng)算力的超節(jié)點(diǎn)和集群,華為有能力為人工智能的長(zhǎng)期快速發(fā)展提供可持續(xù)且充裕的算力支持。

按照華為公布的Ascend昇騰芯片路線圖,其新一代AI芯片Ascend 950、960系列將在2026-2027年陸續(xù)推出,每代芯片的算力性能都將實(shí)現(xiàn)倍增。同時(shí),華為計(jì)劃將Atlas超節(jié)點(diǎn)集群規(guī)模在2027年擴(kuò)展到百萬(wàn)卡級(jí)別,屆時(shí)算力規(guī)模相比目前又將實(shí)現(xiàn)數(shù)量級(jí)的提升??梢韵胍?jiàn),華為的算力版圖將隨著芯片迭代和集群擴(kuò)張而不斷壯大,持續(xù)鞏固其在AI算力領(lǐng)域的領(lǐng)先地位。

華為在發(fā)布會(huì)上也明確了自身的戰(zhàn)略定位:做智能世界的“黑土地”,即專注于打造底層的算力基礎(chǔ)設(shè)施和平臺(tái),讓各行各業(yè)的AI應(yīng)用在上面生根發(fā)芽。這意味著華為未來(lái)將更加開(kāi)放合作,聯(lián)合產(chǎn)業(yè)伙伴共同繁榮AI生態(tài)。

例如,通過(guò)“靈衢”開(kāi)放生態(tài),華為希望吸引更多廠商參與高速互聯(lián)技術(shù)的研發(fā);通過(guò)MindSpore開(kāi)源AI框架和ModelArts平臺(tái),華為正打造從芯片、框架到應(yīng)用的全棧開(kāi)放生態(tài)。在可預(yù)見(jiàn)的未來(lái),華為將繼續(xù)加大研發(fā)投入(2024年研發(fā)投入達(dá)1797億元人民幣,占收入20.8%),在先進(jìn)芯片設(shè)計(jì)、新型計(jì)算架構(gòu)、基礎(chǔ)軟件等方面持續(xù)攻關(guān),以保持技術(shù)領(lǐng)先優(yōu)勢(shì)。

分享到

lixiangjing

算力豹主編

相關(guān)推薦