華為未來三年芯片規(guī)劃

對于昇騰950PR/950DT:計劃于2026年推出,其中950PR將于2026年第一季度率先面世。這兩款芯片是昇騰910系列的下一代產品,定位為面向訓練和推理的高性能AI加速芯片。據(jù)介紹,昇騰950系列將支持更低精度的數(shù)據(jù)格式和增強的向量計算能力,并將芯片間互聯(lián)帶寬提升2.5倍,以適應大模型訓練對高帶寬低延遲通信的需求。

華為昇騰950系列芯片架構

值得一提的是,950PR將采用華為自研的高帶寬內存(HBM)技術,以顯著提升推理預填充(Prefill)階段的性能,特別有利于推薦系統(tǒng)等應用;而950DT則著重提升推理解碼(Decode)性能和訓練性能,并進一步擴大內存容量和帶寬。

昇騰950PR

而950DT則著重提升推理解碼(Decode)性能和訓練性能,并進一步擴大內存容量和帶寬。

昇騰950DT

據(jù)徐直軍介紹,華為昇騰芯片的演進將圍繞“算力一年翻一番”的目標來推進,并兼顧更易用、更多數(shù)值類型支持、更高互聯(lián)帶寬等方向持續(xù)改進。這表明華為不僅追求絕對算力的提升,也注重提升芯片的軟件生態(tài)友好性和系統(tǒng)集成能力,使昇騰芯片能夠更好地適配多樣化的AI應用場景。

2

“超節(jié)點+集群”:

以架構創(chuàng)新彌補單芯片差距

正如徐直軍所言,美國制裁導致華為無法采用最先進工藝制造單顆芯片,使其單芯片算力與英偉達等存在差距。但華為憑借三十多年在聯(lián)接技術上的深厚積累,通過架構創(chuàng)新打造“萬卡級超節(jié)點”,依然能夠提供世界最強的算力。這一策略被業(yè)內視為中國科技企業(yè)在高端芯片受限下實現(xiàn)“彎道超車”的關鍵路徑。

在本次大會上,華為正式發(fā)布了最新一代超節(jié)點產品——Atlas 950 SuperPoDAtlas 960 SuperPoD。其中,Atlas 950 SuperPoD可支持8192張昇騰加速卡組成一個超節(jié)點,Atlas 960 SuperPoD則可支持多達15488張昇騰卡。這兩款超節(jié)點在總算力、內存容量、互聯(lián)帶寬等關鍵指標上全面領先業(yè)界現(xiàn)有產品,在未來多年都將是全球算力最強的AI超節(jié)點?;谶@些超節(jié)點,華為進一步構建了超節(jié)點集群:Atlas 950 SuperCluster集群的總算力規(guī)模超過50萬張卡,而Atlas 960 SuperCluster更是達到了百萬張卡的規(guī)模,堪稱“全世界最強算力集群”。如此龐大的算力集群,將為大規(guī)模AI模型訓練和復雜應用提供充裕的、可持續(xù)的算力支撐。

華為之所以能夠實現(xiàn)萬卡級的超大規(guī)模AI計算,得益于其在高速互聯(lián)技術上的突破。徐直軍透露,華為基于三十多年在聯(lián)接領域的技術積累,自主研發(fā)了面向超節(jié)點的互聯(lián)協(xié)議——靈衢”(UnifiedBus)。

靈衢協(xié)議創(chuàng)新性地解決了大規(guī)模集群互聯(lián)的技術難題,實現(xiàn)了超節(jié)點內部各計算節(jié)點之間的高速、低延遲通信,從而讓整個超節(jié)點像單一計算機般高效運行。

據(jù)介紹,靈衢協(xié)議的最新版本2.0已經(jīng)開放技術規(guī)范,華為歡迎產業(yè)界伙伴基于靈衢協(xié)議研發(fā)相關產品和部件,共同構建開放的“靈衢生態(tài)”。這種開放合作的態(tài)度,有助于加速超節(jié)點技術的普及,推動整個行業(yè)的創(chuàng)新。

值得注意的是,華為的“超節(jié)點+集群”方案并非僅適用于AI訓練領域。徐直軍宣布,華為率先將超節(jié)點技術引入通用計算領域,推出了全球首個通用計算超節(jié)點——TaiShan 950 SuperPoD。該超節(jié)點結合華為GaussDB分布式數(shù)據(jù)庫,能夠徹底取代傳統(tǒng)大型機、小型機以及Exadata等數(shù)據(jù)庫一體機,成為各類大型商用系統(tǒng)的新選擇。這意味著,華為正將其在AI超算領域的架構創(chuàng)新拓展到更廣泛的企業(yè)級計算場景,為客戶提供高性能、高可靠且可擴展的通用算力解決方案。

3

通算與AI融合:

鯤鵬芯片同步演進

除了AI加速芯片,華為在通用計算芯片領域也有長遠布局。徐直軍在大會上同步公布了華為鯤鵬通用處理器的路線圖,以配合AI時代對通用算力的需求。根據(jù)規(guī)劃,華為將推出鯤鵬950和鯤鵬960兩款新一代通用CPU,分別計劃于2026年第四季度和2028年第一季度上市。這兩款芯片將圍繞支持超節(jié)點架構、更大核心數(shù)、更高單核性能的方向持續(xù)演進。

鯤鵬950作為下一代通用CPU,預計將在核心規(guī)模和性能上相比上一代鯤鵬930有顯著提升。據(jù)業(yè)內消息,鯤鵬950可能采用更加先進的制程工藝(盡管受限于制裁,具體工藝節(jié)點尚未公布),核心數(shù)有望從當前的64核提升到96核甚至更高,并支持雙線程超線程技術,以提供更強的并行處理能力。同時,鯤鵬950將針對超節(jié)點架構進行優(yōu)化設計,使其能夠更好地與昇騰AI芯片協(xié)同工作,在大規(guī)模分布式計算場景下發(fā)揮出整體效能。

鯤鵬960則是面向2028年的旗艦通用CPU,定位為高性能和高核數(shù)兩個版本:高性能版本預計擁有96核心/192線程,著重提升單核性能(目標是較上一代提升50%以上),面向AI主機、大型數(shù)據(jù)庫等對單線程性能要求極高的場景;高核數(shù)版本則計劃集成256核心/512線程以上,主打虛擬化、容器云、大數(shù)據(jù)和數(shù)據(jù)倉庫等需要大規(guī)模并發(fā)的場景。通過這兩種版本,鯤鵬960將實現(xiàn)對不同應用負載的全面覆蓋,既滿足需要極致單核性能的任務,也滿足需要海量并發(fā)的任務需求。

結語:擁抱全面智能化時代

徐直軍在華為全聯(lián)接大會2025上的演講,不僅是一次新品發(fā)布,更是華為面向未來的一次戰(zhàn)略宣示。通過公布昇騰芯片的三年路線圖和“超節(jié)點+集群”的創(chuàng)新方案,華為向世界展示了其在AI算力領域的雄心和實力。

對于中國AI產業(yè)而言,華為的突破具有里程碑意義。它意味著我們擁有了自主的高端AI芯片和計算架構,能夠在新一輪科技革命中掌握更多主動權。在全球科技競爭日趨激烈的背景下,這種自主創(chuàng)新能力彌足珍貴。當然,我們也應清醒地認識到,實現(xiàn)科技自立自強是一個長期過程,需要持續(xù)的投入和積累。華為的成功經(jīng)驗告訴我們,核心技術要不來、買不來,只能靠自己干出來。在制裁壓力下,華為選擇了迎難而上,通過技術創(chuàng)新和生態(tài)構建突出重圍,這種精神值得整個科技界學習。

展望未來,隨著昇騰950、960、970等新一代芯片的陸續(xù)推出,以及超節(jié)點集群在更多領域的部署應用,我們有理由相信中國將在AI算力領域取得更大的突破。一個算力充沛、技術自主、生態(tài)繁榮的AI時代正加速到來。正如徐直軍所說:“人工智能已成為對行業(yè)發(fā)展影響最大的變量”。華為正以自己的方式擁抱這個全面智能化的時代,并將與產業(yè)伙伴一道,推動人工智能技術在千行百業(yè)的廣泛應用,創(chuàng)造更大的價值。

分享到

lixiangjing

算力豹主編

相關推薦