面對全球智能化浪潮,華為已構(gòu)建覆蓋硬件、算力、大模型、應用開放平臺在內(nèi)的全鏈條技術能力。
在芯片方面,華為打破技術封鎖公布了未來三年的昇騰芯片演進規(guī)劃和目標,將于明年第一季度發(fā)布昇騰950PR,明年第四季度發(fā)布昇騰950DT,2027年第四季度要發(fā)布昇騰960、2028年發(fā)布昇騰970,這將為超節(jié)點集群進化提供核心驅(qū)動力。
在算力方面,超節(jié)點架構(gòu)也持續(xù)跨越迭代,此次華為還全新發(fā)布了最新超節(jié)點產(chǎn)品Atlas 950 SuperPoD和Atlas 960 SuperPoD超節(jié)點,分別支持8192及15488張昇騰卡,在卡規(guī)模、總算力、內(nèi)存容量、互聯(lián)帶寬等關鍵指標上全面領先,在未來多年都將是全球最強算力的超節(jié)點。
面向全行業(yè)持續(xù)涌現(xiàn)的Agent需求,Token服務可以有效屏蔽復雜的底層技術實現(xiàn),是最高效的推理算力使用方式。會上,張平安還宣布華為云CloudMatrix384 AI Token推理服務全面上線,基于384原生的xDeepServe框架也實現(xiàn)了吞吐量提升至2400TPS,TPOT僅為50ms,遠超業(yè)界水平,未來將以優(yōu)的性能、好的服務、高的質(zhì)量,高效滿足各行各業(yè)所需的“最終AI計算結(jié)果”。
在線、近線和離線等不同時延要求推理場景中,CloudMatrix384的平均單卡推理性能是中國特供H20的3~4倍。目前、華為已經(jīng)為Pangu,DeepSeek,Qwen等業(yè)界主流大模型提供極致的Token服務,加速各行業(yè) AI 技術落地與業(yè)務創(chuàng)新。
360納米AI依托CloudMatrix384的Token推理服務,成功處理每天上千萬的內(nèi)容生成請求。360集團創(chuàng)始人周鴻祎表示:“衡量智能體的能力,就是衡量它使用的算力,我們做了L4級智能體——蜂群智能體,就是有十幾個智能體像一個團隊一樣為你協(xié)作,做超級復雜的任務,但5~10分鐘的視頻能消耗千萬級Token,對算力的消耗非常巨大,華為云的算力架構(gòu)能夠完美地支持多個基座大模型的共同工作?!?/p>
面向Agent行業(yè)落地的最后一公里,Versatile開發(fā)平臺支持可視化業(yè)務邏輯編排,自動生成API接口與執(zhí)行引擎,讓企業(yè)開發(fā)Agent不再有卡點。張平安表示,華為云Versatile企業(yè)級智能體平臺目標是構(gòu)建易用、好用、開放的AI Agent平臺,幫助千行萬業(yè)快速開發(fā)出各種多才多藝的AI Agent,讓員工更輕松更專業(yè)地工作,讓企業(yè)更敏捷地創(chuàng)新、更高效地服務自己的客戶。
目前,Versatile平臺也與政務、醫(yī)療、制造、電力、差旅、零售、交通等行業(yè)客戶合作,構(gòu)建深耕行業(yè)的專業(yè)Agent助手,通過搭建企業(yè)級數(shù)字化AI產(chǎn)線,幫助企業(yè)實現(xiàn)業(yè)務效率的飛速提升。