文字編輯|宋雨涵
1
技術(shù)突破
模型綜合性能SOTA
在Hugging Face平臺(tái),開發(fā)者們連夜下載的模型文件包揭示著這場(chǎng)革命的技術(shù)內(nèi)核。采用混合專家(MoE)架構(gòu)的GLM-4.5系列包含兩個(gè)版本:旗艦版以3550億參數(shù)實(shí)現(xiàn)320億激活參數(shù),輕量版GLM-4.5-Air則保持1060億總參數(shù)與120億激活參數(shù)。這種精妙設(shè)計(jì)讓模型在維持強(qiáng)大性能的同時(shí),大幅降低了計(jì)算成本。
“這是首次有模型將三大核心能力在架構(gòu)層面實(shí)現(xiàn)原生統(tǒng)一,”智譜首席架構(gòu)師在技術(shù)白皮書中強(qiáng)調(diào)。傳統(tǒng)方案需要組合多個(gè)專用模型才能實(shí)現(xiàn)的復(fù)雜任務(wù),如今在單一模型中即可完成閉環(huán)。在權(quán)威的12項(xiàng)綜合評(píng)測(cè)中,GLM-4.5交出了震撼業(yè)界的答卷:GLM-4.5取得了全球模型第三、國(guó)產(chǎn)模型第一、開源模型第一的優(yōu)異成績(jī)。
更驚人的是新一代GLM-4.5實(shí)現(xiàn)了更高參數(shù)效率:
其參數(shù)量為DeepSeek-R1的1/2、Kimi-K2的1/3,但在多項(xiàng)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中表現(xiàn)得更為出色。在衡量模型代碼能力的SWE-benchVerified榜單上,GLM-4.5系列位于性能/參數(shù)比帕累托前沿,表明在相同規(guī)模下GLM-4.5系列實(shí)現(xiàn)了最佳性能。
低成本、高速度:
除性能優(yōu)化外,GLM-4.5系列在成本控制與效率提升方面同樣表現(xiàn)卓越,其API定價(jià)顯著低于行業(yè)主流水平:輸入價(jià)格低至0.8元/百萬(wàn)tokens,輸出價(jià)格僅2元/百萬(wàn)tokens。
在響應(yīng)速度上,高速版本實(shí)測(cè)生成速率突破100 tokens/秒,可充分滿足低延遲、高并發(fā)的實(shí)際部署場(chǎng)景需求,實(shí)現(xiàn)成本效益與交互流暢性的雙重保障。
2
雙模引擎
重構(gòu)人機(jī)協(xié)作邏輯
GLM-4.5引入革命性的混合推理架構(gòu),如同為AI裝上“雙模式變速器”:
思考模式(Thinking Mode):深度啟動(dòng)鏈?zhǔn)酵评?,自主分解?fù)雜任務(wù),調(diào)用工具完成多步操作。
非思考模式(Non-Thinking Mode):極速響應(yīng)即時(shí)需求,對(duì)話延遲降至毫秒級(jí)。
實(shí)際演示中,模型展現(xiàn)了令人驚嘆的自主任務(wù)閉環(huán)能力。當(dāng)用戶要求“制作一份人工智能安全的PPT”時(shí),GLM-4.5自動(dòng)完成資料搜索、配圖篩選、HTML代碼編寫全過程,最終輸出專業(yè)排版的演示文檔。
在編程智能體實(shí)測(cè)中,面對(duì)52個(gè)涵蓋全棧開發(fā)的真實(shí)任務(wù),GLM-4.5在任務(wù)完成度和工具調(diào)用可靠性上超越同類開源模型,部分場(chǎng)景甚至可平替Claude-4-Sonnet。
開發(fā)效率的提升更為直觀:通過Three.js構(gòu)建3D交互地球、設(shè)計(jì)可記錄數(shù)據(jù)的“量子功德箱”等應(yīng)用,開發(fā)周期從小時(shí)級(jí)壓縮至分鐘級(jí)。
三、開源博弈重構(gòu)AI產(chǎn)業(yè)權(quán)力版圖
GLM-4.5的發(fā)布恰逢中國(guó)大模型格局劇變時(shí)刻。2025年WAIC大會(huì)顯露了殘酷的行業(yè)洗牌:“大模型六小虎”中,百川智能轉(zhuǎn)向醫(yī)療賽道,零一萬(wàn)物聚焦企業(yè)服務(wù),僅剩智譜、階躍星辰、MiniMax、月之暗面四家堅(jiān)守基礎(chǔ)模型研發(fā)。
階躍星辰在同一周發(fā)布Step-3模型,其CEO姜大昕坦言:“堅(jiān)持做基礎(chǔ)大模型的公司會(huì)越來越少,這非常艱苦且投入巨大”。
企業(yè)名稱 | 最新動(dòng)向 | 技術(shù)特點(diǎn) |
智譜AI | 發(fā)布GLM-4.5開源模型 | 原生三能力融合,MoE架構(gòu) |
階躍星辰 | 推出Step-3模型 | 3210億參數(shù),全年目標(biāo)營(yíng)收10億 |
月之暗面 | 展示Kimi2模型 | 強(qiáng)化代碼與Agentic能力 |
MiniMax | 展示多款A(yù)I原生應(yīng)用 | 聚焦多Agent系統(tǒng)開發(fā) |
百川智能 | 轉(zhuǎn)向醫(yī)療領(lǐng)域 | 放棄基礎(chǔ)模型研發(fā) |
零一萬(wàn)物 | 聚焦企業(yè)服務(wù) | 推出法律智算云服務(wù) |
經(jīng)過先前的AI領(lǐng)域“百模爭(zhēng)鋒”的激烈角逐,智譜GLM-4.5的驚艷亮相,無疑為這場(chǎng)競(jìng)賽的下半場(chǎng)確立了全新的標(biāo)桿。
它不僅在多個(gè)核心評(píng)測(cè)項(xiàng)目中摘得國(guó)產(chǎn)與開源領(lǐng)域的桂冠,更引人注目的是,它為我們揭示了一條更為高效、集成且富有遠(yuǎn)見的技術(shù)發(fā)展路徑。在眾多廠商競(jìng)相追逐千億乃至萬(wàn)億參數(shù)規(guī)模的“技術(shù)軍備賽”背景下,智譜展現(xiàn)出了獨(dú)到的戰(zhàn)略眼光。
更值得關(guān)注的是資本市場(chǎng)的動(dòng)向。2025年智譜融資節(jié)奏明顯加快:杭州、珠海、成都國(guó)資相繼戰(zhàn)略投資,7月初獲浦東創(chuàng)投與張江集團(tuán)10億元注資。今年4月在北京證監(jiān)局完成的上市輔導(dǎo)備案,則預(yù)示著中國(guó)或?qū)⒄Q生首家本土大模型上市公司。
結(jié)語(yǔ):
GLM-4.5的發(fā)布不僅是一次技術(shù)里程碑,更是AI產(chǎn)業(yè)發(fā)展的分水嶺。其三重能力的原生融合標(biāo)志著大模型正式跨越工具屬性,進(jìn)化為可自主完成復(fù)雜任務(wù)的智能體基座;突破性的成本控制則徹底打破算力壟斷,使千億級(jí)模型首次具備規(guī)?;涞乜赡?。