2025年7月11日,成立僅兩年的中國(guó)AI初創(chuàng)公司——月之暗面(Moonshot AI),正式宣布將其自主研發(fā)的Kimi K2大模型在開(kāi)源社區(qū)全面開(kāi)放。此舉不僅標(biāo)志著全球首個(gè)可商用的萬(wàn)億參數(shù)級(jí)大語(yǔ)言模型(LLM) 面世,更因其獨(dú)特的Agentic Intelligence(自主代理智能) 設(shè)計(jì)定位、在關(guān)鍵性能指標(biāo)上對(duì)包括GPT-4.1在內(nèi)的頂尖模型實(shí)現(xiàn)顯著超越,以及極具競(jìng)爭(zhēng)力的成本優(yōu)勢(shì),瞬間引爆全球科技界與產(chǎn)業(yè)界的廣泛關(guān)注。

本次開(kāi)源的共有兩款模型,分別是基礎(chǔ)模型Kimi-K2-Base與微調(diào)后模型Kimi-K2-Instruct,均可商用。

文字編輯|宋雨涵

1

技術(shù)核爆:

萬(wàn)億MoE架構(gòu)的三大突破

混合專(zhuān)家架構(gòu)(MoE)的極致優(yōu)化

Kimi K2采用1萬(wàn)億參數(shù)總量的MoE設(shè)計(jì),每次推理僅激活32B參數(shù)(占總量的3.2%),通過(guò)384個(gè)領(lǐng)域?qū)<覄?dòng)態(tài)路由至8個(gè)活躍專(zhuān)家+1個(gè)共享專(zhuān)家,實(shí)現(xiàn)“知識(shí)廣度”與“計(jì)算效率”的平衡。其關(guān)鍵創(chuàng)新包括:

終結(jié)訓(xùn)練災(zāi)難:MuonClip優(yōu)化器的革命

傳統(tǒng)萬(wàn)億級(jí)模型訓(xùn)練常因注意力層數(shù)值爆炸導(dǎo)致30%算力浪費(fèi)。月之暗面自研的MuonClip優(yōu)化器引入動(dòng)態(tài)反饋機(jī)制:

實(shí)時(shí)監(jiān)測(cè)注意力logit絕對(duì)值,若超過(guò)閾值??則自動(dòng)縮放查詢(xún)(Query)/鍵(Key)矩陣,如同為訓(xùn)練過(guò)程安裝“動(dòng)態(tài)保險(xiǎn)絲”。該技術(shù)使Kimi K2在15.5萬(wàn)億token訓(xùn)練中實(shí)現(xiàn)“零崩潰”,為行業(yè)首次驗(yàn)證超大規(guī)模MoE的穩(wěn)定訓(xùn)練方案。

大規(guī)模Agentic數(shù)據(jù)合成

為讓模型具備自治能力,Kimi K2構(gòu)建了一個(gè)ACE-style的仿真流水線:

Agentic數(shù)據(jù)合成的過(guò)程是Agent與模擬環(huán)境和用戶(hù)代理交互,創(chuàng)建逼真的多輪工具使用場(chǎng)景。再使用大模型根據(jù)任務(wù)準(zhǔn)則評(píng)估模擬結(jié)果,篩選出高質(zhì)量的訓(xùn)練數(shù)據(jù)。這個(gè)可擴(kuò)展的流程可以生成多樣化的高質(zhì)量數(shù)據(jù),為大規(guī)模拒絕采樣和強(qiáng)化學(xué)習(xí)奠定基礎(chǔ)。

2

性能碾壓:

國(guó)產(chǎn)開(kāi)源模型的“弒神時(shí)刻”

在SWE Bench Verified、Tau2、AceBench等基準(zhǔn)測(cè)試中,Kimi K2均取得開(kāi)源模型最優(yōu)成績(jī)(SOTA)。具體來(lái)看:

自主編程(Agentic Coding):在SWE-bench Verified測(cè)試中,Kimi K2成績(jī)僅次于Claude 4 Opus,優(yōu)于DeepSeek-V3和Qwen3。例如,其生成的“3D HTML山脈場(chǎng)景”代碼支持粒子系統(tǒng)、晝夜光照變化和拖拽縮放功能,展現(xiàn)了強(qiáng)大的圖形渲染能力。

工具調(diào)用(Tool Use):在復(fù)雜指令拆解任務(wù)中,Kimi K2可自動(dòng)生成結(jié)構(gòu)化的ToolCall代碼,完成演唱會(huì)行程規(guī)劃、數(shù)據(jù)可視化等任務(wù)。測(cè)試中,其規(guī)劃的“Coldplay樂(lè)隊(duì)巡演行程”包含機(jī)酒預(yù)訂、日歷生成和HTML報(bào)告,雖網(wǎng)頁(yè)呈現(xiàn)質(zhì)量待提升,但信息完整度遠(yuǎn)超同類(lèi)模型。

數(shù)學(xué)推理(Math & Reasoning):在AceBench測(cè)試中,Kimi K2的推理準(zhǔn)確率較前代模型提升22%,尤其在多步邏輯題中表現(xiàn)突出。

Kimi K2的API定價(jià)低至輸入token每百萬(wàn)$0.60,輸出token每百萬(wàn)$2.50,僅為Claude 4 Sonnet的1/5。價(jià)格優(yōu)勢(shì)疊加開(kāi)源協(xié)議(修改版MIT協(xié)議),已推動(dòng)Perplexity等國(guó)際公司啟動(dòng)適配測(cè)試,國(guó)內(nèi)開(kāi)發(fā)者社區(qū)涌現(xiàn)VS Code的Cline/RooCode插件生態(tài)。

挑戰(zhàn)與未來(lái):萬(wàn)億模型的“重力與羽翼”

現(xiàn)實(shí)瓶頸

部署門(mén)檻:1.01TB模型體積使本地運(yùn)行需專(zhuān)業(yè)級(jí)硬件(8×A100起),普通開(kāi)發(fā)者依賴(lài)API但面臨低額度賬戶(hù)速率限制;

模態(tài)缺失:當(dāng)前僅支持文本處理,在醫(yī)療、工業(yè)等多模態(tài)場(chǎng)景中受限;

任務(wù)分解魯棒性:模糊指令下可能輸出冗長(zhǎng)響應(yīng),單次查詢(xún)效果弱于持續(xù)會(huì)話。

下一代演進(jìn)方向

據(jù)全球計(jì)算聯(lián)盟(GCC)預(yù)測(cè),智能計(jì)算將向 “光電異構(gòu)架構(gòu)” 突破——光芯片與AI融合可打破算力與能效邊界,而Kimi K2的MoE設(shè)計(jì)為此類(lèi)硬件革新提供了理想軟件載體。

結(jié)語(yǔ):

Kimi K2的誕生標(biāo)志著AI競(jìng)爭(zhēng)進(jìn)入新維度:規(guī)模不再是壁壘,行動(dòng)力才是王道。當(dāng)硅谷專(zhuān)注于“更聰明的思考”,月之暗面用開(kāi)源萬(wàn)億參數(shù)Agent模型證明:中國(guó)AI的終極野心,是成為智能時(shí)代的“行動(dòng)引擎”。

分享到

lixiangjing

算力豹主編

相關(guān)推薦