報(bào)告系統(tǒng)梳理了AI技術(shù)正如何從“從推理到行動(dòng)”,并聚焦基礎(chǔ)模型演進(jìn)、智能體崛起、AI走向物理世界三大關(guān)鍵領(lǐng)域,展現(xiàn)AI從“智能工具”走向“共生伙伴”的演化路徑,描繪出人與AI協(xié)作共生、共創(chuàng)未來(lái)的全新圖景。

騰訊研究院資深研究員徐思彥在現(xiàn)場(chǎng)指出:“2025年是AI從推理智能邁向行動(dòng)智能的關(guān)鍵拐點(diǎn)。AI不再只是一個(gè)可調(diào)用的工具,而是正在成長(zhǎng)為人類(lèi)的生產(chǎn)力伙伴與決策合伙人。這一變革將深刻重塑社會(huì)結(jié)構(gòu)與協(xié)作模式?!?/p>

騰訊研究院資深研究員徐思彥

模型躍遷:強(qiáng)化學(xué)習(xí)推動(dòng)模型自進(jìn)化,多模態(tài)原生融合正成主流

報(bào)告指出,AI基礎(chǔ)模型正在經(jīng)歷深層次演進(jìn),其核心競(jìng)爭(zhēng)力正從“數(shù)據(jù)+規(guī)?!鞭D(zhuǎn)向“自我優(yōu)化+多模態(tài)原生融合”。

強(qiáng)化學(xué)習(xí)正在成為大模型后訓(xùn)練的關(guān)鍵技術(shù),推動(dòng)AI從“語(yǔ)言生成器”向“任務(wù)執(zhí)行者”演進(jìn),實(shí)現(xiàn)自主工具使用與復(fù)雜任務(wù)執(zhí)行。特別是在金融、政務(wù)等垂直場(chǎng)景中,強(qiáng)化學(xué)習(xí)有望突破數(shù)據(jù)稀缺與安全壁壘,加速專(zhuān)業(yè)化模型落地。

原生多模態(tài)能力的提升,也標(biāo)志著AI感知與交互方式的革命性升級(jí)。報(bào)告指出,通過(guò)構(gòu)建統(tǒng)一的跨模態(tài)表示空間,并引入端到端學(xué)習(xí)架構(gòu),原生多模態(tài)模型實(shí)現(xiàn)了感知、理解與生成的高效協(xié)同。其“所見(jiàn)即所得”的閉環(huán)體驗(yàn),將成為推動(dòng)下一輪AI應(yīng)用創(chuàng)新的核心動(dòng)力。

在聲音智能方面,語(yǔ)音合成已突破機(jī)械感表達(dá),進(jìn)入具備情緒理解與擬人化表達(dá)的新階段;音樂(lè)生成從實(shí)驗(yàn)工具成長(zhǎng)為高可控的創(chuàng)作平臺(tái),聲音AI正從輔助工具邁向擁有情感表達(dá)能力的“智能共創(chuàng)者”。

Agent生態(tài):AI正成為“共生伙伴

報(bào)告認(rèn)為,AI Agent正成為AI產(chǎn)業(yè)的重要拐點(diǎn)。從2023年的探索實(shí)踐,到如今加速落地,智能體技術(shù)已進(jìn)入大規(guī)模生產(chǎn)應(yīng)用階段,形成編排類(lèi)+端到端模型雙軌并進(jìn)的生態(tài)格局。

在企業(yè)場(chǎng)景中,Agent正深度嵌入政務(wù)、金融、工業(yè)、醫(yī)療等流程,承擔(dān)起分析、執(zhí)行、優(yōu)化等關(guān)鍵職能,從“工具”演進(jìn)為真正的“數(shù)字員工”,與人類(lèi)員工互補(bǔ)協(xié)作。

在個(gè)人生活中,AI正演化為L(zhǎng)ifeOS——一個(gè)具備長(zhǎng)期記憶、具身感知、多角色協(xié)同的“終身智能系統(tǒng)”。報(bào)告指出,這種AI不僅能陪伴用戶(hù),更能協(xié)助其完成復(fù)雜決策,實(shí)現(xiàn)真正意義上的個(gè)性化生活協(xié)同。正如騰訊研究院徐思彥所說(shuō):“從零散對(duì)話,到‘認(rèn)識(shí)你是誰(shuí)’,未來(lái)的AI不只是會(huì)回答問(wèn)題的聊天工具,而是一位了解過(guò)去、陪伴當(dāng)下、引領(lǐng)未來(lái)的‘共生伙伴’。”

在虛擬世界中,游戲智能體也正由“NPC”進(jìn)化為具備情感反應(yīng)和持續(xù)學(xué)習(xí)能力的“共創(chuàng)者”,將深刻改變虛擬互動(dòng)體驗(yàn),并且可以成為社會(huì)模擬的虛擬實(shí)驗(yàn)場(chǎng)。

從比特到原子:AI正走向物理世界的深度融合

報(bào)告強(qiáng)調(diào),AI的能力邊界正在從比特世界快速延伸至物理世界,進(jìn)入“從虛擬到現(xiàn)實(shí)”的躍遷期??臻g智能讓AI初步具備了理解和處理三維世界的核心能力,能夠像預(yù)測(cè)下一個(gè)詞元(Token)一樣去預(yù)測(cè)下一個(gè)體素(Voxel),使AI具備感知、理解乃至操控三維空間的能力,賦能自動(dòng)駕駛、智慧制造、XR等新一代空間智能場(chǎng)景。

尤其值得關(guān)注的是,“具身智能”正迎來(lái)類(lèi)GPT-2的關(guān)鍵突破。以VLA(視覺(jué)-語(yǔ)言-動(dòng)作)多模態(tài)大模型為代表的創(chuàng)新,使得機(jī)器人具備從感知到執(zhí)行的閉環(huán)智能鏈路。AI不再局限于算法演示,而是在真實(shí)物理環(huán)境中具備自主學(xué)習(xí)與適應(yīng)能力,開(kāi)始邁入從實(shí)驗(yàn)室走向商業(yè)落地的量產(chǎn)階段。

騰訊研究院資深研究員徐思彥指出,具身智能已被上升至國(guó)家戰(zhàn)略高度,伴隨技術(shù)突破與應(yīng)用拓展,機(jī)器人正成為下一個(gè)“超級(jí)終端”,隨著機(jī)器人向工業(yè)、物流、服務(wù)等多場(chǎng)景滲透,具身智能正逐步承擔(dān)起重復(fù)性、高風(fēng)險(xiǎn)、低技能崗位的工作。

報(bào)告提到,AI正在從“通用工具”向“專(zhuān)屬助手”演進(jìn),成為每個(gè)人的數(shù)字搭檔、每家企業(yè)的智能勞動(dòng)力、每個(gè)行業(yè)的增長(zhǎng)引擎。隨著AI從“可用”邁向“好用”,它不僅提升效率,更將重塑組織結(jié)構(gòu)、優(yōu)化社會(huì)協(xié)作、拓展人類(lèi)認(rèn)知邊界,成為推動(dòng)社會(huì)變革的核心動(dòng)力。

分享到

zhupb

相關(guān)推薦