騰訊云副總裁、騰訊云智能負(fù)責(zé)人、騰訊優(yōu)圖實驗室負(fù)責(zé)人吳運聲

在技術(shù)演進(jìn)層面,吳運聲指出,當(dāng)前大多數(shù)AI系統(tǒng)仍處于“短期記憶”階段,尚難支撐復(fù)雜、高維的業(yè)務(wù)場景。要實現(xiàn)AI的實用性躍遷,需突破三個關(guān)鍵方向:

第一,具備“長期記憶”能力,能夠處理長鏈任務(wù)、跨對話記憶關(guān)鍵信息,并根據(jù)上下文動態(tài)進(jìn)化,打通任務(wù)鏈條,實現(xiàn)真正意義上的任務(wù)執(zhí)行閉環(huán);

第二,邁向“全模態(tài)交互”,融合語言、圖像等多模態(tài)輸入輸出,推動AI從理解語言走向理解世界,從“能答”躍升為“能動”;

第三,構(gòu)建“多智能體協(xié)同”架構(gòu),通過任務(wù)拆解、容錯補(bǔ)位等機(jī)制,構(gòu)成自組織、自進(jìn)化的“AI團(tuán)隊”,全面提升系統(tǒng)的魯棒性與可靠性。

在模型迭代方面,騰訊混元大模型持續(xù)“小步快跑”,推進(jìn)技術(shù)性能與工程能力雙重突破。騰訊最新發(fā)布的TurboS,是業(yè)界首個落地的超大規(guī)?;旌暇€性MoE模型,以“性能強(qiáng)、推理快、成本低”的優(yōu)勢穩(wěn)居全球權(quán)威榜單前列。在生成領(lǐng)域,混元模型不僅能極速生成高清圖像,更具備領(lǐng)先的3D建模能力,已廣泛應(yīng)用于AI設(shè)計智能體Lovart、3D打印平臺MakerWorld,模型社區(qū)下載量已超過230萬次。

在平臺工具與生態(tài)建設(shè)上,騰訊形成了覆蓋B端與C端的“雙平臺”智能體體系。面向企業(yè)用戶,騰訊云智能體開發(fā)平臺支持多Agent協(xié)同、任務(wù)流編排和多形態(tài)部署,具備強(qiáng)大的系統(tǒng)集成與業(yè)務(wù)適配能力。本次升級新增了零代碼多Agent協(xié)同機(jī)制、千萬行級表格問答支持以及智能工作流動態(tài)調(diào)整功能,已應(yīng)用于如QQ瀏覽器QBot的全自動任務(wù)執(zhí)行系統(tǒng),以及與邯鄲公積金中心共建的“數(shù)字柜臺”,后者已實現(xiàn)政務(wù)處理效率提升80%。

面向個人創(chuàng)作者,騰訊元器平臺聚焦公眾號智能體的構(gòu)建與生態(tài)拓展,打通騰訊文檔、微信支付MCP等資源,支持一鍵同步知識庫、自動分發(fā)等功能。育兒類賬號“童爸育兒”通過元器平臺構(gòu)建AI分身,7×24小時自動答疑,準(zhǔn)確率超過95%,已累計服務(wù)6萬多個家庭。

“AI不僅服務(wù)產(chǎn)業(yè),更承載著科技向善的信念。”吳運聲表示,騰訊也正持續(xù)拓展AI在科研與文化等領(lǐng)域的邊界探索。

在科技領(lǐng)域,騰訊聯(lián)合科研團(tuán)隊打造了全球首個甲骨文多模態(tài)數(shù)據(jù)集,并應(yīng)用AI能力輔助文物修復(fù)。在天文科研中,AI探星計劃已協(xié)助發(fā)現(xiàn)45顆新脈沖星,推動AI與基礎(chǔ)科學(xué)研究的深入結(jié)合,努力實現(xiàn)技術(shù)與文明的良性互動,為可持續(xù)未來打開更多可能。

面向未來,騰訊也在推動智能體技術(shù)的人才培育與應(yīng)用創(chuàng)新。7月27日,騰訊云正式啟動首屆黑客松Agent應(yīng)用創(chuàng)新挑戰(zhàn)賽,面向?qū)W生、企業(yè)與個人開發(fā)者,鼓勵通過零代碼或低代碼方式,探索多元智能體應(yīng)用場景,激發(fā)更廣泛的AI創(chuàng)新力。

以下為演講全文:

各位嘉賓、媒體朋友們,大家好,歡迎來到騰訊論壇!

我是騰訊的吳運聲。今天,我想和大家聊一聊大模型等核心技術(shù)的發(fā)展趨勢,分享我們在打造“更好用的AI”方面的一些思考與實踐。

我將從技術(shù)演進(jìn)、模型迭代、平臺工具和場景落地四個維度展開。

過去幾年,大模型技術(shù)突飛猛進(jìn),但今天的大多數(shù)AI仍停留在“短期記憶”階段——對話一長就斷,換話題就忘,系統(tǒng)提示詞一旦寫死,能力就被鎖死。

我們認(rèn)為,真正能落地復(fù)雜業(yè)務(wù)的AI,必須具備“長期記憶”:它要能處理長鏈任務(wù),跑得穩(wěn)、記得??;要能跨對話,記住用戶關(guān)鍵信息;還要能根據(jù)任務(wù)動態(tài)加載、替換、甚至自創(chuàng)工具,實現(xiàn)自我進(jìn)化。

同時,傳統(tǒng)的“圖文問答”已難以滿足用戶日益增長的真實需求。

目前來看,我們正在邁向全模態(tài)交互系統(tǒng),它能融合語言、圖像、語音、動作等多模態(tài)輸入輸出,讓用戶所見即所得,所說即所動。

更重要的是,它還得感知變化、執(zhí)行動作,把自然語言轉(zhuǎn)化為數(shù)字人演示或機(jī)器人操作,真正打通AI與現(xiàn)實世界的最后一公里。

這是從“能答”到“能動”的關(guān)鍵躍遷。

另外,我們也發(fā)現(xiàn),在面對復(fù)雜任務(wù)場景,單一智能體的能力也越來越難以支撐。

我們正逐步走向“多智能體協(xié)同”架構(gòu):不同Agent分工協(xié)作、并行執(zhí)行,構(gòu)建一個自組織、自進(jìn)化的“AI團(tuán)隊”。

平臺需要具備任務(wù)拆解、執(zhí)行重排、Agent容錯補(bǔ)位等機(jī)制,真正實現(xiàn)系統(tǒng)級協(xié)同,支撐企業(yè)級復(fù)雜任務(wù),提升穩(wěn)定性、可解釋性和可靠性。

在這樣的技術(shù)趨勢下,今年以來,騰訊混元大模型持續(xù)迭代、小步快跑。年初發(fā)布的旗艦?zāi)P蚑urboS,率先實現(xiàn)混合線性注意力機(jī)制與MoE架構(gòu)的融合,是業(yè)內(nèi)首個落地的超大規(guī)?;旌暇€性MoE模型,性能強(qiáng)、推理快、成本低,長期穩(wěn)居全球權(quán)威榜單前列。

基于TurboS,混元T1進(jìn)一步提升推理與代碼生成能力,已在多個高難任務(wù)中展現(xiàn)國內(nèi)領(lǐng)先水平。以此為基座,混元家族不斷拓展:比如端到端語音模型Voice、多模態(tài)理解模型Vision相繼推出。尤其在多模態(tài)理解上,今年連續(xù)發(fā)布多款模型,在LMArena Vision全球大模型權(quán)威榜單中獲得國內(nèi)榜首,在中文能力上穩(wěn)居全球第一梯隊。

混元在多模態(tài)生成方面同樣領(lǐng)先,不僅能極速生成高清圖像,還具備人物一致性可控的視頻生成和全球領(lǐng)先的3D建模能力。其3D模型已被AI設(shè)計智能體Lovart、3D打印平臺MakerWorld廣泛調(diào)用,展現(xiàn)出強(qiáng)大的產(chǎn)品價值與技術(shù)潛力。

目前,混元模型已在騰訊內(nèi)部大規(guī)模落地,為響應(yīng)產(chǎn)業(yè)和開發(fā)者需求,今年我們將全系中小規(guī)模模型全面開源。相較于千億級模型,這些輕量模型更適合在算力受限環(huán)境下部署,能提供高性能、低成本的推理體驗。比如剛剛開源的混元A13B,僅百億參數(shù),就實現(xiàn)媲美千億模型的能力,開源三天登上Hugging Face趨勢榜第二。

在多模態(tài)生成方面,混元也持續(xù)開放文生圖、視頻、3D等領(lǐng)先能力,提供接近商用水平的開源模型,圖像和視頻衍生模型超千個,3D模型社區(qū)下載量超過230萬。

今天,我們正式發(fā)布并開源業(yè)界首個3D世界生成模型——混元3D世界模型1.0。用戶只需要輸入一句話或一張圖,幾分鐘內(nèi)即能生成可360°漫游、可編輯的虛擬世界,輸出標(biāo)準(zhǔn)化3D資產(chǎn),兼容主流引擎,大幅縮短內(nèi)容生產(chǎn)周期。

此外,面向端側(cè)的0.5B到7B系列小模型、混元Large-Vision、GameCraft等,也將在近期陸續(xù)開源,助力開發(fā)者高效構(gòu)建AI原生應(yīng)用。

基于混元大模型強(qiáng)大的通用能力,并結(jié)合騰訊云智能體開發(fā)平臺、騰訊元器以及具身智能開放平臺等多元化平臺能力,目前我們已經(jīng)構(gòu)建了覆蓋豐富場景的應(yīng)用生態(tài),持續(xù)推動AI從“能用”向“好用”邁進(jìn)。

例如,我們推出了以元寶為代表的一系列AI原生產(chǎn)品,真正實現(xiàn)了AI與用戶生活和工作場景的深度融合。同時,微信、QQ瀏覽器等超級應(yīng)用借助AI賦能,全面提升了用戶體驗與工作效率。

此外,我們還針對辦公、教育、生活等多樣化場景,推出了CodeBuddy、旅游規(guī)劃Agent等智能體產(chǎn)品,深度嵌入生產(chǎn)生活流程,成為用戶貼身的智能助手與可靠伙伴。

在平臺工具支撐方面,目前我們已經(jīng)構(gòu)建了一套統(tǒng)一的智能體平臺底座,支持ToB和ToC兩個方向的智能體開發(fā),實現(xiàn)能力共享、協(xié)同演進(jìn)。

ToB側(cè),我們依托騰訊云智能體開發(fā)平臺,服務(wù)企業(yè)級復(fù)雜場景。平臺支持多Agent協(xié)同、任務(wù)流編排,同時提供企業(yè)所需的云資源連接、安全運維和專屬技術(shù)服務(wù),適配公有云、私有云和混合云的多形態(tài)部署需求。

ToC側(cè),我們基于“騰訊元器”,面向普通開發(fā)者,提供簡單易用的AI應(yīng)用構(gòu)建工具。開發(fā)者可以在熟悉的生態(tài)中,結(jié)合公眾號、微信支付MCP、C端渠道分發(fā)等能力,快速上線專屬智能體。

這兩套產(chǎn)品雖面向不同人群,但底層共享同一個平臺能力棧,實現(xiàn)了開發(fā)、運行、分發(fā)的一體化協(xié)同。同時,我們構(gòu)建了覆蓋全平臺的流量支持機(jī)制。無論是企業(yè)打造SaaS級AI助手,還是開發(fā)者推出C端爆款應(yīng)用,都能在騰訊獲得可持續(xù)的流量與運營支持。

近期,工信部國家工業(yè)信息安全發(fā)展研究中心、及旗下賽昇實驗室也對市面上的智能體平臺進(jìn)行了比較全面的技術(shù)評測。

結(jié)果顯示,騰訊云智能體開發(fā)平臺在多項核心能力上都比較領(lǐng)先。例如,在構(gòu)建自規(guī)劃自決策的Agent領(lǐng)域,核心能力全面領(lǐng)先;在工作流搭建中“端到端、意圖識別、參數(shù)提取”等準(zhǔn)確率領(lǐng)先;企業(yè)通過RAG為大模型接入知識庫時很關(guān)注的“無關(guān)知識拒答準(zhǔn)確率”,也處于領(lǐng)先位置。

今天,騰訊云智能體開發(fā)平臺也迎來了全新升級,重點體現(xiàn)在三大核心能力的提升:

在Multi-Agent能力方面,我們首創(chuàng)了零代碼配置的多Agent協(xié)同機(jī)制,用戶只需通過簡單的轉(zhuǎn)交關(guān)系配置,即可實現(xiàn)模型驅(qū)動的自動協(xié)作,構(gòu)建“多專家”智能體體系,顯著減輕單體Agent的負(fù)擔(dān)。

針對知識問答場景,我們提供了知識庫Agent的最佳實踐。平臺支持多步檢索、多智能體協(xié)作處理復(fù)雜問題,實現(xiàn)“易用性”和“復(fù)雜適配能力”的高度統(tǒng)一,幫助企業(yè)快速部署高質(zhì)量的知識問答系統(tǒng)。

在RAG能力上,平臺經(jīng)過大量企業(yè)實戰(zhàn)場景的打磨,具備扎實領(lǐng)先的產(chǎn)品能力。企業(yè)可用極小投入,快速完成知識更新和問答系統(tǒng)落地。

此次升級還進(jìn)一步擴(kuò)展了知識源對接能力,支持連接主流數(shù)據(jù)庫,實現(xiàn)千萬行級表格問答;也支持接入騰訊文檔,直接導(dǎo)入在線文檔進(jìn)行知識問答。

在工作流方面,我們引入具備全局視角的智能Agent,不僅能動態(tài)感知用戶意圖,還能實現(xiàn)智能的節(jié)點回退與路徑調(diào)整,使多輪交互更加自然、靈活、智能。

在騰訊內(nèi)部,目前騰訊云智能體開發(fā)平臺已經(jīng)應(yīng)用于問答系統(tǒng)、辦公提效、知識管理、客服輔助等多個業(yè)務(wù)場景。

比如,QQ瀏覽器基于該平臺打造的QBot,能夠幫助用戶自動執(zhí)行任務(wù),從檢索、驗證到整理,全程無需人工干預(yù),真正做到“所想即所得”。

對外服務(wù)方面,我們與邯鄲公積金中心合作打造的“數(shù)字柜臺”,是AI政務(wù)落地的標(biāo)桿案例之一。

客戶通過智能體自動解析政策、串聯(lián)流程、進(jìn)行身份核驗與審批,整個業(yè)務(wù)效率提升80%,AI答復(fù)準(zhǔn)確率超82%,實現(xiàn)無紙化、自動化、高準(zhǔn)確的政務(wù)服務(wù)體驗。

介紹完騰訊云智能體開發(fā)平臺,我也和大家再分享下騰訊元器帶來的關(guān)鍵升級,這次產(chǎn)品升級主要聚焦三個方向:

第一,全面提升公眾號智能體的生產(chǎn)力。通過Multi-Agent協(xié)同、MCP接入和矩陣號一鍵發(fā)布,智能體將更高效地完成復(fù)雜任務(wù),從創(chuàng)作到管理全面提效。

第二,深入打通騰訊生態(tài)能力。用戶可一鍵將公眾號內(nèi)容轉(zhuǎn)為知識庫,騰訊文檔作為“內(nèi)容外腦”自然接入,同時基于微信支付MCP能力,幫助開發(fā)者真正跑通“創(chuàng)作—服務(wù)—變現(xiàn)”的商業(yè)閉環(huán)。

第三,拓展C端流量分發(fā)新通道。除即將上線的應(yīng)用寶AI專區(qū)外,我們也將開放更多場景化入口,為優(yōu)質(zhì)智能體提供精準(zhǔn)流量扶持。

自騰訊元器推出公眾號智能體以來,我們見證了知識創(chuàng)作者從內(nèi)容輸出邁向智能服務(wù)的跨越。其中,兒童健康科普博主「童爸育兒」的故事非常典型。

這個博主擁有百萬粉絲和70多個社群,過去每天花4小時回復(fù)私信、評論,創(chuàng)作時間被嚴(yán)重壓縮。直到他嘗試使用騰訊元器——完全不懂技術(shù)的他,僅用10分鐘,就將5年積累的2000多篇文章一鍵導(dǎo)入知識庫,構(gòu)建了屬于自己的「數(shù)字分身」。

這個智能體被接入公眾號后臺、菜單欄和文章入口,7×24小時自動答疑,回答準(zhǔn)確率超過95%,比他自己翻找資料還高效。如今已累計服務(wù)6萬家庭,解答超40萬個育兒問題。

更重要的是,借助微信支付MCP能力,讀者還能為專業(yè)內(nèi)容打賞,實現(xiàn)從“免費輸出”到“價值閉環(huán)”的突破。

從面向B端用戶的騰訊云智能體開發(fā)平臺,到面向C端的騰訊元器,目前我們的雙智能體平臺已經(jīng)廣泛落地,助力更多客戶、用戶完成業(yè)務(wù)升級、需求實現(xiàn)。

AI不僅僅服務(wù)產(chǎn)業(yè),也承載著我們對科技向善的信念。一直以來,騰訊也在基于AI能力,去做一些包括科學(xué)、文化等相關(guān)領(lǐng)域的探索。

比如,我們構(gòu)建了全球首個甲骨文多模態(tài)數(shù)據(jù)集,即將推出具備文字補(bǔ)全和形體還原能力的甲骨文智能體,助力中華文明的數(shù)字化保護(hù);我們還在用AI輔助文物修復(fù),相關(guān)API已開放,幫助考古更高效、更精細(xì)。

在AI探星項目中,我們協(xié)助科研團(tuán)隊發(fā)現(xiàn)45顆新脈沖星,效率是全球平均的兩倍,并觀測到多個快速射電脈沖事件,為探索宇宙打開新窗口。

最后,為了推動智能體技術(shù)的應(yīng)用創(chuàng)新與人才培養(yǎng),騰訊云今天也正式啟動黑客松·Agent應(yīng)用創(chuàng)新挑戰(zhàn)賽。

本次大賽將依托騰訊云智能體開發(fā)平臺與騰訊元器,鼓勵開發(fā)者以零代碼或低代碼方式,結(jié)合RAG、多Agent協(xié)同、Workflow等技術(shù),探索多元智能體應(yīng)用場景。

大賽面向?qū)W生、企業(yè)和個人開發(fā)者,獎勵豐厚,歡迎大家掃碼參與,一起激發(fā)智能體的更多可能。

以上就是我今天分享的全部內(nèi)容。

我們希望,通過扎實的底層模型、好用的平臺工具、廣泛的應(yīng)用生態(tài),讓AI真正建得起、跑得穩(wěn)、用得好,讓每個人、每個企業(yè),都能用上好用的AI。

謝謝大家。

來源:北國網(wǎng)

分享到

zhupb

相關(guān)推薦