吳運(yùn)聲指出,在智能體開發(fā)領(lǐng)域,騰訊云已形成覆蓋B端與C端的“雙平臺(tái)”體系。面向企業(yè)客戶,騰訊云智能體開發(fā)平臺(tái)(ADP)提供全面的知識(shí)庫構(gòu)建能力和多種開發(fā)框架,支持私有化部署、企業(yè)級(jí)權(quán)限管控等,具備強(qiáng)大的系統(tǒng)集成與業(yè)務(wù)適配能力。而在C端,騰訊元器平臺(tái)依托騰訊生態(tài),支持用戶一鍵將公眾號(hào)、文檔等內(nèi)容轉(zhuǎn)化為智能體,極大降低創(chuàng)建和分發(fā)門檻,快速觸達(dá)終端用戶。
目前,騰訊云智能體開發(fā)平臺(tái)已在多個(gè)實(shí)際場(chǎng)景中廣泛應(yīng)用。除常見的知識(shí)問答類場(chǎng)景,如政務(wù)服務(wù)、企業(yè)內(nèi)部知識(shí)問答、售后咨詢等,還深入工業(yè)質(zhì)檢、智能巡檢、媒體內(nèi)容處理及營銷自動(dòng)化等復(fù)雜場(chǎng)景。例如在質(zhì)檢環(huán)節(jié),騰訊云借助大模型與Agent技術(shù),將樣本需求從千級(jí)降至數(shù)十張,顯著提升缺陷識(shí)別效率;在融媒體領(lǐng)域,智能體可實(shí)現(xiàn)視頻語意的多模態(tài)理解,幫助內(nèi)容機(jī)構(gòu)高效管理媒資庫。
本次發(fā)布的騰訊云智能體開發(fā)平臺(tái)3.0,作為面向全球用戶的企業(yè)級(jí)平臺(tái),集成RAG、Workflow、Multi-Agent等核心能力,提供自動(dòng)化評(píng)測(cè)、多層權(quán)限配置等能力,幫助企業(yè)智能體安全、放心落地。平臺(tái)還提供模型廣場(chǎng),不僅支持混元、DeepSeek等主流模型即插即用,還支持企業(yè)便捷接入自有模型。
在落地層面,騰訊云智能體開發(fā)平臺(tái)已在多個(gè)行業(yè)頭部客戶中取得顯著成效。例如與寶安區(qū)政數(shù)局合作,集成民生、企業(yè)、政務(wù)等多類服務(wù),實(shí)現(xiàn)全區(qū)“一網(wǎng)通辦”;為邯鄲公積金中心搭建“數(shù)字柜臺(tái)”,整合身份驗(yàn)證、電子簽章等工作流插件,試運(yùn)行首周,平臺(tái)受理咨詢2475筆,問題解答率達(dá)82%;在酒店行業(yè),協(xié)助華住集團(tuán)構(gòu)建38條工作流,覆蓋客戶咨詢、周邊推薦等高頻場(chǎng)景,有效減輕人力負(fù)擔(dān)。
吳運(yùn)聲強(qiáng)調(diào),騰訊始終秉持“以人為本”的技術(shù)理念,持續(xù)推進(jìn)技術(shù)開源與生態(tài)共建。騰訊優(yōu)圖實(shí)驗(yàn)室9月開源了Youtu-Agent智能體框架和Youtu-GraphRAG知識(shí)圖譜框架。前者以極簡設(shè)計(jì)與高性能兼顧科研和應(yīng)用,不依賴海外閉源模型即可取得優(yōu)秀效果;后者通過Schema引導(dǎo)與知識(shí)樹構(gòu)建,在Token成本和精度上顯著優(yōu)于現(xiàn)有框架。接下來,優(yōu)圖實(shí)驗(yàn)室還將陸續(xù)開源Youtu-Embedding、Video-MME V2、Youtu-Parsing等能力。
以下為演講全文:
非常高興今天在這里跟大家分享我們?cè)谄髽I(yè)級(jí)智能體構(gòu)建上的進(jìn)展。
最近智能體確實(shí)非常火熱,所有的企業(yè)都覺得一定要做智能體,不做智能體,根本跟不上潮流了。但是另外一方面,所有的企業(yè)也都有自己的困惑:智能體到底要做什么樣的場(chǎng)景?在落地的過程中會(huì)遇到什么樣的困難?
為了幫助企業(yè)更好地落地智能體,騰訊提供了全棧智能體解決方案,包括最底層的AI Infra到中間層的平臺(tái)再到上層的生態(tài)。接下來我將分享下智能體落地場(chǎng)景和應(yīng)用、智能體開發(fā)平臺(tái)的產(chǎn)品進(jìn)展,以及我們開源的想法和思路。
首先是智能體的落地場(chǎng)景。過去一年多,智能體的落地場(chǎng)景基本都聚焦在知識(shí)問答上。比如,企業(yè)內(nèi)部的員工專家助手、對(duì)外的民生政務(wù)政法問答、企業(yè)售前售后咨詢等,都可以被歸納為知識(shí)問答。企業(yè)把相關(guān)知識(shí)或產(chǎn)品數(shù)據(jù)放到知識(shí)庫中,通過強(qiáng)大的RAG能力、工作流的能力和Agent的能力解答用戶的問題。
除了這種知識(shí)問答場(chǎng)景之外,我們也在探索更多智能體落地的場(chǎng)景并且取得了相應(yīng)的進(jìn)展,包括巡檢、質(zhì)檢、媒體處理等。
首先是智能質(zhì)檢場(chǎng)景。熟悉我們的朋友都知道,在工業(yè)質(zhì)檢領(lǐng)域,騰訊云的技術(shù)是非常領(lǐng)先的。我們?cè)诠I(yè)質(zhì)檢上積累了很多底層技術(shù),但工業(yè)質(zhì)檢開拓新場(chǎng)景時(shí),還是比較重的,通常需要超過一千張新場(chǎng)景圖片做訓(xùn)練。
我們也在思考,能不能結(jié)合過往已有的技術(shù)積累以及最新的大模型和智能體技術(shù),讓整個(gè)過程變得更加簡單和高效,答案是可以的。我們借助智能體技術(shù),使用少于50張圖片,直接送到智能體里面,讓智能體自己分析圖片。這個(gè)過程有可能是使用過往已經(jīng)積累的工業(yè)質(zhì)檢技術(shù)的插件,也可以直接使用已經(jīng)有泛化能力的多模態(tài)插件,交付效率大大提升。
另外一個(gè)場(chǎng)景就是智能巡檢。實(shí)際的生產(chǎn)環(huán)境中,很多都會(huì)用到這個(gè)能力,比如去看井蓋有沒有丟,建筑工地工人有沒有穿著正確的服裝,有沒有山火,河道水位有沒有超線等。過去在面臨新場(chǎng)景時(shí),我們通常會(huì)找到這個(gè)場(chǎng)景里的若干樣本,單獨(dú)訓(xùn)練一些小模型,用小模型解決這個(gè)場(chǎng)景里的問題。今天,在智能體開發(fā)平臺(tái)上,我們結(jié)合過去積累的大量技術(shù),以及針對(duì)某些特定場(chǎng)景的小模型,再結(jié)合大語言模型的能力、Agent的能力,就能夠快速形成解決方案,適配智能巡檢的不同場(chǎng)景。
媒體處理場(chǎng)景中,用戶經(jīng)常要對(duì)媒體內(nèi)容做各種查詢和分析,首先要打標(biāo)簽,再對(duì)一段媒體進(jìn)行切片分段。比如春節(jié)聯(lián)歡晚會(huì)四個(gè)小時(shí)的視頻,切成了幾百段,當(dāng)要找其中某一段時(shí),搜索的過程還是比較麻煩的。在過往的技術(shù)中,這種搜索的過程往往取決于對(duì)一個(gè)單獨(dú)切片視頻打標(biāo)簽的結(jié)果,通過標(biāo)簽來搜索,對(duì)整個(gè)視頻語意的理解是缺乏的?,F(xiàn)在,我們基于已有的標(biāo)簽和視頻切片積累的能力以及目前的大模型多模態(tài)理解能力,在媒體內(nèi)容處理領(lǐng)域也做一個(gè)Agent,取得了不錯(cuò)的效果。
在營銷領(lǐng)域,過去要制定一個(gè)營銷活動(dòng),有非常多步驟以及人為過程。首先需要圈定人群、選品、制定特定廣告語,再選擇合適的營銷渠道推廣出去,得到反饋之后,還有效果分析環(huán)節(jié),這一系列過程非常復(fù)雜。同樣我們?cè)谒伎迹热挥羞@么多人完成這些事情,能不能每個(gè)環(huán)節(jié)都由Agent來實(shí)現(xiàn)?再把這些Agent串聯(lián)起來實(shí)現(xiàn)效果,答案也是可以的。我們做了人群圈定的Agent、商品選擇的Agent、內(nèi)容生產(chǎn)的Agent、渠道分發(fā)的Agent以及最后效果分析的Agent,把這些Agent自動(dòng)串聯(lián)起來,就可以很方便完成一個(gè)營銷方案。
除了這些面向企業(yè)的智能體,面向個(gè)人也可以有很多好玩的東西。在座的朋友們,在過去多年的工作、生活過程中一定都積累了很多知識(shí)、經(jīng)驗(yàn),能不能把自己積累的這些知識(shí)做成一個(gè)IP Agent對(duì)外提供呢?也是可以的。我們也做了一些實(shí)踐,后面有一些案例可以分享給大家。
這些場(chǎng)景上的應(yīng)用離不開我們?cè)诋a(chǎn)品上的創(chuàng)新,接下來我也會(huì)跟大家介紹下我們?cè)诋a(chǎn)品上的進(jìn)展。
騰訊云有兩大智能體開發(fā)平臺(tái)。一個(gè)是面向TOB的——騰訊云智能體開發(fā)平臺(tái),有完整的智能體構(gòu)建能力,可以提供全方位的企業(yè)級(jí)能力,比如云資源的連接、專業(yè)的開發(fā)框架和靈活的部署能力。還有面向C端的平臺(tái)——騰訊元器,可以一鍵構(gòu)建公眾號(hào)智能體,同樣提供相應(yīng)騰訊生態(tài)的支持和C端流量支持,讓大家更好更方便地構(gòu)建個(gè)人智能體。
今天很高興跟大家正式宣布,我們剛剛發(fā)布了騰訊云智能體開發(fā)平臺(tái)3.0版本,提供更加完善的企業(yè)智能體開發(fā)能力和基礎(chǔ)設(shè)施,底層提供身份權(quán)限、合規(guī)、運(yùn)行環(huán)境等基礎(chǔ)能力,中間有RAG引擎、工作流引擎、Agent引擎。同時(shí)還有很多配套能力,包括模型廣場(chǎng)、插件廣場(chǎng)等。
除上述能力之外,還設(shè)有實(shí)踐經(jīng)驗(yàn)板塊。我們認(rèn)識(shí)到,開發(fā)一個(gè)智能體不僅涉及技術(shù)實(shí)現(xiàn),更與開發(fā)者的認(rèn)知和經(jīng)驗(yàn)積累密切相關(guān)。因此,我們將多年積累的能力與實(shí)踐經(jīng)驗(yàn)進(jìn)行了沉淀,形成了多種應(yīng)用模板,幫助用戶更好構(gòu)建智能體。此外,我們還將推出一系列有關(guān)智能體構(gòu)建的課程,全方位輔助用戶更高效地開發(fā)智能體。
目前,我們的RAG能力——包括知識(shí)庫檢索、文檔解析、OCR等,正在持續(xù)迭代。文檔解析已支持更豐富的內(nèi)容類型,進(jìn)一步節(jié)省成本。在結(jié)構(gòu)化檢索方面,依托Agent技術(shù),實(shí)現(xiàn)了顯著的能力增強(qiáng)。同時(shí),我們已將傳統(tǒng)RAG升級(jí)為Agentic RAG。傳統(tǒng)RAG通常在用戶提問后,通過拆解問題元素,檢索知識(shí)庫并匯總返回結(jié)果;Agentic RAG可以通過大模型自動(dòng)拆解問題,通過多步查詢,最終拿到結(jié)果,這是一個(gè)更智能化的技術(shù)。
此外,我們?nèi)嫔?jí)了Multi-Agent能力,支持多方式配置Agent協(xié)同,支持自由轉(zhuǎn)交、工作流編排、P&E協(xié)同模版等。在實(shí)際落地過程中,Agent不僅可與其他Agent互動(dòng),還能與確定性節(jié)點(diǎn)進(jìn)行交互。通過將Agent融入工作流,用戶可在編排中明確指定Agent之間的協(xié)作機(jī)制,并結(jié)合現(xiàn)有節(jié)點(diǎn)構(gòu)建更強(qiáng)大的應(yīng)用。我們還推出了經(jīng)過長期沉淀的P&E協(xié)同模板,通過內(nèi)置的Planner Agent和 Executor Agent協(xié)同,能夠針對(duì)任務(wù)自動(dòng)規(guī)劃步驟、調(diào)度相應(yīng)Agent執(zhí)行,并具備自我驗(yàn)證機(jī)制,最終達(dá)成目標(biāo)。
除了RAG與Agent能力,智能體的實(shí)戰(zhàn)應(yīng)用離不開評(píng)測(cè)體系的支撐。騰訊云智能體開發(fā)平臺(tái)3.0同時(shí)支持基準(zhǔn)評(píng)測(cè)與對(duì)比評(píng)測(cè),并提供多種打分方式,如裁判模型、規(guī)則匹配、自定義代碼等,也可進(jìn)行多模型或多提示詞的自動(dòng)對(duì)比評(píng)測(cè)。
有了這些能力后,智能體要想真正在企業(yè)落地,還有一個(gè)繞不開的問題——權(quán)限。尤其對(duì)于大企業(yè)來說,所涉及到的內(nèi)容、知識(shí)、組織人員非常之龐大,不同的人、不同的組織,對(duì)不同的內(nèi)容都會(huì)有不同的訪問權(quán)限。在騰訊云智能體開發(fā)平臺(tái)3.0版本中,我們推出了兩級(jí)權(quán)限體系,企業(yè)級(jí)權(quán)限體系支持內(nèi)容可見權(quán)限與用戶添加管理;空間內(nèi)部則進(jìn)一步細(xì)分功能與數(shù)據(jù)權(quán)限??臻g管理員可靈活分配成員權(quán)限,實(shí)現(xiàn)對(duì)知識(shí)庫內(nèi)容與應(yīng)用功能的精細(xì)控制,從而支持智能體在大規(guī)模企業(yè)環(huán)境中的安全部署。
除了前述能力,還有很多以往內(nèi)容的沉淀。除插件外,我們推出模型廣場(chǎng),除內(nèi)置模型外,還支持幾乎所有主流第三方模型。用戶通過簡單配置API即可調(diào)用,若模型訓(xùn)練于騰訊云TI平臺(tái),則可直接授權(quán)使用;符合OpenAI兼容協(xié)議的外部模型也可快速接入。
騰訊云智能體開發(fā)平臺(tái)已在騰訊內(nèi)部多項(xiàng)業(yè)務(wù)中廣泛應(yīng)用。例如騰訊學(xué)堂依托智能體開發(fā)平臺(tái)打造問答助手,為全體員工的學(xué)習(xí)提供支持;QQ瀏覽器基于我們的平臺(tái)打造了下載助手等智能體;騰訊樂享知識(shí)庫的底層也是基于我們的RAG能力。
接下來也給大家介紹一下我們外部的案例。寶安區(qū)政數(shù)局需要提供一類服務(wù),解答轄區(qū)內(nèi)的居民關(guān)于民生、企業(yè)服務(wù)、政務(wù)辦公、社會(huì)治理等各類事務(wù)的問詢。他們所積累的內(nèi)容、格式十分復(fù)雜,數(shù)量也很大。在騰訊云智能體開發(fā)平臺(tái)里,我們將所有內(nèi)容都一鍵導(dǎo)入平臺(tái),快速構(gòu)建起問答智能體,實(shí)現(xiàn)了很好的效果。
另外一個(gè)例子,是跟邯鄲公積金的合作。辦理公積金業(yè)務(wù)時(shí),用戶不只會(huì)問到公積金政策相關(guān)的問題,還需要驗(yàn)證身份、刷臉、簽訂協(xié)議等。我們跟邯鄲公積金的協(xié)作極大縮短了流程,將身份驗(yàn)證、刷臉、電子簽等技術(shù)以插件形式嵌入工作流,搭配原有業(yè)務(wù)流程,實(shí)現(xiàn)一站式構(gòu)建業(yè)務(wù)處理過程,大幅提升業(yè)務(wù)處理效率。
在住宿場(chǎng)景中,經(jīng)常會(huì)有這種情況,顧客給前臺(tái)打電話,問前臺(tái)如何把空調(diào)溫度調(diào)低、詢問早餐時(shí)間、WIFI等各種需求?;蛘邌柛频隉o關(guān)的問題,比如周邊推薦、美食推薦等。在跟華住集團(tuán)的合作中,我們?yōu)槿A住搭建了30多條工作流,覆蓋了酒店信息、酒店周邊查詢等多元場(chǎng)景服務(wù),并且具備快速響應(yīng)能力,在實(shí)踐中取得了很好的效果。
在IP Agent方面,吳曉波把他在過去十幾年間積累的行業(yè)洞察、投資理財(cái)?shù)认嚓P(guān)知識(shí),整理成知識(shí)庫,并且結(jié)合數(shù)智人技術(shù),構(gòu)建起自己的IP Agent。我們還與楊國安教授一起合作構(gòu)建了一個(gè)“楊國安+”小程序的IP Agent,可以實(shí)現(xiàn)7×24小時(shí)跟楊國安對(duì)話,隨時(shí)隨地獲取頂級(jí)教授一對(duì)一的指引。我們也希望未來有更多人構(gòu)建自己的IP Agent,把自己積累的知識(shí)傳遞給更多的用戶。
除了面向TOB領(lǐng)域的騰訊云智能體開發(fā)平臺(tái),我們面向C端用戶的騰訊元器可以幫助用戶一鍵將積累的公眾號(hào)文章導(dǎo)入智能體構(gòu)建知識(shí)庫。例如我們與中國石化“小石頭”公眾號(hào)的合作,已實(shí)現(xiàn)千萬級(jí)粉絲基礎(chǔ)上的智能問答服務(wù),智能回復(fù)油價(jià)、開票等信息。
最后,也匯報(bào)一下我們關(guān)于開源的思考和進(jìn)展。在過去一段時(shí)間里,智能體的發(fā)展迅速,騰訊也積累了很多經(jīng)驗(yàn),秉承技術(shù)普惠與開放共建的理念,我們決定將過去所積累的智能體技術(shù)陸續(xù)開源,促進(jìn)智能體生態(tài)的快速發(fā)展。
我們優(yōu)圖實(shí)驗(yàn)室9月率先開源了Youtu-Agent智能體框架和Youtu-GraphRAG知識(shí)圖譜框架。前者以極簡設(shè)計(jì)與高性能兼顧科研和應(yīng)用,不依賴海外閉源模型即可取得優(yōu)秀效果;后者通過Schema引導(dǎo)與知識(shí)樹構(gòu)建,在Token成本和精度上顯著優(yōu)于現(xiàn)有框架。即將開源的Embedding能力,是整個(gè)RAG的基礎(chǔ),因?yàn)镋mbedding做得好不好決定了之后的語義檢索能不能做到更好的效果,這個(gè)也敬請(qǐng)大家期待。
騰訊多年來始終秉承以人為本的理念,我們希望技術(shù)真正為人服務(wù),在智能體時(shí)代,我們希望構(gòu)建出真正實(shí)用、真正好用的企業(yè)級(jí)智能體,讓AI人人可用,助力產(chǎn)業(yè)創(chuàng)新升級(jí)。
謝謝大家!