吳運聲指出,在智能體開發(fā)領域,騰訊云已形成覆蓋B端與C端的“雙平臺”體系。面向企業(yè)客戶,騰訊云智能體開發(fā)平臺(ADP)提供全面的知識庫構建能力和多種開發(fā)框架,支持私有化部署、企業(yè)級權限管控等,具備強大的系統(tǒng)集成與業(yè)務適配能力。而在C端,騰訊元器平臺依托騰訊生態(tài),支持用戶一鍵將公眾號、文檔等內容轉化為智能體,極大降低創(chuàng)建和分發(fā)門檻,快速觸達終端用戶。
目前,騰訊云智能體開發(fā)平臺已在多個實際場景中廣泛應用。除常見的知識問答類場景,如政務服務、企業(yè)內部知識問答、售后咨詢等,還深入工業(yè)質檢、智能巡檢、媒體內容處理及營銷自動化等復雜場景。例如在質檢環(huán)節(jié),騰訊云借助大模型與Agent技術,將樣本需求從千級降至數(shù)十張,顯著提升缺陷識別效率;在融媒體領域,智能體可實現(xiàn)視頻語意的多模態(tài)理解,幫助內容機構高效管理媒資庫。
本次發(fā)布的騰訊云智能體開發(fā)平臺3.0,作為面向全球用戶的企業(yè)級平臺,集成RAG、Workflow、Multi-Agent等核心能力,提供自動化評測、多層權限配置等能力,幫助企業(yè)智能體安全、放心落地。平臺還提供模型廣場,不僅支持混元、DeepSeek等主流模型即插即用,還支持企業(yè)便捷接入自有模型。
在落地層面,騰訊云智能體開發(fā)平臺已在多個行業(yè)頭部客戶中取得顯著成效。例如與寶安區(qū)政數(shù)局合作,集成民生、企業(yè)、政務等多類服務,實現(xiàn)全區(qū)“一網通辦”;為邯鄲公積金中心搭建“數(shù)字柜臺”,整合身份驗證、電子簽章等工作流插件,試運行首周,平臺受理咨詢2475筆,問題解答率達82%;在酒店行業(yè),協(xié)助華住集團構建38條工作流,覆蓋客戶咨詢、周邊推薦等高頻場景,有效減輕人力負擔。
吳運聲強調,騰訊始終秉持“以人為本”的技術理念,持續(xù)推進技術開源與生態(tài)共建。騰訊優(yōu)圖實驗室9月開源了Youtu-Agent智能體框架和Youtu-GraphRAG知識圖譜框架。前者以極簡設計與高性能兼顧科研和應用,不依賴海外閉源模型即可取得優(yōu)秀效果;后者通過Schema引導與知識樹構建,在Token成本和精度上顯著優(yōu)于現(xiàn)有框架。接下來,優(yōu)圖實驗室還將陸續(xù)開源Youtu-Embedding、Video-MME V2、Youtu-Parsing等能力。
以下為演講全文:
非常高興今天在這里跟大家分享我們在企業(yè)級智能體構建上的進展。
最近智能體確實非?;馃幔械钠髽I(yè)都覺得一定要做智能體,不做智能體,根本跟不上潮流了。但是另外一方面,所有的企業(yè)也都有自己的困惑:智能體到底要做什么樣的場景?在落地的過程中會遇到什么樣的困難?
為了幫助企業(yè)更好地落地智能體,騰訊提供了全棧智能體解決方案,包括最底層的AI Infra到中間層的平臺再到上層的生態(tài)。接下來我將分享下智能體落地場景和應用、智能體開發(fā)平臺的產品進展,以及我們開源的想法和思路。
首先是智能體的落地場景。過去一年多,智能體的落地場景基本都聚焦在知識問答上。比如,企業(yè)內部的員工專家助手、對外的民生政務政法問答、企業(yè)售前售后咨詢等,都可以被歸納為知識問答。企業(yè)把相關知識或產品數(shù)據(jù)放到知識庫中,通過強大的RAG能力、工作流的能力和Agent的能力解答用戶的問題。
除了這種知識問答場景之外,我們也在探索更多智能體落地的場景并且取得了相應的進展,包括巡檢、質檢、媒體處理等。
首先是智能質檢場景。熟悉我們的朋友都知道,在工業(yè)質檢領域,騰訊云的技術是非常領先的。我們在工業(yè)質檢上積累了很多底層技術,但工業(yè)質檢開拓新場景時,還是比較重的,通常需要超過一千張新場景圖片做訓練。
我們也在思考,能不能結合過往已有的技術積累以及最新的大模型和智能體技術,讓整個過程變得更加簡單和高效,答案是可以的。我們借助智能體技術,使用少于50張圖片,直接送到智能體里面,讓智能體自己分析圖片。這個過程有可能是使用過往已經積累的工業(yè)質檢技術的插件,也可以直接使用已經有泛化能力的多模態(tài)插件,交付效率大大提升。
另外一個場景就是智能巡檢。實際的生產環(huán)境中,很多都會用到這個能力,比如去看井蓋有沒有丟,建筑工地工人有沒有穿著正確的服裝,有沒有山火,河道水位有沒有超線等。過去在面臨新場景時,我們通常會找到這個場景里的若干樣本,單獨訓練一些小模型,用小模型解決這個場景里的問題。今天,在智能體開發(fā)平臺上,我們結合過去積累的大量技術,以及針對某些特定場景的小模型,再結合大語言模型的能力、Agent的能力,就能夠快速形成解決方案,適配智能巡檢的不同場景。
媒體處理場景中,用戶經常要對媒體內容做各種查詢和分析,首先要打標簽,再對一段媒體進行切片分段。比如春節(jié)聯(lián)歡晚會四個小時的視頻,切成了幾百段,當要找其中某一段時,搜索的過程還是比較麻煩的。在過往的技術中,這種搜索的過程往往取決于對一個單獨切片視頻打標簽的結果,通過標簽來搜索,對整個視頻語意的理解是缺乏的。現(xiàn)在,我們基于已有的標簽和視頻切片積累的能力以及目前的大模型多模態(tài)理解能力,在媒體內容處理領域也做一個Agent,取得了不錯的效果。
在營銷領域,過去要制定一個營銷活動,有非常多步驟以及人為過程。首先需要圈定人群、選品、制定特定廣告語,再選擇合適的營銷渠道推廣出去,得到反饋之后,還有效果分析環(huán)節(jié),這一系列過程非常復雜。同樣我們在思考,既然有這么多人完成這些事情,能不能每個環(huán)節(jié)都由Agent來實現(xiàn)?再把這些Agent串聯(lián)起來實現(xiàn)效果,答案也是可以的。我們做了人群圈定的Agent、商品選擇的Agent、內容生產的Agent、渠道分發(fā)的Agent以及最后效果分析的Agent,把這些Agent自動串聯(lián)起來,就可以很方便完成一個營銷方案。
除了這些面向企業(yè)的智能體,面向個人也可以有很多好玩的東西。在座的朋友們,在過去多年的工作、生活過程中一定都積累了很多知識、經驗,能不能把自己積累的這些知識做成一個IP Agent對外提供呢?也是可以的。我們也做了一些實踐,后面有一些案例可以分享給大家。
這些場景上的應用離不開我們在產品上的創(chuàng)新,接下來我也會跟大家介紹下我們在產品上的進展。
騰訊云有兩大智能體開發(fā)平臺。一個是面向TOB的——騰訊云智能體開發(fā)平臺,有完整的智能體構建能力,可以提供全方位的企業(yè)級能力,比如云資源的連接、專業(yè)的開發(fā)框架和靈活的部署能力。還有面向C端的平臺——騰訊元器,可以一鍵構建公眾號智能體,同樣提供相應騰訊生態(tài)的支持和C端流量支持,讓大家更好更方便地構建個人智能體。
今天很高興跟大家正式宣布,我們剛剛發(fā)布了騰訊云智能體開發(fā)平臺3.0版本,提供更加完善的企業(yè)智能體開發(fā)能力和基礎設施,底層提供身份權限、合規(guī)、運行環(huán)境等基礎能力,中間有RAG引擎、工作流引擎、Agent引擎。同時還有很多配套能力,包括模型廣場、插件廣場等。
除上述能力之外,還設有實踐經驗板塊。我們認識到,開發(fā)一個智能體不僅涉及技術實現(xiàn),更與開發(fā)者的認知和經驗積累密切相關。因此,我們將多年積累的能力與實踐經驗進行了沉淀,形成了多種應用模板,幫助用戶更好構建智能體。此外,我們還將推出一系列有關智能體構建的課程,全方位輔助用戶更高效地開發(fā)智能體。
目前,我們的RAG能力——包括知識庫檢索、文檔解析、OCR等,正在持續(xù)迭代。文檔解析已支持更豐富的內容類型,進一步節(jié)省成本。在結構化檢索方面,依托Agent技術,實現(xiàn)了顯著的能力增強。同時,我們已將傳統(tǒng)RAG升級為Agentic RAG。傳統(tǒng)RAG通常在用戶提問后,通過拆解問題元素,檢索知識庫并匯總返回結果;Agentic RAG可以通過大模型自動拆解問題,通過多步查詢,最終拿到結果,這是一個更智能化的技術。
此外,我們全面升級了Multi-Agent能力,支持多方式配置Agent協(xié)同,支持自由轉交、工作流編排、P&E協(xié)同模版等。在實際落地過程中,Agent不僅可與其他Agent互動,還能與確定性節(jié)點進行交互。通過將Agent融入工作流,用戶可在編排中明確指定Agent之間的協(xié)作機制,并結合現(xiàn)有節(jié)點構建更強大的應用。我們還推出了經過長期沉淀的P&E協(xié)同模板,通過內置的Planner Agent和 Executor Agent協(xié)同,能夠針對任務自動規(guī)劃步驟、調度相應Agent執(zhí)行,并具備自我驗證機制,最終達成目標。
除了RAG與Agent能力,智能體的實戰(zhàn)應用離不開評測體系的支撐。騰訊云智能體開發(fā)平臺3.0同時支持基準評測與對比評測,并提供多種打分方式,如裁判模型、規(guī)則匹配、自定義代碼等,也可進行多模型或多提示詞的自動對比評測。
有了這些能力后,智能體要想真正在企業(yè)落地,還有一個繞不開的問題——權限。尤其對于大企業(yè)來說,所涉及到的內容、知識、組織人員非常之龐大,不同的人、不同的組織,對不同的內容都會有不同的訪問權限。在騰訊云智能體開發(fā)平臺3.0版本中,我們推出了兩級權限體系,企業(yè)級權限體系支持內容可見權限與用戶添加管理;空間內部則進一步細分功能與數(shù)據(jù)權限。空間管理員可靈活分配成員權限,實現(xiàn)對知識庫內容與應用功能的精細控制,從而支持智能體在大規(guī)模企業(yè)環(huán)境中的安全部署。
除了前述能力,還有很多以往內容的沉淀。除插件外,我們推出模型廣場,除內置模型外,還支持幾乎所有主流第三方模型。用戶通過簡單配置API即可調用,若模型訓練于騰訊云TI平臺,則可直接授權使用;符合OpenAI兼容協(xié)議的外部模型也可快速接入。
騰訊云智能體開發(fā)平臺已在騰訊內部多項業(yè)務中廣泛應用。例如騰訊學堂依托智能體開發(fā)平臺打造問答助手,為全體員工的學習提供支持;QQ瀏覽器基于我們的平臺打造了下載助手等智能體;騰訊樂享知識庫的底層也是基于我們的RAG能力。
接下來也給大家介紹一下我們外部的案例。寶安區(qū)政數(shù)局需要提供一類服務,解答轄區(qū)內的居民關于民生、企業(yè)服務、政務辦公、社會治理等各類事務的問詢。他們所積累的內容、格式十分復雜,數(shù)量也很大。在騰訊云智能體開發(fā)平臺里,我們將所有內容都一鍵導入平臺,快速構建起問答智能體,實現(xiàn)了很好的效果。
另外一個例子,是跟邯鄲公積金的合作。辦理公積金業(yè)務時,用戶不只會問到公積金政策相關的問題,還需要驗證身份、刷臉、簽訂協(xié)議等。我們跟邯鄲公積金的協(xié)作極大縮短了流程,將身份驗證、刷臉、電子簽等技術以插件形式嵌入工作流,搭配原有業(yè)務流程,實現(xiàn)一站式構建業(yè)務處理過程,大幅提升業(yè)務處理效率。
在住宿場景中,經常會有這種情況,顧客給前臺打電話,問前臺如何把空調溫度調低、詢問早餐時間、WIFI等各種需求?;蛘邌柛频隉o關的問題,比如周邊推薦、美食推薦等。在跟華住集團的合作中,我們?yōu)槿A住搭建了30多條工作流,覆蓋了酒店信息、酒店周邊查詢等多元場景服務,并且具備快速響應能力,在實踐中取得了很好的效果。
在IP Agent方面,吳曉波把他在過去十幾年間積累的行業(yè)洞察、投資理財?shù)认嚓P知識,整理成知識庫,并且結合數(shù)智人技術,構建起自己的IP Agent。我們還與楊國安教授一起合作構建了一個“楊國安+”小程序的IP Agent,可以實現(xiàn)7×24小時跟楊國安對話,隨時隨地獲取頂級教授一對一的指引。我們也希望未來有更多人構建自己的IP Agent,把自己積累的知識傳遞給更多的用戶。
除了面向TOB領域的騰訊云智能體開發(fā)平臺,我們面向C端用戶的騰訊元器可以幫助用戶一鍵將積累的公眾號文章導入智能體構建知識庫。例如我們與中國石化“小石頭”公眾號的合作,已實現(xiàn)千萬級粉絲基礎上的智能問答服務,智能回復油價、開票等信息。
最后,也匯報一下我們關于開源的思考和進展。在過去一段時間里,智能體的發(fā)展迅速,騰訊也積累了很多經驗,秉承技術普惠與開放共建的理念,我們決定將過去所積累的智能體技術陸續(xù)開源,促進智能體生態(tài)的快速發(fā)展。
我們優(yōu)圖實驗室9月率先開源了Youtu-Agent智能體框架和Youtu-GraphRAG知識圖譜框架。前者以極簡設計與高性能兼顧科研和應用,不依賴海外閉源模型即可取得優(yōu)秀效果;后者通過Schema引導與知識樹構建,在Token成本和精度上顯著優(yōu)于現(xiàn)有框架。即將開源的Embedding能力,是整個RAG的基礎,因為Embedding做得好不好決定了之后的語義檢索能不能做到更好的效果,這個也敬請大家期待。
騰訊多年來始終秉承以人為本的理念,我們希望技術真正為人服務,在智能體時代,我們希望構建出真正實用、真正好用的企業(yè)級智能體,讓AI人人可用,助力產業(yè)創(chuàng)新升級。
謝謝大家!