Agent:操作系統(tǒng)級(jí)的智能入口

宣善明認(rèn)為,Agent不再是單一任務(wù)工具,而是“操作系統(tǒng)級(jí)別的入口”。Agent既是人與AI交互的統(tǒng)一接口,還能進(jìn)行組織、編排及自我進(jìn)化??梢韵胂笠幌?,未來我們可以依托Agent體系,一個(gè)人即可組建公司,通過編排AI員工形成團(tuán)隊(duì),甚至進(jìn)一步擴(kuò)展成復(fù)雜的AI組織。

與傳統(tǒng)AI模型不同,Agent的核心挑戰(zhàn)在于其不確定性。我們無法完全預(yù)設(shè)Agent行為,系統(tǒng)必須具備發(fā)散性評(píng)估與自我優(yōu)化能力,在持續(xù)反饋中實(shí)現(xiàn)自主進(jìn)化。

這要求Agent具備四大核心能力:統(tǒng)一入口、可擴(kuò)展性、自我進(jìn)化能力和評(píng)估體系。

智能中樞:Agent Infra的底層支撐

2030年,經(jīng)濟(jì)體將演變?yōu)橐粋€(gè) Agent 經(jīng)濟(jì)體,其中每個(gè) Agent 像神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)一樣互聯(lián)協(xié)作,通過統(tǒng)一入口分發(fā)任務(wù)并與其他 Agent 交互完成工作。這樣的體系高度復(fù)雜、動(dòng)態(tài)且自組織,無法完全依賴人工手工搭建,因此需要系統(tǒng)化的 Agent Infra 來支撐。

首先,需要構(gòu)建智能中樞。

商湯大裝置Agent Infra智能中樞體系公共能力組件、外部工具接入以及自我進(jìn)化機(jī)制共同組成的體系,使agent能通過持續(xù)進(jìn)化不斷擴(kuò)展自身能力。

· 公共能力組件是Agent Infra智能中樞體系中支撐Agent高效運(yùn)行的核心基礎(chǔ)模塊。它通過提供統(tǒng)一的Memory、Agent元數(shù)據(jù)管理、沙盒環(huán)境、規(guī)劃器和摘要器等公共能力,使Agent能夠高效地管理自身知識(shí)、跟蹤任務(wù)狀態(tài)、進(jìn)行安全隔離的實(shí)驗(yàn)等,以及在復(fù)雜任務(wù)中實(shí)現(xiàn)智能規(guī)劃與決策。

· 在外部工具接入能力方面,體系引入經(jīng)過遴選與驗(yàn)證的工具和MCP,確保Agent在面對(duì)自身無法解決的問題時(shí)能夠調(diào)用外部資源,同時(shí)通過開放搜索MCP發(fā)現(xiàn)和評(píng)估新的功能資源,從而拓展任務(wù)覆蓋范圍并提升問題解決能力。

· 自我進(jìn)化機(jī)制是支撐智能體持續(xù)提升能力的核心環(huán)節(jié)。該機(jī)制依托MCP Builder和Agent Builder兩個(gè)關(guān)鍵組件構(gòu)建。MCP Builder主要用于快速構(gòu)建基礎(chǔ)功能。相比之下,Agent Builder面向更復(fù)雜的智能體需求,它不僅僅生成一段代碼邏輯,而是賦予生成的智能體自我驗(yàn)證、自我迭代、自我思考的能力。通過Agent Builder,智能體可以在實(shí)際應(yīng)用中不斷反思與優(yōu)化自身行為,從而實(shí)現(xiàn)能力的自主擴(kuò)展與進(jìn)化。

除此之外,Agent Infra智能中樞Memory體系承擔(dān)著智能體感知、決策與自我迭代的功能。我們基于多模態(tài)解析構(gòu)建了統(tǒng)一的Knowledge Graph,將文本、圖像、視頻等多源信息進(jìn)行結(jié)構(gòu)化存儲(chǔ)與索引,以實(shí)現(xiàn)高效檢索與使用。此外,Memory還用于智能體的自我迭代,每次執(zhí)行任務(wù)后,成功與失敗路徑都會(huì)被記錄于Knowledge Graph,供下一次Planning參考,使Agent能夠低成本、高效地沿用成功經(jīng)驗(yàn)、規(guī)避失敗路徑,實(shí)現(xiàn)自主進(jìn)化。

Agent Infra端到端實(shí)踐:閉環(huán)驗(yàn)證與產(chǎn)業(yè)落地

在商湯大裝置的Agent Infra實(shí)踐中,端到端構(gòu)建流程涵蓋從Agent生成、離線驗(yàn)證到灰度上線的完整閉環(huán)。

· SRE-Agent:商湯作為業(yè)內(nèi)領(lǐng)先的AI基礎(chǔ)設(shè)施廠商,SRE-Agent是保障其大規(guī)模算力集群穩(wěn)定運(yùn)行的重要工具。宣善明現(xiàn)場演示了SRE-Agent進(jìn)行故障排查的過程。當(dāng)一個(gè)2000P集群中的任務(wù)無法啟動(dòng)時(shí),SRE-Agent能自主完成故障排查。它對(duì)接日志與監(jiān)控系統(tǒng),結(jié)合知識(shí)庫生成排查計(jì)劃,并在執(zhí)行中動(dòng)態(tài)調(diào)用檢索工具,最終產(chǎn)出根因分析與解決方案。與人工數(shù)小時(shí)的排查相比,分鐘級(jí)即可完成,大幅提升運(yùn)維效率并減少人力投入。

· 具身智能Agent:另外在具身智能領(lǐng)域,商湯大裝置開發(fā)了具身仿真數(shù)據(jù)生成Agent,來為客戶提供高效的數(shù)據(jù)生成能力。該Agent基于已有的仿真平臺(tái)(如NVIDIA仿真環(huán)境),通過Agent系統(tǒng)進(jìn)行全流程規(guī)劃與任務(wù)拆解,進(jìn)行場景素模構(gòu)建和場景集成,并能夠進(jìn)行光影調(diào)整與參數(shù)優(yōu)化等來形成大量高質(zhì)量數(shù)據(jù)集??梢钥吹?,Agent在數(shù)據(jù)生成環(huán)節(jié)的自主規(guī)劃與智能執(zhí)行能力,能夠從數(shù)據(jù)多樣性與場景覆蓋等角度,幫助客戶快速獲取可用于訓(xùn)練和驗(yàn)證的具身智能數(shù)據(jù)。

· 行業(yè)性Agent:商湯大裝置在某大型項(xiàng)目中,實(shí)現(xiàn)了以唯一業(yè)務(wù)入口統(tǒng)一管理和調(diào)度超過100個(gè)Agent,大部分由頂層Agent自主生成,系統(tǒng)覆蓋30余內(nèi)部業(yè)務(wù)系統(tǒng)、4000余工具及十多個(gè)垂類模型,實(shí)現(xiàn)了AI自主定位與任務(wù)執(zhí)行,成功驗(yàn)證了Agent Infra在行業(yè)級(jí)項(xiàng)目落地中的可擴(kuò)展性和高效性。

“我們正在見證一個(gè)完整閉環(huán)的逐步成型。商湯大裝置的AI Agent Infra實(shí)踐,正通過基礎(chǔ)設(shè)施與智能體模板、開放生態(tài)社區(qū)以及Marketplace等層層推進(jìn),支撐起繁榮的Agent經(jīng)濟(jì)生態(tài)。這不僅實(shí)現(xiàn)了從技術(shù)落地到產(chǎn)業(yè)化的閉環(huán),更展現(xiàn)了商湯在AI Agent時(shí)代的戰(zhàn)略遠(yuǎn)見。” 宣善明總結(jié)道。

分享到

zhupb

相關(guān)推薦