以電商平臺退換貨規(guī)定為例,系統(tǒng)會自動抽取文檔中的關(guān)鍵變量,如“產(chǎn)品類別”、“退貨天數(shù)”等,并梳理出它們之間的規(guī)則。例如,一份簡單的退貨文檔,系統(tǒng)就能自動提取出78條規(guī)則和81個變量。
雖然RAG技術(shù)也有助于緩解幻覺問題,但與這里的推理檢查有明顯不同。前者主要負責為大模型提供準確、相關(guān)的背景知識。而推理檢查負責在推理的最后一步,驗證大模型基于知識生成的回答是否嚴格遵守業(yè)務(wù)邏輯和規(guī)則。
郭韌介紹稱,如果把規(guī)則文檔丟給RAG系統(tǒng),讓RAG系統(tǒng)基于來提供規(guī)則約束力,這種做法不僅會消耗大量Token,成本會很高,而且模型能不能從大量內(nèi)容里準確提取規(guī)則都會存疑,最后的效果會大打折扣。
評估校驗和完善邏輯規(guī)則,讓規(guī)則能用于業(yè)務(wù)生產(chǎn)環(huán)境
規(guī)則和變量初步創(chuàng)建成功后,還不能直接用于生產(chǎn)環(huán)境。接下來會對生成的規(guī)則進行評估、校驗,過程中,業(yè)務(wù)專家可以對這些規(guī)則進行修改和修訂,從而讓規(guī)則更準確和完善。評估、校驗大致是這樣的:
系統(tǒng)首先會用AI自動生成各種各樣的測試場景(省去了手動設(shè)計測試用例的麻煩),包含客戶可能問的問題和模擬模型給的答案,業(yè)務(wù)專家先對測試用例進行判斷,把它標記為有效(Valid)、無效(Invalid)或部分滿足(Satisfiable)。
比如,當用戶詢問:蘋果產(chǎn)品的退換貨政策是什么?
如果測試用例中回答,“蘋果產(chǎn)品有15天退貨期,5天內(nèi)商品完好可退貨”,則是完全符合規(guī)則的,人類專家會標記為有效(Valid)示例;
如果測試用例中回答,“蘋果產(chǎn)品15天內(nèi)可退貨?!暗鄙倭恕吧唐吠旰谩边@個條件,人類專家就會把它標記為部分滿足(Satisfiable)的示例;
如果測試用例中回答說,“蘋果產(chǎn)品30天內(nèi)可退貨?!蹦秋@然是違反規(guī)則的,人類專家就會把它標記為無效(Invalid)示例。
測試驗證時,由套上了”緊箍咒“的AI模型對測試用例進行判斷,如果判斷結(jié)果跟人為判斷是一致的,那這項測試就是通過了。如果發(fā)現(xiàn)不一致,專家可以通過自然語言反饋或直接編輯的方式,對規(guī)則進行微調(diào),確保其與真實業(yè)務(wù)邏輯完全吻合。
整個過程中由于有大模型的輔助,它還可以給出完善規(guī)則的建議。比如,某產(chǎn)品支持七天以內(nèi)退貨,人類專家判斷”退貨天數(shù)為7天“是有效(Valid)示例,而系統(tǒng)會認為規(guī)則不充分,應(yīng)該表述為在七天以內(nèi)可退貨。
通過這種人機協(xié)同的方式,策略的更新和迭代過程變得更可控、更可靠。把這套規(guī)則上線后,就成了業(yè)務(wù)模型的一套”緊箍咒“,實時審查AI在實際應(yīng)用中的每一次輸出,從而避免因業(yè)務(wù)幻覺帶來的風險。
從賭概率到算出來的確定性,AI進入可驗證的階段
當一些AI安全工具還在靠不確定的概率和經(jīng)驗時,Amazon Bedrock Guardrails的自動推理檢查功能提供了可被證明的信任,是具有確定性的安全保障,這對于金融、能源、醫(yī)療等高度監(jiān)管的行業(yè)至關(guān)重要。
亞馬遜云科技攜手普華永道(PwC)打造了一套面向公用事業(yè)的停電管理優(yōu)化系統(tǒng)。該方案通過自動推理檢查技術(shù),對AI生成的應(yīng)急響應(yīng)流程進行邏輯校驗和優(yōu)化,確保處理步驟既符合法規(guī),又具備可操作性。
普華永道全球及美國商業(yè)技術(shù)與創(chuàng)新官Matt Wood表示:“我們與亞馬遜云科技在自動推理檢查方面的合作,堪稱負責任的AI領(lǐng)域的重大突破。我們十分榮幸成為亞馬遜云科技該項創(chuàng)新成果的首發(fā)合作伙伴,未來還會將這一創(chuàng)新成果推廣至制藥、公用事業(yè)、云合規(guī)等各個領(lǐng)域?!?/p>
郭韌介紹稱,這里用的自動推理并非新的技術(shù)概念,它背后的符號式AI(Symbolic AI)是人工智能最早期的分支之一,其核心思想就是將世界知識轉(zhuǎn)化為邏輯符號,通過嚴謹?shù)耐评韥泶_保結(jié)論的正確性。
“過去十多年,亞馬遜云科技早已將自動推理技術(shù)大規(guī)模應(yīng)用于Amazon S3、Amazon IAM等核心服務(wù)的權(quán)限校驗與安全驗證中,”郭韌在技術(shù)分享會上介紹,“它一直是保障云服務(wù)安全可靠的幕后基石?!?/p>
這些在背后經(jīng)過多年打磨的經(jīng)驗,現(xiàn)在通過Amazon Bedrock Guardrails直接開放給客戶。這意味著,企業(yè)不再需要從零開始構(gòu)建復(fù)雜的邏輯校驗系統(tǒng),而是可以直接將亞馬遜云科技十年打磨的工具,快速構(gòu)建AI安全與合規(guī)能力,讓AI更靠近生產(chǎn)力。
目前,Amazon Bedrock Guardrails 中的自動推理檢查現(xiàn)已在以下區(qū)域全面推出:美國東部(俄亥俄州、弗吉尼亞州北部)、美國西部(俄勒岡州)和歐洲(法蘭克福、愛爾蘭、巴黎)。