中文字幕影片免费在线观看,末发成年娇小性XXXXX,最近中文字幕一,二区第1页

上圖示例展示的是銀行按揭貸款文檔生成的規(guī)則，圖片來自亞馬遜云科技博客

以電商平臺退換貨規(guī)定為例，系統(tǒng)會自動抽取文檔中的關(guān)鍵變量，如“產(chǎn)品類別”、“退貨天數(shù)”等，并梳理出它們之間的規(guī)則。例如，一份簡單的退貨文檔，系統(tǒng)就能自動提取出78條規(guī)則和81個變量。

雖然RAG技術(shù)也有助于緩解幻覺問題，但與這里的推理檢查有明顯不同。前者主要負(fù)責(zé)為大模型提供準(zhǔn)確、相關(guān)的背景知識。而推理檢查負(fù)責(zé)在推理的最后一步，驗證大模型基于知識生成的回答是否嚴(yán)格遵守業(yè)務(wù)邏輯和規(guī)則。

郭韌介紹稱，如果把規(guī)則文檔丟給RAG系統(tǒng)，讓RAG系統(tǒng)基于來提供規(guī)則約束力，這種做法不僅會消耗大量Token，成本會很高，而且模型能不能從大量內(nèi)容里準(zhǔn)確提取規(guī)則都會存疑，最后的效果會大打折扣。

評估校驗和完善邏輯規(guī)則，讓規(guī)則能用于業(yè)務(wù)生產(chǎn)環(huán)境

規(guī)則和變量初步創(chuàng)建成功后，還不能直接用于生產(chǎn)環(huán)境。接下來會對生成的規(guī)則進(jìn)行評估、校驗，過程中，業(yè)務(wù)專家可以對這些規(guī)則進(jìn)行修改和修訂，從而讓規(guī)則更準(zhǔn)確和完善。評估、校驗大致是這樣的：

系統(tǒng)首先會用AI自動生成各種各樣的測試場景（省去了手動設(shè)計測試用例的麻煩），包含客戶可能問的問題和模擬模型給的答案，業(yè)務(wù)專家先對測試用例進(jìn)行判斷，把它標(biāo)記為有效（Valid）、無效（Invalid）或部分滿足（Satisfiable）。

上圖展示的測試用例，用戶填寫期望結(jié)果，然后進(jìn)入驗證流程，圖片來自亞馬遜云科技博客

比如，當(dāng)用戶詢問：蘋果產(chǎn)品的退換貨政策是什么？

如果測試用例中回答，“蘋果產(chǎn)品有15天退貨期，5天內(nèi)商品完好可退貨”，則是完全符合規(guī)則的，人類專家會標(biāo)記為有效（Valid）示例；

如果測試用例中回答，“蘋果產(chǎn)品15天內(nèi)可退貨。“但缺少了“商品完好”這個條件，人類專家就會把它標(biāo)記為部分滿足（Satisfiable）的示例；

如果測試用例中回答說，“蘋果產(chǎn)品30天內(nèi)可退貨?！蹦秋@然是違反規(guī)則的，人類專家就會把它標(biāo)記為無效（Invalid）示例。

測試驗證時，由套上了”緊箍咒“的AI模型對測試用例進(jìn)行判斷，如果判斷結(jié)果跟人為判斷是一致的，那這項測試就是通過了。如果發(fā)現(xiàn)不一致，專家可以通過自然語言反饋或直接編輯的方式，對規(guī)則進(jìn)行微調(diào)，確保其與真實業(yè)務(wù)邏輯完全吻合。

整個過程中由于有大模型的輔助，它還可以給出完善規(guī)則的建議。比如，某產(chǎn)品支持七天以內(nèi)退貨，人類專家判斷”退貨天數(shù)為7天“是有效（Valid）示例，而系統(tǒng)會認(rèn)為規(guī)則不充分，應(yīng)該表述為在七天以內(nèi)可退貨。

通過這種人機協(xié)同的方式，策略的更新和迭代過程變得更可控、更可靠。把這套規(guī)則上線后，就成了業(yè)務(wù)模型的一套”緊箍咒“，實時審查AI在實際應(yīng)用中的每一次輸出，從而避免因業(yè)務(wù)幻覺帶來的風(fēng)險。

從賭概率到算出來的確定性，AI進(jìn)入可驗證的階段

當(dāng)一些AI安全工具還在靠不確定的概率和經(jīng)驗時，Amazon Bedrock Guardrails的自動推理檢查功能提供了可被證明的信任，是具有確定性的安全保障，這對于金融、能源、醫(yī)療等高度監(jiān)管的行業(yè)至關(guān)重要。

亞馬遜云科技攜手普華永道（PwC）打造了一套面向公用事業(yè)的停電管理優(yōu)化系統(tǒng)。該方案通過自動推理檢查技術(shù)，對AI生成的應(yīng)急響應(yīng)流程進(jìn)行邏輯校驗和優(yōu)化，確保處理步驟既符合法規(guī)，又具備可操作性。

普華永道全球及美國商業(yè)技術(shù)與創(chuàng)新官Matt Wood表示：“我們與亞馬遜云科技在自動推理檢查方面的合作，堪稱負(fù)責(zé)任的AI領(lǐng)域的重大突破。我們十分榮幸成為亞馬遜云科技該項創(chuàng)新成果的首發(fā)合作伙伴，未來還會將這一創(chuàng)新成果推廣至制藥、公用事業(yè)、云合規(guī)等各個領(lǐng)域?！?/p>

郭韌介紹稱，這里用的自動推理并非新的技術(shù)概念，它背后的符號式AI（Symbolic AI）是人工智能最早期的分支之一，其核心思想就是將世界知識轉(zhuǎn)化為邏輯符號，通過嚴(yán)謹(jǐn)?shù)耐评韥泶_保結(jié)論的正確性。

“過去十多年，亞馬遜云科技早已將自動推理技術(shù)大規(guī)模應(yīng)用于Amazon S3、Amazon IAM等核心服務(wù)的權(quán)限校驗與安全驗證中，”郭韌在技術(shù)分享會上介紹，“它一直是保障云服務(wù)安全可靠的幕后基石。”

這些在背后經(jīng)過多年打磨的經(jīng)驗，現(xiàn)在通過Amazon Bedrock Guardrails直接開放給客戶。這意味著，企業(yè)不再需要從零開始構(gòu)建復(fù)雜的邏輯校驗系統(tǒng)，而是可以直接將亞馬遜云科技十年打磨的工具，快速構(gòu)建AI安全與合規(guī)能力，讓AI更靠近生產(chǎn)力。

目前，Amazon Bedrock Guardrails 中的自動推理檢查現(xiàn)已在以下區(qū)域全面推出：美國東部（俄亥俄州、弗吉尼亞州北部）、美國西部（俄勒岡州）和歐洲（法蘭克福、愛爾蘭、巴黎）。

分享到

zhupb

相關(guān)推薦

近期文章

熱門標(biāo)簽