AWS宣布在其生成式人工智慧安全解決方案Amazon Bedrock Guardrails中,新增自動化推理檢查(Automated Reasoning checks)功能,目前以預覽版形式推出,避免生成式人工智慧回應中的事實性錯誤,尤其是來自模型的幻覺問題。
Amazon Bedrock Guardrails整合內容過濾、個資去除與上下文檢查等功能,目的是要提升生成技術的安全性與可信度,而新增的自動化推理檢查進一步強化了該工具的準確性防護能力。
自動化推理檢查是一項基於數學與邏輯的技術,主要用於檢查系統行為是否符合預期,而這與機器學習仰賴資料進行預測的方式不同,自動化推理運用數學和邏輯方法進行驗證,確保系統回應符合已定義的規則。AWS提到,他們已經將自動化推理應用於儲存、網路、虛擬化和加密等領域,而現在進一步擴展至生成式人工智慧,提供準確性保證。
該技術的核心在於透過政策規則的形式化(Formal)建置與驗證,檢查生成式人工智慧是否遵循特定的事實與邏輯,例如在企業內部的應用,自動化推理檢查可用於檢驗與人力資源政策、產品資訊和操作流程相關的回應,確保輸出的內容與組織內部規範一致。
企業可以將操作手冊等文件上傳至Amazon Bedrock,系統會自動分析文件內容並生成相應的邏輯規則。這些規則會被轉換成精確且結構化的數學或邏輯表達方式,也就是形式邏輯,使系統能夠有效理解並加以運用,以驗證生成式人工智慧輸出的準確性。
當系統發現回應內容違背政策規則,則系統會標示為無效,並提供詳細的邏輯解釋與改進建議。這套機制也可以與提示詞工程、檢索增強生成(RAG)和上下文檢查結合使用,執行多層次安全防護。
AWS表示,這項技術使得生成式人工智慧應用案例,能夠具有更高的準確性與可解釋性,特別適用於需要高度事實性的業務應用,而且該技術不僅提供防護功能,還能協助用戶分析並改進回應,逐步提升整體系統可靠性。
自動化推理檢查目前已經在美西奧勒岡地區Amazon Bedrock Guardrails提供預覽版服務,官方計畫在未來數周內,將會在Amazon Bedrock控制臺開放註冊表單,供更多使用者測試。
熱門新聞
2025-01-06
2025-01-06
2025-01-06
2025-01-06