OpenAI提供企業自製代理人的新工具

圖片來源:

OpenAI

OpenAI周二發表首批協助開發人員及企業更快自己打造AI代理人的工具套件，包括新的Responses API及Agents SDK。

過去這幾年OpenAI推出了多種模型新功能，包括進階推理、多模態互動，以及安全技術，使其模型得以處理複雜、多步驟任務，以方便企業打造AI代理人。但是仍有企業覺得把這些功能加入代理人難度很高，往往需要多次提示迭代及自訂協調邏輯，但透通管理或支援功能不足。

為解決這些問題，OpenAI公布了一系列新API和工具，專門用以簡化代理人應用程式的開發。首先是新推出的Responses API，它結合Chat Completions API的簡易性及Assistants API使用工具的能力。其次是內建於Responses API的工具，包含網頁搜尋、檔案搜尋及電腦使用模型。

三種能力中，Responses API的網頁搜尋功能現為預覽版。同時間，Chat Completions API則提供微調過的搜尋模型gpt-4o-search-preview 及 gpt-4o-mini-search-preview（費用在此）。Responses API的檔案搜尋功能定價為每千次查詢2.5美元，檔案儲存功能為1日1GB 0.1美元，第1GB免費。Responses API的電腦使用能力/模型與Operator的使用電腦的代理人（Computer-Use Agent，CUA）模型相同。OpenAI強調在電腦及瀏覽器使用效能上優於業界的SOTA。

其次，OpenAI還宣布新增Agents SDK，可用以協調單一或多代理人的工作流程。這個SDK可和Responses API、Chat Completions API結合使用，也能整合其他業者的模型，只要後者提供類似Chat Completions的API端點。Agents SDK也整合了追蹤和監看代理人工作流程的可觀測性（observability）工具。

OpenAI現已將Agents SDK開源，並強調它協調多代理人工作流程的能力，較去年釋出的實驗版SDK Swarm有多方改進，包括更容易配置的LLM、代理人間的智慧交接控制、安全護欄，以及視覺化追蹤、除錯及優化能力。開發人員可以立即將Agents SDK整合到Python codebase，OpenAI說，之後也會支援Node.js。

OpenAI相信這些新工具能簡化核心代理人邏輯、協調和互動，方便開發人員著手打造代理人。OpenAI計畫未來幾個星期到幾個月內，會再發表其他工具，進一步簡化在其平臺上自建代理人的難度。圖片來源／OpenAI

熱門新聞