
OpenAI
OpenAI周二發表首批協助開發人員及企業更快自己打造AI代理人的工具套件,包括新的Responses API及Agents SDK。
過去這幾年OpenAI推出了多種模型新功能,包括進階推理、多模態互動,以及安全技術,使其模型得以處理複雜、多步驟任務,以方便企業打造AI代理人。但是仍有企業覺得把這些功能加入代理人難度很高,往往需要多次提示迭代及自訂協調邏輯,但透通管理或支援功能不足。
為解決這些問題,OpenAI公布了一系列新API和工具,專門用以簡化代理人應用程式的開發。首先是新推出的Responses API,它結合Chat Completions API的簡易性及Assistants API使用工具的能力。其次是內建於Responses API的工具,包含網頁搜尋、檔案搜尋及電腦使用模型。
三種能力中,Responses API的網頁搜尋功能現為預覽版。同時間,Chat Completions API則提供微調過的搜尋模型gpt-4o-search-preview 及 gpt-4o-mini-search-preview(費用在此)。Responses API的檔案搜尋功能定價為每千次查詢2.5美元,檔案儲存功能為1日1GB 0.1美元,第1GB免費。Responses API的電腦使用能力/模型與Operator的使用電腦的代理人(Computer-Use Agent,CUA)模型相同。OpenAI強調在電腦及瀏覽器使用效能上優於業界的SOTA。
其次,OpenAI還宣布新增Agents SDK,可用以協調單一或多代理人的工作流程。這個SDK可和Responses API、Chat Completions API結合使用,也能整合其他業者的模型,只要後者提供類似Chat Completions的API端點。Agents SDK也整合了追蹤和監看代理人工作流程的可觀測性(observability)工具。
OpenAI現已將Agents SDK開源,並強調它協調多代理人工作流程的能力,較去年釋出的實驗版SDK Swarm有多方改進,包括更容易配置的LLM、代理人間的智慧交接控制、安全護欄,以及視覺化追蹤、除錯及優化能力。開發人員可以立即將Agents SDK整合到Python codebase,OpenAI說,之後也會支援Node.js。
OpenAI相信這些新工具能簡化核心代理人邏輯、協調和互動,方便開發人員著手打造代理人。OpenAI計畫未來幾個星期到幾個月內,會再發表其他工具,進一步簡化在其平臺上自建代理人的難度。圖片來源/OpenAI
熱門新聞
2025-03-10
2025-03-10
2025-03-10
2025-03-10