雲端服務廠商Cloudflare推出4款工具,來支援使用者建置、部署遠端MCP伺服器。

圖片來源: 

Cloudflare

重點新聞(0321~0327)

 MCP     OpenAI     Cloudflare  

OpenAI支援MCP協定、Cloudflare新添4款遠端MCP伺服器工具

最近,OpenAI執行長Sam Altman在X上發文表示,OpenAI的所有產品將支援Anthropic提出的Model Context Protocol(MCP)協定。進一步來說,MCP是一種開源標準,就像USB介面一樣,可讓模型連接不同的工具和資料來源,生成更準確的回應。Sam Altman指出,OpenAI已在Agents SDK中支援MCP,其他服務如ChatGPT桌面應用程式和Responses API很快也會支援,未來幾個月還會分享更多自家產品的MCP計畫。

另一方面,雲端服務廠商Cloudflare也宣布新增4款工具,來讓使用者快速建置、部署遠端MCP伺服器:

  1. 簡化OAuth驗證的workers-auth-provider
  2. Cloudflare Agents SDK中專門處理遠端傳輸的McpAgent
  3. 讓MCP客戶端與遠端MCP伺服器協作的適配器mcp-remote
  4. 可讓使用者連接到遠端MCP伺服器的AI Playground聊天介面

Cloudflare指出,遠端MCP伺服器的優勢,在於可透過網路存取,使用者只需登入並透過熟悉的授權流程,就能提供MCP客戶端授權存取權限。這麼做,可以把大型語言模型和AI代理的應用拓展至更多受眾、更多使用情境。(詳全文)

AI代理     資安     微軟  

微軟Security Copilot新添10款AI代理人

最近,微軟在去年推出的Copilot for Security安全聊天機器人中新添了10種AI代理人,來自動化資安工作,預計在4月提供預覽版。這些新代理人包括5項微軟自製的AI代理人功能,以及合作夥伴開發的功能。就前者來說,有Defender中的釣魚分類代理人,可分類釣魚警示,準確分辨哪些是真正的網路威脅,哪些是誤判。

再來有資料治理方案Purview中的警示分類代理,可將資料外洩及內部員工警示加以分類、排序重大事件,並可根據管理員回饋改進準確率。存取管理方案Entra的條件式存取優化代理人,可監控未被現有政策涵蓋的新用戶或App,辨識出必要的安全更新、提供快速修補建議。

Intune漏洞矯治代理人可監控並排序漏洞與矯正措施,來解決App和政策配置的問題。Security Copilot的威脅情報簡報代理人,可根據企業獨特屬性和曝險程度,自動安排最相關、適用的威脅情報。微軟合作夥伴也提供5項代理人,包括隱私外洩回應、監控VPN或閘道、評估安全監控中心(SOC)、安全警示分類,以及重大網路威脅警示優先排序等功能。(詳全文)

  Gemini 2.5     Google     推理能力  

Google發表具推理能力的模型Gemini 2.5

繼去年揭露首個具推理能力的Gemini 2.0 Flash Thinking模型後,Google日前發表了Gemini 2.5模型,是Gemini新一代模型家族的最新成員,在多項測試中勝過OpenAI o3-mini、DeepSeek R1等模型。

Gemini 2.5具備100萬字符(token)的上下文長度,很快會再升級到200萬字詞。這個新模型能理解龐大的資料集,處理不同資料源,包括文字、影像、音訊甚至整個程式庫的資料,來解決複雜的問題。Gemini 2.5將提供多種版本,首先是Gemini 2.5 Pro Experimental,是Google處理複雜任務的最進階模型。

目前,Gemini 2.5 Pro Experimental透過Google AI Studio提供給開發者和企業使用,付費的Gemini Advanced方案使用者也能在桌機或手機上使用。Google預告,幾周內Gemini 2.5 Pro Experimental將在Vertex AI平臺上線。(詳全文)

  推理效率    基準測試      ARC-AGI-2  

新一代基準測試ARC-AGI-2登場,挑戰AI的推理效率與通用能力

由ARC Prize基金會主導開發的通用AI基準測試ARC-AGI,最近釋出第二版ARC-AGI-2。相較於前一版,第二版提高了難度,設計仍維持對人類解題者相對容易,但對AI系統極具挑戰性的特性,可用來評估AI在未知情境中的即時推理能力和學習效率。

ARC團隊也根據第二版測試結果,歸納出AI目前的三大困難,首先是符號詮釋,AI系統能辨識圖形對稱和圖像變化,但無法理解符號背後的語意或邏輯功能;再來是組合推理(Compositional Reasoning),當題目需要同時套用多組規則或這些規則彼此影響時,現行模型容易出錯;第三是情境式規則應用,模型傾向於對表面模式過度擬合,缺乏根據上下文靈活調整規則運用的能力。

另一方面,ARC-AGI-2也將解題成本納為效率指標。團隊表示,人類解題成本約為每題17美元,但OpenAI o3系列系統則需約200美元以上的資源,才能完成極少量題目,突顯出解得出來與解得有效率之間的落差。ARC團隊強調,真正的智慧不應僅止於問題能否解決,而是能否以近似人類的資源使用效率快速做出正確判斷。(詳全文)

  AI代理     Nvidia     跨框架  

加速整合跨框架AI代理,Nvidia開源AgentIQ工具

Nvidia開源一套工具套件AgentIQ Toolkit,可讓開發者在現有架構中,快速整合多個AI代理,還能加速跨框架的代理系統開發與部署。這個套件特別針對AI應用的模組化、協作化趨勢設計,將每個代理、工具和工作流程抽象為函式呼叫,讓開發者得以重複使用既有資源,靈活組合應用場景,而不需重新建構原有技術堆疊。

進一步來說,AgentIQ可兼容LangChain、LlamaIndex、[Crew.ai](http://crew.ai/)、Microsoft Semantic Kernel等常見的代理框架,也能納入企業自建的Python代理模組。就算是已開始導入代理技術的企業,AgentIQ也能成為有彈性的基礎設施選項。AgentIQ核心組件之一是內建的Profiler工具,能精細地記錄每個代理與工具的輸入、輸出Token數、推理延遲與回應時間,並進一步辨識效能瓶頸。此外,AgentIQ也支援與OpenTelemetry相容的觀測平臺整合,方便系統管理人員即時監控、除錯整體流程。AgentIQ也有套完整的評估機制,可針對RAG或端對端系統進行一致性測試,並快速評估工具或模型替換對整體結果的影響。(詳全文)

  GPU     Nvidia     Dynamo  

更有效運用GPU資源,Nvidia開源推論軟體Dynamo

Nvidia日前開源一款推論軟體Nvidia Dynamo,可大幅提高模型推論表現。Dynamo有4個關鍵元件,分別是GPU資源規畫器、智慧型路由器、低延遲通訊庫,以及KV快取管理器。其中,GPU資源規畫器是個規畫與調度引擎,可依據不斷變化的使用者需求,動態新增或刪除GPU;智慧型路由器則是個可理解大型語言需求和特性的路由器,能在大規模部署的GPU群組中,將請求分配到最適合的GPU上進行處理,並減少對於重複請求的重新運算。

再來,低延遲通訊庫是個針對推論最佳化的工具集,可支援不同GPU間、不同類型記憶體和儲存類型的資料傳輸,來提高推論效率。KV快取管理器是個快取卸載引擎,會根據需求將KV快取資料轉移到不同的記憶體儲存層次中,以釋放寶貴的GPU記憶體,同時保持用戶體驗。經Nvidia測試,使用相同數量的GPU、在Hopper平臺上執行各種Llama模型,Dynamo能讓AI工廠的表現和營收翻倍;在GB200 NVL72機架的大型叢集上執行DeepSeek-R1模型時,Dynamo也能將每個GPU產生的Token數量,提高超過30倍。(詳全文)

  語音模型     OpenAI     語言  

OpenAI推出新語音模型

OpenAI最近推出新一代語音轉文字模型和文字轉語音模型,強化了多語言語音代理開發能力。這些新模型在語音辨識準確度、語音合成表現與客製化能力都有提升,相較於舊版Whisper和其他模型,在字詞錯誤率(WER)的表現更好。

其中,語音轉文字模型包括了gpt-4o-transcribe和gpt-4o-mini-transcribe,皆以強化學習和大規模語音資料集預訓練,提高模型對不同語言、口音、語速變化與噪音環境的適應能力。而文字轉語音模型則是gpt-4o-mini-tts,強化了語音輸出的可調整性,開發者可透過指指令來調整語氣和風格。不過,OpenAI仍維持對語音合成技術的安全管控,目前只提供人工預設語音,且會進行監測,來確保語音輸出符合規範。(詳全文)

  ChatGPT     圖片生成     GPT-4o  

ChatGPT圖片生成功能升級為GPT 4o模型,免費版也能用

OpenAI最近宣布將GPT 4o模型部署到ChatGPT的圖片生成功能,以生成品質更好的圖片,幾乎所有用戶都用得到。GPT 4o是以大量多樣化圖片和文字訓練而成,可生成高度擬真的圖像,而它本身具備龐大的圖、文知識,及分析上傳圖片的能力,使其得以生成實用而美觀的圖片。

OpenAI強調,經過「積極後訓練」的GPT 4o具備驚人視覺能力,可生成能感知情境(context-aware)且具一致性的圖片;其文字渲染能力可混合精確符號和圖像,將用戶輸入的文字轉化成圖片;4o的多回合生成功能,可讓用戶以自然語言改進生成的圖片;它還可以遵循詳細指令,來完成精確細節,且有別於其他模型只能處理5到8個物件,4o可以處理10到20個物件,物件可緊密整合其特徵及關係,方便用戶控制。現在不僅Pro、Plus、Team方案用戶可使用,連免費版ChatGPT都能獲得GPT 4o作為圖片生成器的預設模型。(詳全文)

圖片來源/Cloudflare、微軟、Google、ARC Prize

  AI近期新聞 

1. Nvidia推出具推理能力的Llama Nemotron系列模型

2. 阿里巴巴釋出多模態模型Qwen2.5-Omni-7B

資料來源:iThome整理,2025年3月

熱門新聞

Advertisement