
重點新聞(0406~0410)
TPU AI代理 A2A
Google揭新一代TPU、推跨平臺AI代理協定A2A
Google雲端年度大會Next 25在4月9日正式登場,Google雲端執行長Thomas Kurian揭露一系列重磅更新,除了有專為推理模型設計的新一代TPU處理器Ironwood,還祭出可支援AI代理跨平臺協作的Agent-to-Agent協定。
其中,Ironwood是Google第七代張量處理器(TPU),專為「會思考」的模型設計,比如大型語言模型(LLM)、混合專家(MoE)模型、推理模型,其每個晶片峰值運算能力為4,614 TFLOPs,可因應繁重的AI工作負載。再來,有別於用一套標準將模型、資料和工具連結起來的MCP協定,Google推出Agent-to-Agent協定(簡稱A2A),開發者可用來打造高互通性的代理。也就是說,只要是按A2A協定開發的AI代理,就能跨平臺、跨服務彼此溝通。
這對使用者來說,可以選擇不同廠商的AI代理、組合使用,系統可以兼容這些不同來源的代理。對企業來說,他們能在不同平臺或不同雲端服務間,統一管理各個代理,減少技術負擔。這個A2A協定,目前已獲50多家業者支援。(詳全文)
Amazon 語音轉語音 Nova Sonic
Amazon推出Nova Sonic語音轉語音模型
一如去年12月AWS:reInvent年會中預告的,Amazon最近終於推出全新基礎模型Amazon Nova Sonic,將語音理解和語音生成整合在單一的模型中,來實現語音轉語音。使用者可由AWS生成式AI服務Amazon Bedrock上的API使用,來簡化語音應用開發流程,例如客戶服務通話自動化,或是打造旅遊、教育、醫療、娛樂等領域的跨產業AI代理(AI agents)。
進一步來說,傳統的語音應用模型,並非單一模型,而是由多個模型組成,比如將語音轉為文字的語音辨識模型、理解並生成回應的大型語言模型(LLM)、將文字再轉為音訊的文字轉語音模型等。這種方法不僅增加開發的複雜性,也難以保留自然對話中重要的聲音情境和細微差別,如語氣、語調韻律和說話風格等。
不過,Nova Sonic採不同方法,將語義理解和語音生成功能,整合在單一模型中,讓模型能根據語氣、風格等聲音情境和口語輸入,來調整語音回覆,達到更自然的對話。比如,當模型捕捉到潛在的客戶語氣,從興奮轉為擔憂費用時,AI的語音回覆更具安撫性,並能即時提價格資訊。(詳全文)
開發環境 Google 自然語言
Google新推行動開發環境Firebase Studio,用自然語言就能開發
Google最近在旗下行動與Web應用開發平臺Firebase中,新推雲端開發環境Firebase Studio,並開放預覽試用。該服務結合AI助理、雲端IDE和Firebase生態系多項開發工具,專門鎖定想快速打造AI應用或全端Web服務的開發者。Firebase Studio的定位,並非取代Android Studio這類原生App開發工具,而是針對Web應用、AI功能和無伺服器架構的開發需求,提供一個可透過瀏覽器操作、整合AI協作機制,並支援即時雲端部署的開發環境。
在技術架構上,Firebase Studio繼承Project IDX的雲端虛擬機器架構,開發者可在瀏覽器中使用類似VS Code的編輯介面,包括完整的程式碼輔助、除錯工具和終端機操作能力。與Android Studio著重原生App開發不同,Firebase Studio預設的應用架構以Next.js為基礎,支援React生態系,並內建Genkit模組,自動配置Gemini API金鑰,讓開發者快速在Web應用中加入生成式AI能力。
Firebase Studio還加入自然語言驅動的App Prototyping代理工具,開發者可透過文字描述、圖片或草圖,快速產生可執行的Web應用原型,並直接在介面中與Gemini助理互動,修改介面設計、調整程式邏輯或新增功能。這些操作不僅能修改程式碼,也能自動處理Firebase服務的串接設定,例如使用者驗證、資料庫或人工智慧流程整合。(詳全文)
大型主機 生成式AI IBM
AI推論效能提高50%!IBM推出新一代大型主機z17
IBM揭露最新一代大型主機IBM z17,是經典Z系列的升級版,主打全面整合AI,範圍涵蓋硬體、軟體和作業系統,要讓企業能即時執行AI,提高營運效率和安全。進一步來說,IBM z17採用新一代 Telum II處理器,內建AI加速器,每天可執行4500億次推論、每次反應時間僅1毫秒,比前一代z16高出50%的AI推論運算量。z17的AI能力可應用於250多種情境,如風險評估、聊天機器人、醫學影像分析、零售防詐等。
再來,該主機採用PCIe擴充卡IBM Spyre Accelerator(預計2025第四季推出),可強化z17的生成式AI能力,讓主機可直接執行AI助理、分析內部資料等工作。而且,新系統支援還多模態AI,可同時處理文字、圖像等不同形式的資料,另也整合IBM watsonx系列工具,包含程式助理和Z助手,可助開發者、IT團隊更快偵錯與維護系統。
不只如此,在安全性方面,新主機還加入HashiCorp Vault技術,支援跨平臺密鑰與憑證管理,也支援AI自動偵測敏感資料功能,辨識潛在的網路攻擊。這臺z17預計在今年6月18日正式推出。(詳全文)
AI代理 開發管理 Google
Google瞄準AI代理,推出多款代理開發管理工具
在今年度Cloud Next大會中,Google揭露不少AI代理(Agent)工具,包括在自家AI開發平臺Vertex AI中,新添代理開發工具包Agent Development Kit(ADK),專門用來簡化AI代理的建置、測試和部署執行等工作,號稱不必寫到100行程式碼,就能完成代理建置。而且,這款ADK還支援MCP協定。
在這個ADK中,還有2項用來開發和部署代理的工具,分別是Agent Garden和Agent Engine。Google預計今年第三季提供ADK公開預覽版。另一項AI代理亮點是Google Agentspace新功能,企業使用者可直接從Chrome搜尋框來使用Agentspace的搜尋、分析和資訊整合功能,也能透過Agent Gallery(代理庫)來快速導入各種代理,或是部署Google自家的代理。
為顧及企業資料隱私需求,Google在原本的Google Distributed Cloud(GDC)平臺中,新支援企業本地段部署Gemini系列模型和Agentspace代理應用,預計今年第三季開始提供服務。此外,Google還打造AI Agent Marketplace市集,收錄第三方各種AI代理,來讓使用者隨插即用。甚至,他們還推出一項實用的自動化流程工具Google Workspace Flows,使用者用自然語言描述想完成的流程,AI代理就會自動設計整個邏輯流程,不必寫程式就能完成跨應用的工作自動化。(詳全文)
Anthropic Claude 聊天機器人
Anthropic也推200美元月費的個人版Claude方案
繼OpenAI推出月費高達200美元的Pro方案後,Anthropic日前也宣布,推出相同收費水準的頂級個人版AI聊天機器人訂閱方案Claude Max。此前,Anthropic針對個人用戶,僅有免費方案和每人每月20美元(年費200美元)的Pro方案,免費用戶每天可傳送100則訊息,Pro可享有免費方案5倍用量,每5小時可傳送45則短訊息。
Anthropic說Max方案適合與Claude大量對話的用戶,可用來改進作品、分析大量文件和複雜資料。Max又分成2種級別,其中月費100美元的擴充用量方案,適合經常用Claude來執行多種任務的用戶,提供Pro 5倍用量上限。另一種是最大彈性方案,月費200美元,提供Pro 20倍的用量限制,適合每天用Claude執行重要任務的用戶。(詳全文)
推理模型 Nvidia Llama
Nvidia揭露新模型,效能超越DeepSeek R1
Nvidia最近開源Llama-3.1-Nemotron-Ultra-253B-v1模型,號稱效能與DeepSeek R1相當,但只有一半的參數量。進一步來說,這款模型是Nvidia三月宣布的Llama Nemotron系列模型之一,這一系列共有Nano、Super和Ultra三個版本,其中8B參數的Nano可在PC和邊緣裝置執行、49B參數的Super可在單一GPU上執行,253B參數的Ultra則需要多顆GPU執行,其中Nano、Super已經開源。
最新發布的Llama-3.1-Nemotron-Ultra以Meta Llama-3.1-405B-Instruct為基礎,可支援128K字詞的上下文長度,能兼顧模型準確性和執行效率。因為,Nvidia用新的神經架構搜尋(NAS)技術,來降低3.1 Ultra所需的記憶體,可支援大型工作負載並減少執行模型需要的GPU數量。此外,Nvidia也用這個方法垂直壓縮本模型,大幅改善延遲性。
Llama-3.1-Nemotron-Ultra現已提供商用,可在Hugging Face下載。3.1 Ultra可支援多種應用場景,包含AI代理人系統、聊天機器人、RAG和其他AI應用,不過,模型主要支援程式語言和英文,以及德、法、義、葡、西語、泰語、北印度語等。(詳全文)
WordPress 網站架設 風格
WordPress.com推出AI工具架網站
Automattic旗下網站代管平臺WordPress.com最近提供AI Website Builder網站架設工具,使用者在幾分鐘內就能打造一個新網站,不需樣版,也不需寫程式,只要用自然語言告訴它需要什麼風格或網站用途,就能快速生成。
使用者進入AI Website Builder後,可在聊天對話框中盡可能詳述網站需求,例如是要展示作品集、部落格還是商業網站,另也能加進網站名稱或描述想要的風格,比如有趣、簡約、優雅等。接著系統開始建置網站,期間會進一步要求使用者選擇版面、顏色與字體,並完成網站雛型。之後,使用者還能給提示,讓AI工具客製化網站樣貌,例如新增社交媒體圖示等。(詳全文)
圖片來源/Google、IBM、Amazon、Nvidia、WordPress.com
AI近期新聞
1. GitHub Copilot正式推出AI代理模式
2. Midjourney測試最新一代圖片生成模型V7
3. 歐盟啟動「AI大陸行動計畫」,要趕上美、中AI建設
資料來源:iThome整理,2025年4月