Gemini為核心，Google雲端AI戰略聚焦雲服務和生產力GAI

Google Cloud在會中提出一個生成式AI產品架構藍圖，將生成式AI產品架構從過去生成式AI開發工具為主的開發架構，變成是擴大延伸到各種雲端服務的產品架構。（圖片來源／Google Cloud）

「GAI代理（Agent）將會翻轉開發者、企業與運算裝置和Web的互動的方式。」Google Cloud執行長Thomas Kurian在今年Next大會開場時這樣強調，不分產業，企業紛紛利用生成式AI推動業務成長、增強用戶體驗，以及改善開發者生產力和提升IT維運效率，「許多行業正因為GAI而開始改變。」

過去一年，企業GAI應用的風潮席捲全球，成了三大公雲積極搶攻的新戰場，微軟靠著OpenAI助攻，去年在這場雲端GAI大戰中取得先機，而Google後來居上，靠著自家PaLM模型和GAI生產力工具來迎戰，AWS則是到去年底年會上，對於企業GAI應用布局才有比較完整的布局與揭露。

Google在生成式AI布局動作頻頻。去年8月的Next大會成了Google生成式AI的火力展示，更是對微軟Copilot戰略的反擊。進到2024年，Google更加快GAI產品發布和更新的腳步，積極布局新一代企業生成式AI建置需求。

在今年的Next大會上，Google Cloud執行長Thomas Kurian在開場時強調，今年的策略將聚焦於加速企業業務和產業數位轉型，他同時也揭露了在AI布局的多項成果，其中包括不到一年，已有上百家主要企業都已經開始在內部應用中採用Gemini，包括了麥當勞、德國銀行、HCA健康、USS、Mayo Clinic醫療機構等，在今年大會期間，更舉辦超過300場企業GAI應用實例，涵蓋金融業、零售業、醫療業、製造業等。

Vertex AI和各種雲端服務中開始引進新一代Gemini 1.5模型

Google在今年2月發表性能更強大、能夠支援超長文本的Gemini 1.5多模態模型，更成為今年Next最受囑目的焦點。

在Next大會，Google將這款最新版Gemini模型上架到生成式AI開發平臺Vertex AI的模型花園中，Gemini 1.5模型不僅可同時支援文字、圖片、影片、聲音及程式碼的輸入，而且在Token處理數量上也比1.0版多出了31倍，甚至比GPT-4 Turbo高出7.8倍，最多可支援輸入長達100萬個Token，相當於一次能處理1小時的影片、11小時的音訊或逾70萬字的內容。

Vertex AI先提供了中階款模型Gemini 1.5 Pro的公開預覽，並推出兩個不同規模的版本，分別能處理12.8萬個和100萬個Token數量的資料。Google強調，Gemini 1.5 Pro模型在輸出品質上足以媲美前一版最高階Gemini 1.0 Ultra模型，同時能減少運算量。

Gemini 1.5 Pro還支援處理語音音訊串流和視訊的音訊，並具備跨模態分析功能，能夠同時分析文字、圖片、視訊和音訊等不同類型的資料，此外，提供高品質的轉錄功能，可用於搜尋和分析。例如，可以使用Gemini 1.5 Pro對財報電話會議或投資人會議影片或錄音進行搜尋、分析和回答問題。

目前已有United Wholesale Mortgage、SAP、TBS、Replit等企業開始在Vertex AI平臺上使用新版模型建立新的AI應用，包含AI驅動的顧客服務代理、學術指導導師，還能用AI分析大量複雜的財務文件、檢測文件中資訊不一致，以及用自然語言進行資料集的探索。

最新的Gemini 1.5 Pro，現在也能在Gemini Cloud Assist雲端助手服務中以私人預覽方式提供，一次可以輸入最多30萬行的程式碼，意味著，可以在程式庫中執行大規模程式碼檢索、除錯及測試，亦有助於加快企業許多老舊系統的現代化改造，將大批老舊程式語言轉為現代語言。Google Cloud平臺與技術基礎架構總經理Brad Calder強調，Gemini程式開發AI助手讓開發人員的工作效率因此提高30%。

在Next大會上，Google提出了5種企業上雲轉型的新路徑，可從五種雲端服務類型開始上雲，分別是基礎架構雲、開發者雲、數據雲、資安雲、協作雲。Google也將最新Genini模型整合到這幾類雲服務中，像是協助回答問題，提供AI預測等。

以基礎架構雲為例，Google開始在企業資料中心部署的GDC分散式邊緣設備上提供各種開放AI模型，如Gemma、Llama等，並推出生成式AI搜尋支援功能，讓使用者可以透過自然語言搜尋從本地資料中心或邊緣環境上快速檢索和分析內部相關的資料和內容，從而提高員工工作效率和知識共享。

Google更推出了多項基礎架構的技術創新，可以用來支持龐大AI發展的需求，像是正式推出新版的TPU v5p，還推出A3 Mega、Nvidia Blackwell GPU運算平臺，支援大規模的GAI模型訓練與推論。Google更展示首款專為資料中心設計的Arm架構處理器Axion，跟同級的x86虛擬機相比， Axion效能提高了50%，能源效率也提升60%，未來有可能將其與TPU一同用於GAI模型服務。目前這款處理器已在Spanner、BigQuery、GKE、Google地球引擎和YouTube廣告服務中使用。

在雲端應用生命周期管理上，Google推出名為Gemini Cloud Assist的雲端維運助手的私人預覽，也就是先前專用於IT維運設計的Duet AI助手進化版，不只採用最新Gemini模型，能夠涵蓋應用程式生命週期的管理，提供包括目標設計、安全、維運指導、故障排除等多方面輔助功能。另外提供效能和成本優化的建議。（攝影／余至浩）

Google公布新生成式AI產品架構

Google Cloud在會中提出一個生成式AI產品架構藍圖，將生成式AI產品架構從過去生成式AI開發工具為主的開發架構，變成是擴大延伸到各種雲端服務的產品架構。

這個產品技術框架可以進一步分為4層，雖然和過去生成式AI開發平臺Vertex AI都是4層架構，但兩者在本質上有很大的差別。新架構最底層是AI Hypercomputer超級電腦基礎架構，專門針對生成式AI強化推出的基礎架構，提供AI模型訓練和服務所需的各種AI加速硬體、軟體框架和相關系統資源，與Vertex AI的底層是以一般性的雲端基礎架構為主有所不同。

再上一層是Gemini模型。原本Gemini只是Vertex AI模型花園中的一個模型，現在被拆分出來，成為與Vertex AI開發工具並重的另外一個重要的功能。這是因為Gemini模型已經變成支援Google Cloud所有產品的重要核心基礎模型。第三層是生成式AI平臺Vertex AI，包含了AI Studio、Colab、VS Code等各種GAI開發工具。最上層則是Google雲端服務和辦公生產力Workspace專用的Gemini助手，以及企業自建的生成式AI代理。

新產品架構下的Vertex AI平臺，現在進一步加強企業GAI 代理開發的支援。

例如在模型建置上，Google將Google搜尋作為可信來源的參考基準，推出Grounding with Google Search新服務，利用Google搜尋結果比對模型生成的內容，藉此提高回應品質並減少幻覺。在模型微調方面，Vertex AI提供簡化提示設計，讓開發者更容易撰寫出高品質的提示，並推出新提示管理工具，可用於管理、追蹤，比較不同提示版本的回應品質。此外，模型部署到正式環境前，開發人員也能利用新的模型評估機制AutoSxS比較兩個LLM模型版本的差異對於最後模型推論的影響，以此選擇最佳模型版本用於生產環境。

Google這次推出了一站式AI解決方案，稱作Vertex Al Agent Builder，該方案進一步結合「搜尋」和「對話」兩類GAI應用套件，能快速在企業內部應用建立和部署No Code對話式生成式AI代理，且可與企業系統相連接，讓生成的回覆內容可以貼近企業的實際情況。

Thomas Kurian指出，企業在Vertex AI中可以快速自建GAI代理，來執行不同任務，像是有顧客服務的AI代理、員工管理的AI代理，還有創意設計、數據分析、程式撰寫和資安等不同的AI代理。「每一個GAI代理都具有多模態執行能力，能夠同時處理多種資訊。」

Google公開了最新的TPU模組機架式機櫃（左圖）和雲端GPU機櫃（右圖），用來提供包含Gemini在內的GAI模型訓練和服務。每臺TPU模組機櫃最多可容納64個TPUv5p模組。（攝影／余至浩）

雲端AI維運助手不只提供雲成本優化的建議，還支援目標驅動設計

Google今年雲端產品發布中另一個重要焦點，著重在加強其雲端服務GAI整合能力，與去年剛推出時相比，現在在Google雲端服務中不僅可以使用GAI助手完成更多任務，進一步也將其擴大到更多的服務中。

Google今年開始以生成式AI助手Gemini為品牌，應用在各種雲端服務中，推出軟體開發AI助手、應用生命周期平臺的AI維運助手、資料分析平臺的AI分析助手，BI平臺的AI洞察助手，資料庫的A管理助手，以及資安的AI防護助手。

AI維運助手的最大特色是，引進最新Gemini模型，涵蓋應用程式生命周期的維運管理。

例如，AI維運助手現在能支援目標驅動設計的功能，讓維運人員可以用自然語言描述建立待測試的目標和使用者旅程流程，進而產生自訂的測試腳本，根據需求進一步提供架構配置、部署或設定，例如提供網路配置或協助三層架構應用程式部署、理解Terraform腳本等。

此外，還能蒐集和分析Cloud Logging中各種日誌，提供IT團隊相關摘要和解釋，並提供故障排除的建議。甚至在身分權限控管上也能使用AI維運助手提供IAM身份識別與存取管理的建議，例如根據企業資料、加密偏好以及合規性需求在加密金鑰建立過程中提供協助。

服務效能和成本優化也是AI維運助手這次新增的功能之一。例如可以偵測哪些叢集是在開發或測試環境中執行，或是被用於實驗的叢集，還可識別資源過剩的叢集並提供建議，讓管理者可以重新調整資源分配，降低雲端花費。

在資料服務的AI助手上，Google Cloud持續強化旗下資料產品與Gemini的整合。舉例來說，現在在BigQuery資料倉儲中，資料分析人員可以自然語言方式向Gemini助手提需求進行資料準備、查找、分析及治理，並且能夠使用Gemini 1.0 Pro，執行多模態和進階推理的功能。

不僅如此，BigQuery與Vertex AI之間的結合更緊密，使用者可以直接在BigQuery中存取Vertex AI中的AI 型，代表企業可以將這些AI模型、ML operators和統計分析功能納入到企業內部資料工作流程中，進行多模態析，包括結構化與非結構化資料。在BigQuery中能透過Vertex AI模型API處理文件檔案和音訊。不過目前這些Gemini功能大多處於預覽階段。

在應用開發輔助方面，Google宣布其程式撰寫AI助手現已達企業級的安全和可靠，並支援最新的Gemini 1.5 Pro，可以在程式庫中執行大規模程式碼檢索、除錯及測試。在雲端資安防護方面也強化了與Gemini的整合。例如，將Gemini整合至SecOps維運流程中，並開始在威脅智慧情報服務與SCC安全指揮中心中提供相關的Gemini服務。

除了推出算力更強的AI硬體，Google首款資料中心設計的Arm架構處理器Axion首次公開亮相，未來有可能將其與TPU一同用於GAI模型服務。目前這款處理器已在Spanner、BigQuery、GKE、Google地球引擎和YouTube廣告服務中使用。（攝影／余至浩）

企業辦公生產力工具深度整合Gemini能力，還增添影片創作AI助手Vids

企業生產力應用是另一大雲端GAI戰場。為了力抗微軟M365，Google Workspace在今年二月開始引進Gemini模型，加強對Workspace內容的多模態進階理解能力，Google同時也將Workspace的AI助手Duet AI改名為Gemini，並推出商用版與企業版，提供更多企業級功能。

Workspace目前擁有超過30億使用者和超過1,000萬付費訂閱客戶。Google Workspace的副總裁兼總經理Aparna Pappu表示，在近8個月內，在Workspace中使用Gemini服務的用戶超過一百萬人，還有上千家企業採用，包括Uber、Verizon、Sports Basement等。

Workspace今年產品更新一大重點就是GAI。Gemini現在已經能夠跨Workspace產品線生成內容，Chat和Docs中都開始使用最新的Gemini模型。

在Gmail中新增語音提示和即時潤色，只需向Gemini說出「幫助我寫作」，就能完成草稿，並且一鍵轉換為完整的電子郵件。Meet上新增了AI會議和傳訊的擴充功能，每位用戶每月10 美元，可以提供「為我做筆記」、「為我翻譯」等功能。還可以自動檢測和翻譯Meet中的字幕，最多支援 69 種語言，並在預覽版Chat中自動翻譯訊息、對話摘要和問題回答，將於今年稍後推出。

Google也透過AI加強Workspace的資安防護，推出AI Security商用附加服務，能夠協助資安人員自動分類Google硬碟中的敏感文件並提供防護。此外在測試版Gmail中開始提供DLP資料外洩防護的控制和分類標簽功能，甚至之後將實驗後量子加密PQC演算法納入其中。

Workspace這次還推出了全新的AI影片創作生產力服務Google Vids。這是一個整合影片、寫作、製作和編輯的AI助手，讓即使是不熟悉影片創作的行銷人員也能快速製作出各種影片內容，用於產品行銷、人才培訓、團體慶祝等活動。 Vids雖然採用了Gemini模型，但與OpenAI的短片生成AI模型Sora不同，並非生成完整的影片內容，而是根據使用者的描述從影片資料庫中找出相應的影片、圖片和背景音樂的場景，然後將它們整合在一起，協助使用者完成分鏡腳本、後製和編輯。這項實驗性服務預計在6月推出。

隨著GAI應用在2024年大爆發，Thomas Kurian強調，企業正在迎來一個GAI代理的新時代，並且建立在全新、完全開放的AI平臺之上，「我們正在重塑雲端基礎架構，以因應此一趨勢。」

不只搶攻雲端GAI，Google正在透過在手機上執行的輕量Gemini模型，以及用相同技術所開發的開源邊緣AI模型Gemma，瞄準企業邊緣GAI應用需求。

相關報導

熱門新聞