Google雲端如何布局2024 AI新戰略

相較於微軟、AWS，Google更強調AI的工具性意義，Google Cloud執行長Thomas Kurian指出，GCP的GAI發展目標是，讓每一個人都可以運用GAI，將聚焦三大戰略，包括AI建置、AI運用和AI生態圈。（圖片來源／Google）

在2023年8月的Next大會上，Google Cloud公布了GAI的三大戰略，但是這個戰略中最關鍵的一塊拼圖，直到2023年12月初，緊接著在AWS年度大會結束之後，Google 才發表了他們最強也是最新一代的LLM模型Gemini，隔周並在自家AI開發套件Vertex AI上釋出了企業用的Gemini Pro版模型預覽版，免費試用。Google的GAI戰略至此才揭露了更完整的樣貌。

在去年8月的Next大會中，Google執行長Sundar Pichai在開場演講時強調，Google近幾來採取了AI優先戰略，在所有產品中都導入AI，「Google的願景是，讓AI可以幫助每一個人。」他強調。

讓每一個人都可以運用GAI

相較於其他兩家公雲，Google更強調AI的工具性意義，而Google Cloud執行長Thomas Kurian指出，GAI正是AI的其中一種，新的戰略目標是，讓每一個人都可以運用GAI，將聚焦三大GAI戰略，包括AI建置、AI運用和AI生態圈。一方面讓GCP基礎架構和開發工具，都能支持GAI應用的建置，其次要透過各種AI助手，讓人人更容易運用AI，最後則要整合各種第三方AI技術和廠商，來建立AI生態系。

在AI建置的戰略上，Google從軟體到硬體都聚焦對AI運算需求的滿足，像是GKE企業版強化了對GPU運算的調度支援，更發表了第五代的AI加速晶片產品Cloud TPU v5e，也發表了可將Vertex AI推論應用部署到本地端或邊緣環境的Google 分散式雲端（Google Distributed Cloud）產品。而在開發工具上，Google原有的通用型AI開發平臺Vertex AI，更是全面轉型為生成式AI的開發平臺，以生成式AI應用開發為主打。

Google原有AI開發平臺Vertex AI轉為生成式AI的開發平臺，底層提供各種LLM模型的模型花園，再上一層是AI技術平臺層，接著是搜尋和對話的NoCode開發套件層。最上層是AI解決方案及生成式AI助手Duet AI。（圖片來源／Google）

新版Vertex AI平臺提供了一個涵蓋生成式AI應用開發周期的開發框架，還可細分為四層，底層提供各種LLM模型的模型花園，包括Google自家模型和多種開源或第三方模型。再上一層則是AI技術平臺層，包括了各種外掛、連結器、Grounding校準、提示工程、調校、評估、過濾等不同AI應用開發階段的機制或工具。

第三層則是NoCode開發套件層，提供兩種常見GAI需求「搜尋」和「對話」的NoCode開發套件，能快速在企業內部應用整合出這兩類客製GAI應用。最上層是Google的各項AI解決方案，以及Google用來和微軟Copilot打對臺的生成式AI助手Duet AI。Google以雲端硬碟作為互通基礎，讓Duet AI助手可以存取到不同Workspace產品線的各類資料，來提供整合式的生成回答內容。

在AI運用上，除了整合到辦公室套件的AI助手之外，Google也推出不同用途的AI助手，像是Duet AI整合到GCP兩大資料平臺產品BigQuery和Cloud Spanner上，可以用來生成SQL語法和Python語法，簡化資料科學家的作業。此外，Duet AI可以整合到GCP雲端監控工具中，成為雲端維運的AI助手，讓企業管理人員用自然語言方式來監控各項雲端資源狀態。

不論是在AI建置平臺或Duet AI助手，都提供了可以整合第三方平臺、技術或資料源的機制，可用來擴大Google Cloud整個AI生態圈的規模。

Thomas Kurian指出，生成式AI帶來了全新的上雲方式，Google三大戰略想要實現的目標是，從開發建置、不同場景的運用，以及AI生態圈的布局，來提供企業上雲實現轉型的新途徑。

Gemini要通吃雲和端的GAI應用

去年12月，Google Cloud終於揭曉了GAI戰略最關鍵的一塊拼圖，發表了新一代的LLM模型Gemini，包括高階Ultra版，中階Pro和低階Nano版模型。Ultra版能同時分辨和理解文字、圖片和聲音，也可以用來分辨和解釋幾種熱門開發語言。Duet AI for Workspace預計在2024年初也會引進Gemini模型，可以對分析內容提供多模態的進階理解能力。

與其他知名模型最大不同是，Gemini提供了可在手機上執行的Nano版本，不僅如此，Gemini Pro的SDK除了支援Python，更支援兩大行動平臺Android的Kotlin和iOS應用的Swift，還有Web前後端開發主流JavaScript和Node.js語言。這些布局都反映出Google要將自家GAI戰略延伸到Android世界，甚至是iOS世界的企圖心。

不只推出新版模型，Google也正式推出了免費的網頁版GAI開發工具AI Studio，這款模型最大特色是可以透過提示工程設計出一項AI功能或一隻簡單的AI應用，並生成對應的程式碼，方便輸出到其他環境再利用，也能提高GAI應用的後續修改和客製彈性，甚至是移植到企業自家環境中部署。

在Vertex AI平臺上先上架了Gemini Pro模型API預覽版和可分析影片的Gemini Pro Vision版本API。Vertex AI新增多項GAI開發功能，例如RAG快速建置工具，與外部資料或API的互動機制，多模型的協作框架，自動化模型評比，更多GAI控制機制等，Vertex AI的功能逐漸從模型開發，延伸到了模型部署，維運管理等LLM模型的MLOps流程。其中最特別的新功能是調度多個模型協同運作的能力，Google將提供一套調度框架，可以用來串連和連結不同模型之間的運作，共同產生更好的回應內容。

Google發表AI超級電腦架構

Google Cloud在去年12月初的發布中，除了引起高度關注的Gemini模型之外，還有一項特別的GAI基礎架構，專門鎖定企業自行訓練大型語言模型的需求，Google提出了AI Hypercomputer超級電腦架構，這是一個集結了涵蓋網路、儲存和運算晶片等各類效能最佳化硬體，搭配AI訓練和推論運算用的開放軟體，以及多種算力使用模式這三者組合而成的超級電腦架構。在這套架構中，可以整合GPU和Google自製晶片TPU，甚至包括了最新的TPU v5p，單一Pod叢集中可以組合最多達8,960顆TPU來運算。

（圖片來源／Google）

Google更拿出了內部用來調度全球規模工作負載的Borg技術中的動態工作負載排程工具Dynamic Workload Scheduler，Kubernetes就是仿造Google內部Borg系統的設計，所打造出來的開源專案。Dynamic Workload Scheduler可以即時管理數百萬個ML運算任務，Google在2023年11月就公開了用Dynamic Workload Scheduler管理5萬顆TPU v5e，來執行LLM模型分散式訓練任務的實例論文。Google釋出了這個超級電腦架構，可供企業自行訓練LLM模型時的參考。

不論是哪一家公雲，大抵都可以分為GAI基礎架構、GAI工具鏈和GAI應用這三個層面來布局，不論哪一家都開始投入AI晶片、AI系統、軟硬體整合的研發，來強化自家的GAI算力基礎架構，來滿足自身，或大型企業訓練LLM的龐大算力需求，工具鏈則出現了專用GAI開發工具，甚至是免程式碼的GAI開發工具，來加速或降低GAI的開發門檻。甚至，三大公雲的GAI開發工具，也相當注重與企業原有商用軟體、其他應用系統、現有資料源的整合，要讓企業更容易將GAI功能整合到自家系統中。

三大公雲也開始推出不同種類的企業級GAI助理，從兩大巨頭力推的辦公室通用型AI助手，也有資安、雲端架構等專門技術領域的AI助手，或是用於特定用途的AI助手，例如Java升級轉換AI助手，這都反映出，GAI助理將會越來越深入企業日常的工作中。

雖然，企業級AI助理的安全考量和規範，遠高於個人使用的GPTs。隨著GPTs商店數百萬款客製化AI助理的出現，2024從年初就吹起了一股人人都能自製GAI的浪潮。三大公雲巨頭的提前布局，提供了更多GAI工具和技術框架可選，將更有助企業勇於嘗試更多的GAI應用。

相關報導

熱門新聞