在2023年8月的Next大會上,Google Cloud公布了GAI的三大戰略,但是這個戰略中最關鍵的一塊拼圖,直到2023年12月初,緊接著在AWS年度大會結束之後,Google 才發表了他們最強也是最新一代的LLM模型Gemini,隔周並在自家AI開發套件Vertex AI上釋出了企業用的Gemini Pro版模型預覽版,免費試用。Google的GAI戰略至此才揭露了更完整的樣貌。
在去年8月的Next大會中,Google執行長Sundar Pichai在開場演講時強調,Google近幾來採取了AI優先戰略,在所有產品中都導入AI,「Google的願景是,讓AI可以幫助每一個人。」他強調。
讓每一個人都可以運用GAI
相較於其他兩家公雲,Google更強調AI的工具性意義,而Google Cloud執行長Thomas Kurian指出,GAI正是AI的其中一種,新的戰略目標是,讓每一個人都可以運用GAI,將聚焦三大GAI戰略,包括AI建置、AI運用和AI生態圈。一方面讓GCP基礎架構和開發工具,都能支持GAI應用的建置,其次要透過各種AI助手,讓人人更容易運用AI,最後則要整合各種第三方AI技術和廠商,來建立AI生態系。
在AI建置的戰略上,Google從軟體到硬體都聚焦對AI運算需求的滿足,像是GKE企業版強化了對GPU運算的調度支援,更發表了第五代的AI加速晶片產品Cloud TPU v5e,也發表了可將Vertex AI推論應用部署到本地端或邊緣環境的Google 分散式雲端(Google Distributed Cloud)產品。而在開發工具上,Google原有的通用型AI開發平臺Vertex AI,更是全面轉型為生成式AI的開發平臺,以生成式AI應用開發為主打。
Google原有AI開發平臺Vertex AI轉為生成式AI的開發平臺,底層提供各種LLM模型的模型花園,再上一層是AI技術平臺層,接著是搜尋和對話的NoCode開發套件層。最上層是AI解決方案及生成式AI助手Duet AI。(圖片來源/Google)
新版Vertex AI平臺提供了一個涵蓋生成式AI應用開發周期的開發框架,還可細分為四層,底層提供各種LLM模型的模型花園,包括Google自家模型和多種開源或第三方模型。再上一層則是AI技術平臺層,包括了各種外掛、連結器、Grounding校準、提示工程、調校、評估、過濾等不同AI應用開發階段的機制或工具。
第三層則是NoCode開發套件層,提供兩種常見GAI需求「搜尋」和「對話」的NoCode開發套件,能快速在企業內部應用整合出這兩類客製GAI應用。最上層是Google的各項AI解決方案,以及Google用來和微軟Copilot打對臺的生成式AI助手Duet AI。Google以雲端硬碟作為互通基礎,讓Duet AI助手可以存取到不同Workspace產品線的各類資料,來提供整合式的生成回答內容。
在AI運用上,除了整合到辦公室套件的AI助手之外,Google也推出不同用途的AI助手,像是Duet AI整合到GCP兩大資料平臺產品BigQuery和Cloud Spanner上,可以用來生成SQL語法和Python語法,簡化資料科學家的作業。此外,Duet AI可以整合到GCP雲端監控工具中,成為雲端維運的AI助手,讓企業管理人員用自然語言方式來監控各項雲端資源狀態。
不論是在AI建置平臺或Duet AI助手,都提供了可以整合第三方平臺、技術或資料源的機制,可用來擴大Google Cloud整個AI生態圈的規模。
Thomas Kurian指出,生成式AI帶來了全新的上雲方式,Google三大戰略想要實現的目標是,從開發建置、不同場景的運用,以及AI生態圈的布局,來提供企業上雲實現轉型的新途徑。
Gemini要通吃雲和端的GAI應用
去年12月,Google Cloud終於揭曉了GAI戰略最關鍵的一塊拼圖,發表了新一代的LLM模型Gemini,包括高階Ultra版,中階Pro和低階Nano版模型。Ultra版能同時分辨和理解文字、圖片和聲音,也可以用來分辨和解釋幾種熱門開發語言。Duet AI for Workspace預計在2024年初也會引進Gemini模型,可以對分析內容提供多模態的進階理解能力。
與其他知名模型最大不同是,Gemini提供了可在手機上執行的Nano版本,不僅如此,Gemini Pro的SDK除了支援Python,更支援兩大行動平臺Android的Kotlin和iOS應用的Swift,還有Web前後端開發主流JavaScript和Node.js語言。這些布局都反映出Google要將自家GAI戰略延伸到Android世界,甚至是iOS世界的企圖心。
不只推出新版模型,Google也正式推出了免費的網頁版GAI開發工具AI Studio,這款模型最大特色是可以透過提示工程設計出一項AI功能或一隻簡單的AI應用,並生成對應的程式碼,方便輸出到其他環境再利用,也能提高GAI應用的後續修改和客製彈性,甚至是移植到企業自家環境中部署。
在Vertex AI平臺上先上架了Gemini Pro模型API預覽版和可分析影片的Gemini Pro Vision版本API。Vertex AI新增多項GAI開發功能,例如RAG快速建置工具,與外部資料或API的互動機制,多模型的協作框架,自動化模型評比,更多GAI控制機制等,Vertex AI的功能逐漸從模型開發,延伸到了模型部署,維運管理等LLM模型的MLOps流程。其中最特別的新功能是調度多個模型協同運作的能力,Google將提供一套調度框架,可以用來串連和連結不同模型之間的運作,共同產生更好的回應內容。
Google發表AI超級電腦架構
Google Cloud在去年12月初的發布中,除了引起高度關注的Gemini模型之外,還有一項特別的GAI基礎架構,專門鎖定企業自行訓練大型語言模型的需求,Google提出了AI Hypercomputer超級電腦架構,這是一個集結了涵蓋網路、儲存和運算晶片等各類效能最佳化硬體,搭配AI訓練和推論運算用的開放軟體,以及多種算力使用模式這三者組合而成的超級電腦架構。在這套架構中,可以整合GPU和Google自製晶片TPU,甚至包括了最新的TPU v5p,單一Pod叢集中可以組合最多達8,960顆TPU來運算。
(圖片來源/Google)
Google更拿出了內部用來調度全球規模工作負載的Borg技術中的動態工作負載排程工具Dynamic Workload Scheduler,Kubernetes就是仿造Google內部Borg系統的設計,所打造出來的開源專案。Dynamic Workload Scheduler可以即時管理數百萬個ML運算任務,Google在2023年11月就公開了用Dynamic Workload Scheduler管理5萬顆TPU v5e,來執行LLM模型分散式訓練任務的實例論文。Google釋出了這個超級電腦架構,可供企業自行訓練LLM模型時的參考。
不論是哪一家公雲,大抵都可以分為GAI基礎架構、GAI工具鏈和GAI應用這三個層面來布局,不論哪一家都開始投入AI晶片、AI系統、軟硬體整合的研發,來強化自家的GAI算力基礎架構,來滿足自身,或大型企業訓練LLM的龐大算力需求,工具鏈則出現了專用GAI開發工具,甚至是免程式碼的GAI開發工具,來加速或降低GAI的開發門檻。甚至,三大公雲的GAI開發工具,也相當注重與企業原有商用軟體、其他應用系統、現有資料源的整合,要讓企業更容易將GAI功能整合到自家系統中。
三大公雲也開始推出不同種類的企業級GAI助理,從兩大巨頭力推的辦公室通用型AI助手,也有資安、雲端架構等專門技術領域的AI助手,或是用於特定用途的AI助手,例如Java升級轉換AI助手,這都反映出,GAI助理將會越來越深入企業日常的工作中。
雖然,企業級AI助理的安全考量和規範,遠高於個人使用的GPTs。隨著GPTs商店數百萬款客製化AI助理的出現,2024從年初就吹起了一股人人都能自製GAI的浪潮。三大公雲巨頭的提前布局,提供了更多GAI工具和技術框架可選,將更有助企業勇於嘗試更多的GAI應用。
熱門新聞
2024-10-05
2024-10-07
2024-10-07
2024-10-07
2024-10-05
2024-10-07
2024-10-07