圖片來源: 

Google

生成式AI紅遍天,如何快速打造、落地生成式AI應用,成為各企業首要任務。Google瞄準這個需求,在8月底的年度Next大會上喊出Build AI和Use AI優先,其中的Build AI,就是指機器學習開發部署平臺Vertex AI大更新。

因為,他們正式推出無程式碼(No-code)生成式AI開發套件Vertex AI Search和Vertex AI Conversation,就算使用者沒有專業知識,也能快速用自家資料打造內部專用、Google生成式搜尋等級的搜尋工具和對話機器人。

不用寫程式就能打造Google等級生成式工具

Vertex AI Search和Conversation並非新面孔。早在今年初,Google就大力發展生成式AI開發產品,在3月推出生成式App開發工具Gen App Builder預覽版,其中的企業搜尋和對話AI套件,就是Vertex AI Search和Conversation的前身。

這款Gen App Builder主打無程式碼,使用者只要輸入資料、簡單設定就能打造生成式工具。而且,這款生成式App開發工具使用了多款強大的基礎模型,並提供一個簡單的調度層,來結合底層基礎模型、企業資料、資訊檢索技術和對話AI工具,簡化系統溝通。

現在,Google將Gen App Builder整合至Vertex AI平臺,發展為Vertex AI Search和Conversation套件,保留了Gen App Builder的特點,也新添不少功能。比如,基礎模型納入了Google自家的PaLM、Imagen和其他開源模型,可將開發時間縮短為幾分鐘或數小時。而且,套件整合了資訊檢索技術和基礎模型能力,打造出來的App可更準確解讀問題意圖、找到更相關的資料。此外也支援多模態資料,如文字、圖片和影片,來執行更多元的搜尋任務。同時,Search和Conversation也允許開發者將基礎模型產出的答案,與企業資料結合,產出更貼近需求的回答。

以Vertex AI Search為例,企業還能根據使用情境,將大型語言模型結合向量搜尋功能,以向量相似性比對,找出更相近的資料,特別適合語義搜尋、個人化推薦、多模態搜尋等場景。Google形容,用這個套件打造出的生成式工具,就有如自家在今年I/O大會上展示的生成式搜尋體驗(GSE)一樣,將Google等級的搜尋工具在企業內部重現。Google更預告,接下來會推出企業資料存取控制功能,以及相關性評分、摘要和引用出處等功能,來讓使用者對產出的回答更有信心。

Vertex AI Conversation則能用來打造擬真自然的文字或語音Chatbot,開發者點擊幾下,就能用網站或文件打造出對話機器人。而且,該套件還能串接第三方服務,如採購或供應系統,讓使用者在對話介面中,直接進行預約、採購等交易。同時,企業也能用網站資料、文件、問答集、Email或對話記錄等資料來微調Chatbot,還能要求後臺產出使用者與Chatbot的互動摘要、引用等數據,來更彈性地切換AI和真人服務。

基礎模型大更新,可消化更長文件

Vertex AI的更新不只如此。不只針對無ML經驗使用者,提供無程式碼開發工具,Vertex AI對具ML專業知識的開發者,原本就有套完整的工具,涵蓋模型選擇、微調、測試評估、模型維運和隱私保護等開發維運環節,這些工具這次也有大幅更新。

首先,Vertex供選用的基礎模型更多了。他們在模型花園(Model Garden)中,新添Google自家PaLM系列語言模型(包含PaLM 2),還有圖片生成模型Imagen、程式碼生成模型Codey,以及產業專用模型如Sec-PaLM、Med-PaLM,並支援第三方模型和開源模型,如Code Llama、Llama 2和Falcon等。特別的是,他們還針對Llama 2添加細緻的微調功能,如調適器(Adapter)和人類回饋強化學習(RLHF)。

其中,PaLM模型可消化的Token數量大幅增加,從原本的8千個新增至3萬2千個,等於可讀取和產出文章更長。再來,該系列模型還新增了38種語言。這些功能已正式推出,至於對其他100多種語言的支援功能則為預覽版。

就圖片生成模型Imagen而言,這次更新除了讓生成品質更好,還有預覽版的微調功能Style Tuning,企業可用來規範生成圖片的樣式,確保圖片符合企業品牌原則。此外,Vertex AI還納入了實驗性質的浮水印功能SynthID,能針對Imagen產出的圖片嵌入肉眼難見的浮水印。

而Codey的更新包括了程式碼生成品質提高25%,還新增2大預覽版功能:Streaming API和Text-to-SQL。前者專門用於程式碼生成和程式碼問答,能串流新資料與模型回答,提供更即時的答案,後者則能將自然語言自動轉為SQL,降低資料庫查詢門檻。

這些新添的基礎模型,特別是Google用來驅動自家生成式助理Bard的PaLM 2,讓企業有機會使用與Google同等級的強大模型,來打造內部生成式搜尋和對話工具。

Vertex AI是Google建置的機器學習開發部署平臺,他們在8月底的雲端大會上宣布正式推出Vertex AI Search和Conversation套件,使用者不需寫程式,用自家資料和簡單設定就能打造Google級生成式搜尋和對話工具。(圖片來源/Google)

微調基礎模型、確保模型回答有憑據也有解

再來,Vertex AI也提供新的微調工具,來讓使用者優化基礎模型,產出更符合使用情境的答案。基礎模型微調有4種方法,一是不需ML專業技能的提示設計,也就是問問題時,使用者直接調整問法,不需程式開發。接著是調適器微調、RLHF和全微調,這些方法按難度遞增。

就調適器微調來說,Vertex AI正式新添文字與圖像的調適器(Adapter),對話與程式碼專用的調適器則是預覽版。RLHF也是平臺新增的微調功能,可透過人類回饋來優化模型,但目前屬於預覽版。至於更複雜的全微調,需要專家調整模型權重,適合資料量龐大、有開發人力的企業使用者,這次Vertex AI允許使用者對開源模型(如T5、BERT等)全微調。

為確保模型不會胡言亂語、講話有憑有據,Vertex AI這次也新添2大預覽版功能,包括用來規範模型回答的Grounding,以及可串接外部資料庫或服務的Extensions。這2項功能適用於以Vertex AI開發的生成式App成品,其中,Grounding可在模型產出初步回答後,根據使用者提供的企業資料,進一步整合模型答案,最終給出符合企業規範或文化的回答。而Extensions則讓生成式App以API串接資料庫或服務,來即時整合現實世界數據和反應。這些資料庫或服務包括Google的Code Interpreter、Vertex AI Search、BigQuery和AlloyDB等,以及合作夥伴資料庫,如MongoDB、Redis,使用者也可自建來串接。

模型維運和隱私工具逐步到位

生成式App如何長期穩定發揮效用,還有賴於模型維運(MLOps)。Vertex AI這次正式發布2大模型評估工具自動指標(Automatic Metrics)和自動挑選器(Automatic SxS),前者可讓使用者選擇指標,來衡量模型表現是否達標,後者則是快速選出表現最好的模型,來讓開發者進行人工評測。

一如其他公雲巨頭,Google在這次大會也特別強調,使用者在Vertex AI平臺上產生的資料,如訓練資料、人工回饋資料、IP等,都不會傳送到Google、被Google用來訓練模型。Google雲端AI副總​​June Yang強調,Vertex AI平臺提供更完善的隱私保障功能,如資料透明、VPC安全控制等。也提供一系列負責任AI工具,如內容監控API、重複引用檢測、偏見評估工具和安全過濾器等,來讓使用者確保生成內容的安全。

最後,Google這次也將企業版雲端開發協作工具Colab Enterprise整合至Vertex AI,等於使用者不必設定任何配置,還能享有生成式AI助手輔助,來加速程式開發工作。這次更新,凸顯了Google對生成式AI開發的產品布局。

 

 相關報導 

熱門新聞

Advertisement