台智雲總經理吳漢章認為,主權AI包涵兩個角度,一個是由國家主導建立具有在地語言、文化價值的AI技術,另一個角度則是建構環境,協助民間產業發展自主的AI技術及應用。(圖片來源/台智雲)

國內較早投入在地語言模型發展的台灣智慧雲端服務(簡稱台智雲),曾與國網中心合作,以超級電腦台灣杉二號算力資源,建置TWCC臺灣計算雲,在大型算力支援下,台智雲從2022年開始研究訓練LLM模型的平行運算技術,2023年發表福爾摩沙模型,在當時與國科會TAIDE計畫為少數較早投入在地化LLM模型開發的團隊。

對於各國發展主權AI,台智雲總經理吳漢章分享他的觀察,各國推動主權AI常見4個作法,第一個是建立國內自有的算力資源,第二個是建立自主、可控的模型,第三個是政府與民間公私合作,第四個是建立創新機制,「AI發展必須可長可久,沒有創新就沒有應用,沒有落地,就是空談」,他認為建立創新機制相當重要,才能讓AI長期發展,應用能夠落地。

吳漢章認為,主權AI除了運用當地的語言資料建立反映在地價值觀點、文化的語言模型之外,更重要的目的是建立自主可控的AI技術,在DeepSeek模型出現,帶來新的模型塑造方式,即使資源不如跨國大型科技公司,仍可以較低的門檻來建立具有一定能力的語言模型。

建立自主可控技術以配合本地需求調整

吳漢章指出,主權AI可從兩個角度來看,第一個是政府主導建立符合在地語言、文化價值的AI技術,第二個角度則是建構基礎架構環境,提供資源協助民間發展AI自主技術及應用。

他認為,所謂主權AI不一定是政府自己發展AI技術,由民間產業來做也是一種主權AI,第二個角度是政府擴建公共算力基礎建設,建構環境鼓勵民間發展自主可控的AI。

吳漢章指出,雖然使用國際公有雲的算力服務相當方便,但長期租用的成本相當可觀,而企業採購GPU建置私有算力,一臺AI主機可能要價上千萬,不論是租用公雲算力服務或自建私有算力,都不是一般企業或新創公司所能夠負擔,所以需要政府出面建置算力,作為發展AI的數位公共基礎建設。

主權AI重要的是掌握自主可控的AI模型或技術,如果只依賴國外開源模型,開源模型通常僅針對全球市場開發,不會針對在地需求作調整,而公雲上的模型更新也不會通知企業,使用較好的模型通常收費也會比較高,國家或企業難以發展自主可控技術。

不只要建大型公共算力,還要易於被企業使用

但是,政府推動主權AI建立自主算力,支援在地化模型的開發,只要花錢建置超級電腦提升算力,這樣就夠了嗎?

吳漢章表示,過去的超級電腦是一種共用的概念,一群老師帶領研究團隊共用超級電腦算力,這些團隊有深厚的技術背景,能夠自己寫程式調用超級電腦的算力,現在開發大型語言模型需要更多算力,可能需要調度多片GPU加速運算,政府投資擴建超級電腦提高算力之外,也應該降低使用算力資源的門檻,讓新創或企業容易使用算力資源。

「提供算力並非直接提供給企業,企業就會自己使用,需要有人從旁協助及輔導他們使用超級電腦的算力」,吳漢章說。

台智雲過去曾協助國網中心維運管理超級電腦的算力資源,對外服務學研及產業,現在也協助數發部數產署維運管理算力池,這個算力池開放新創及軟體資服業者申請,提供免費的算力資源供他們開發測試AI產品服務。

政府目前正積極建置超級電腦擴建算力,每年分期建置,以採用最新GPU,預估2029年公共算力將提高至480PF,吳漢章表示,很難評論政府建置的算力夠不夠,更重要的是如何分配這些算力資源,過去很少有工作負載需要使用大量GPU算力資源,現在大型語言模型需要大量GPU算力,就需要妥善的分配。

由於GPU相當昂貴,購買更多GPU組成大型算力的成本,遠非一般企業能夠負擔,不能單靠自由市場機制提供的商業服務,他認為,政府必需建置公共算力幫助新創或企業,尤其是研發階段,要經過不斷測試找出最好的方法,新創業者可能空有想法或技術,但是缺少足夠的算力資源,讓他們去測試驗證,眾所皆知,「發展語言模型就是需要實驗」,愈早擁有算力,愈早進行實驗,就能不斷優化模型,早一步推出服務搶占市場商機。

目前各國發展主權AI,積極投入經費擴建算力,例如韓國通過AI法規立法,要建置國家級算力中心,日本計畫投入10兆日元,補助企業購買GPU,降低企業建構算力的資本支出。吳漢章指出,臺灣的優勢在於較早發展在地的語言模型,因此臺灣的服務模式、實驗經驗,吸引其他國家來臺取經。

不過,他的觀察是儘管臺灣現在約有5支團隊發展繁中大語言模型,但是大多數團隊僅在社群釋出模型,提供給外界使用,他認為只有提供開源模型還不夠,還要有商業化服務協助企業實際使用,如同企業使用開源軟體,開源軟體就像黑盒子,如果實際使用上發生問題,該由誰提供支援,紅帽就提供Linux的商業服務,負責解決企業遭遇的問題。「如同Linux有紅帽一樣,開源模型也要有商業服務支援,企業才敢放心使用」。

熱門新聞

Advertisement