國網中心主任張朝亮認為,在AI技術的發展下,主權AI已是每個國家關注的重要議題,全世界很難只依靠幾個大型科技公司提供服務,每個國家有自己的語言資料,包括資料、模型及算力三個方面。(攝影/洪政偉)

在政府推動主權AI的戰略下,不論AI模型或大語言模型,都需要大量算力的支持,模型訓練的過程中需要不斷的調整策略,通過多次的試驗找出較佳的訓練效果,反覆試驗過程,需仰賴大量算力支持,國家建立主權AI的策略,不論是補助民間企業,或是國家主導建置,都希望先擴大本國的算力資源,如同種植農作之前,先培力土壤內的養分,讓名為AI的作物可以在自家的土地成長,開花結果。

在臺灣主權AI戰略中,國研院國網中心扮演重要的角色,特別是在晶創臺灣及大南方新矽谷兩大方案,政府投入經費,由國網中心建置新一代超級電腦。

去年底國網中心完成新的GPU主機建置,採用H100 GPU,算力可達16PFlops,因經費來自晶創臺灣方案,該主機被命名為晶創主機Nano5,目前僅先開放部分算力資源,預計今年6月可望正式上線,開放算力服務。未來5年在晶創臺灣、大南方新矽谷兩項方案推動下,國網中心積極建置新的超級電腦,2029年將推升我國公共算力至480PF。

國網中心主任張朝亮表示,在AI技術的發展下,主權AI已是每個國家關注的重要議題,全世界很難僅靠幾家大型科技公司提供服務,「每個國家有自己的語言資料,主權AI涉及資料、模型及算力都要有自主權才是真正的主權AI」。

目前國際上已有科技業者開源大語言模型,且公有雲提供GPU算力服務,並且有公共生成式AI服務供大家使用,臺灣為什麼要建立主權AI技術?

張朝亮解釋,從資料面來看,各國都有自己文化語言,自己的語料,國際模型通常以全世界為主,很難關照在地的元素,因此需要各國以自己語言資料發展在地化的模型。

算力方面,儘管國際公有雲業者建置超大型資料中心,提供快速就能使用的GPU算力服務,但是過度依賴國際公有雲的服務,哪一天因某個特殊事件,國際公雲不再提供服務給本地用戶,資料、算力可能因此中斷,因此算力也要有自主權;至於模型,資料與模型為一體兩面,目前AI可分為機器學習AI及生成式AI,未來兩者會逐漸融合,讓機器人可處理不同的工作任務。

「國網中心身為政府資助的法人,我們的責任就是協助主權AI落實在臺灣」,張朝亮說,除了協助將蒐集到的合法資料儲存於國網中心,還有建置臺灣自己的算力,讓不放心將資料存放在國外的政府機關或企業,可在本地保密環境下儲存資料,這是國網中心必需做的事,由國網中心提供自主算力、資料儲及在地化的語言模型。

承接TAIDE計畫,今年將推出多模態模型

國科會為推動主權AI技術,2年前推動可信任AI對話引擎TAIDE計畫,基於開源LLM模型,結合臺灣在地的繁中資料,以發展出符合在地文化價值的LLM模型,TAIDE今年步入第三年,由國網中心承接TAIDE計畫,張朝亮兼任計畫主持人,將以超級電腦GPU算力為基礎,支援TAIDE模型訓練。

不過,儘管國網中心擴建算力,接下TADIE計畫深化臺灣在地文化、價值的語言模型開發重任,張朝亮直言,雖然現在國網中心已有模型開發團隊,但是仍缺乏足夠的人力,未來希望中研院、學界的人才能協助分攤模型訓練的工作。

目前TAIDE模型釋出的版本,是以90GB的資料進行訓練,已釋出為7B、8B參數規模版本,因為使用的資料都獲得授權,可供商業使用。

國網中心承接TAIDE計畫,為4年期計畫(2025年到2028年),推動基礎模型的更新、模型推理能力的發展,以及適用於手機或機器人的小語言模型發展,國網中心內部團隊約22人,外部則有8人,在分工方面,中研院負責模型鑄造,科政中心負責資料的蒐集、品質,國網中心協助模型評估、建置雲端服務,以及協助模型鑄造及資料品質。

今年國網中心將建置的100PF算力,也會支援模型訓練,但是將依整體科研及模型任務需要作分配,在必要及急迫時,提高模型使用算力的優先權。

目前已開發TAIDE多模態版本,正進行開發測試中,預計完成整個內部流程,今年內就會釋出多模態版本。此外,國網中心也會加強推動模型應用,其中包括專為公務機關使用的G-TAIDE,針對公文、新聞稿、民眾陳情、擬答等需求優化,目前已和國科會、教育部、行政院底下處室、勞動部等合作測試,未來將擴大與更多部會合作,以G-TAIDE作為示範,吸引更多公私協力的落地應用。不只是公部門的應用,還有與其他第三方合作,如學校教育、醫療等應用。

建置AI開發雲端服務平臺加速扶植國內AI發展

鑑於購買GPU成本昂貴,並非一般企業能負擔的起,而主權AI的目的,不只是政府建置國家級AI模型,還包括鼓勵民間發展AI應用,特別是國內企業占大多數的中小企業及新創,他們可能有想法,但缺乏GPU算力支持,國網中心擴建大型算力,以這些算力為基礎,結合軟體介面建置大語言模型開發服務平臺,以讓新創或資服業者能夠使用平臺快速開發。

張朝亮表示,使用超級電腦上的GPU資源,通常需要較深的專業技術,一般新創或資服業者可能不具備這些能力,由國網中心將這些專業技術建置為共享平臺,例如提供不同硬體環境、語言環境的API,讓新創、資服業者簡省自行開發時程,可以快速呼叫API開發自己的應用。開發平臺提供一站式服務,從前端到後端提供各種工具服務,包括開源模型、TAIDE等各種模型資源,讓新創、資服業者不需到外部取得工具,就能在該平臺上開發AI。

傳統使用超級電腦上的資源,使用者需要較深的技術,而現今的趨勢是走向雲端服務,因此國網中心整合雲端服務、平臺化建置、HPC計算,整合為整套的服務提供給學研、中小企業、新創使用。

這個AI開發雲端服務平臺預計在近期發表,開始試營運,預計於今年10月正式上線,開放學研及新創使用,以目前晶創主機的30%資源用於輔助中小企業及新創開發AI,國網中心將開放徵案,讓外界可以運用這些資源。今年底將建置的100PF主機,預期明年正式上線,同樣希望達成這樣的目標。

張朝亮強調,建置公共算力的目標並不是要和民間建立的私有算力服務競爭,國網的目標是讓缺乏資源的中小企業、新創,這些小型業者可能有想法,卻無法使用得起算力資源,由公共算力資源扶植他們發展,先在國網中心提供服務平臺進行開發測試,成功後改以私有算力服務去服務他們的客戶。

張朝亮認為,國際公雲業者的服務通常會建立全球一致的商業服務,例如國際公雲業者會以商業化標準,提供最多人需要的工具服務,不會提供較少人使用的工具服務,國網中心基於主權AI發展,可配合臺灣業者需求提供工具服務,例如本地新創業者需要,但不是主流使用到的工具服務,這是國網中心提供雲端服務和民間業者不同之處。

國網中心建置雲端服務,相當於發展臺灣自己的主權雲,本地企業如果擔心使用國際公雲服務,資料可能因此外流,就能使用國網中心建置的雲端服務,張朝亮認為,不只是民間企業能用,包括高度機密性資料的政府機關、國防部門也能運用,類似主權雲的概念。

熱門新聞

Advertisement