圖片來源: 

攝影/余至浩

除了今年7月上線的創進一號,國網中心近日揭露了未來5年的算力擴展藍圖,計畫啟用5座AI超級電腦,整體總算力可達280 PFlops(每秒千兆次浮點運算),以應對產學研對於GenAI應用日益增長的算力需求。

國網中心的發展藍圖,包括HPC、網路基礎設施、AI與大數據4大方向。尤其是AI領域,因應這兩年生成式AI技術的迅速發展,國網中心不僅自2022年起讓超級電腦台灣杉二號開始分擔GenAI算力,協助產業界推動相關應用。到2023年時,國網中心建置了專用運算主機,配備72片的H100 GPU, 具備約3.8 PFlops算力,提供臺灣的TAIDE大型語言模型訓練專用。今年7月,國網中心啟用的超級電腦創進一號,則採用CPU架構,提供3.4 PFlops算力,專用於科學工程用途。

但是,為滿足產業對GenAI應用日益增長的算力需求,提升運算能力成為國網中心未來發展的重點方向。國網中心主任張朝亮近日於一場AI活動中揭露了國網中心未來5年的運算擴展藍圖,進一步說明如何強化算力支援,推動國內AI技術發展與創新。

計畫啟用5座AI超級電腦,合計總算力可達280PFlops

根據國網中心的中長期大型AI算力部建計畫,未來將啟用5座AI超級電腦,其中兩座AI超級電腦,以GPU為核心,預計分別於2024年和2025年完工啟用,分別將提供16 PFlops 和100 PFlops 的算力。

其中,具備100 PFlops算力的AI超級電腦主機,將搭載1,680個GPU、25PB儲存空間,並配備200Gbps InfiniBand高速網路,未來將可支援多元且更廣泛的應用需求。若對比今年5月公布的全球超級電腦前500強榜單中,這臺AI超級電腦將位列第11名。

此外,另有兩座超級電腦將於2026和2027年啟用,採用GPU和CPU的混合架構,分別提供80 PFlops和35 PFlops的算力。

長遠來看,到2028年,國網中心將整合量子運算,使超級電腦的整體算力可達280 PFlops,未來可用於量子AI等技術的開發與應用。

國網中心大力擁抱雲端翻新架構打造新一代高速運算主機,建立雲端基礎的服務環境,讓使用者能夠透過雲端平臺以容器化方式存取運算資源,簡化開發流程及後端計算管理。並分兩階段推動,第一階段採用先導服務主機,以GPU伺服器為主,優化服務大型語言模型開發、AI共用運算服務與大型科學運用應用,第二階段則將導入雲端AI運算主機,配備更強大的GPU伺服器、資料儲存和高速網路設施,提供高效能運算能力,支援更多異質環境的應用研究及開發需求。

除了國網中心的超級電腦之外,在國科會提出的「大南方計畫」建置計畫中,將於2029年在沙崙部建一座算力可達200 PFlops的AI超級電腦,未來啟用後將提供南部學研界和業界開發使用。

不只國網中心建置超級電腦,民間企業積極布局AI算力服務市場

不只國網中心建置超級電腦,企業積極布局AI算力服務市場,許多業者紛紛投入大型AI算力建設。例如,Nvidia推出的Taipei-1,搭載512個H100 GPU,算力達22.3 PFlops,而鴻海則計畫在高雄打造一座算力超過90 exaflops的超級電腦。

配合AI算力的發展,國網中心在網路與資料中心建設方面也有相關建置計畫,包括將在南科建置IDC雲端資料中心,預計於明年初完工,並於年中陸續進駐HPC、GPU等設備,未來IDC啟用後除了可供AI研究,國網中心將拓展更多服務模式,如主機代管服務等。

在網路建設方面,在2022年啟用FOX網路交換中心後,國網中心規畫未來3~4年分階段完成南北骨幹網路光纖的建置,強化全國的資料傳輸能力。

國網AI雲服務將成為新一代雲端服務平臺

除了擴增算力之外,國網中心聚焦的另一大重點就是雲端服務。張朝亮表示,雲端在AI發展中扮演著重要角色,不僅提供便利的雲端入口和友善的使用介面,讓所有人都能很容易介接使用,還能提供強大運算資源,處理AI開發所需的大量數據。

他坦言,過去HPC主要集中於科學和工程計算,但在過去五年中,AI已成為主流。因此,每個HPC中心都在擴展GPU算力,並思考如何提升雲端服務以更好地滿足客戶需求。

國網中心將以國網AI雲服務(NCHC AI Cloud service, NAICS)作為新一代雲端服務平臺。他指出,這套平臺不僅具備更強大的運算服務,支援多元AI試算環境與應用場景,還整合更多資源,介接主流公雲。

根據國網中心的規畫,初期將建構包括IaaS和PaaS雲端基礎服務,到2025年將進一步提升並整合HPC與雲端服務,新增更多雲端功能選項,同時推出HPC高速運算與HFS高速儲存整合服務,以提升效能。

國網中心還計畫於2024至2027年建置一套雲端資料分析平臺,針對資料的機敏性建立可信環境,強化資料保護與隱私保障。

在設計上,張朝亮表示,此平臺將依據資料敏感程度分為隱私工作區和公共工作區。考慮到資料機敏性,使用者未來可以選擇隔離的隱私工作區,強化雲端服務的安全性。在這個隔離的雲端環境中,外部資料交換僅限於唯讀模式,所有資料將儲存在國網中心的機敏商用儲存系統中。他提到說,未來包括生醫、國土治理、國防科技、科學計算等都能運用這個平臺來進行開發、數據存取,確保資料的完整性。

此外,國網中心近期將啟動新計畫,將在雲端環境中打造國產晶片技術PoC實驗平臺。張朝亮也說,未來,國內晶片設計業者在開發Edge晶片或AI ASIC晶片時,就可以用這個平臺進行測試與驗證,縮短產品開發時程。

熱門新聞

Advertisement