新造超級電腦「台灣杉二號」(TAIWANIA 2)佔地共4排機櫃,由252個節點組成,單一節點包含2顆CPU(Intel Xeon Gold)及8顆GPU(Nvidia Tesla V100 w/32GB),總計安裝多達2016套GPU。(圖片來源:國網中心)

今日(13日),國研院國網中心公布了新超級電腦「台灣杉二號」,全名為「雲端服務及大數據運算設施暨整合式階層儲存系統」(簡稱AI雲端平臺),它在11月發布的全球超級電腦500強中,以9 PFLOPS的實測計算效能,躋身第20名,創下臺灣超級電腦史上最佳紀錄,而上一次最好成績是在2007年6月(第35名)。

為解決近年國內高速計算資源不足的問題,在科技部支持下,國研院國網中心先是在5月宣布,正式啟用新造超級電腦「台灣杉」,並汰換服役長達近7年的「御風者」,現在,另一AI運算為主的超級電腦「台灣杉二號」也到了建置完成階段,預計再經過幾個月的最後測試,包括軟體服務的整合,與內部調校和優化,明年上半就能正式啟用,一同加入服務行列。

根據國網中心的聲明,新的超級電腦台灣杉二號由252個節點組成,每個節點包含2顆CPU(Intel Xeon Gold)及8顆GPU(Nvidia Tesla V100 w/32GB),總計安裝多達2,016顆GPU,與先前以CPU計算節點為主、GPU為輔的台灣杉相比,側重面向明顯大不同。因此,在科研應用上,台灣杉二號在運用大數據進行深度學習時,將能提供更出色的效能。

在9 PFLOPS運算量之外,省電也是新超級電腦的一大重點。與台灣杉相同的是,台灣杉二號也採用了對應高效運算主機的水冷技術,以降低機房電費成本,這也符合當今全球超級電腦設計的趨勢。

基本上,台灣杉二號採冷熱通道隔離與異質雙水溫冷卻系統設計(常溫水+冰水),透過搭配2套不同解熱之鈑式熱交換器的方式,分別供應水冷機櫃及氣冷機櫃所需的冷卻效能。特別的是,台灣杉二號的能源效率達11.285 GF/W(當計算量在9 PFLOPS時,用電為798 KW),在Green500能源效率榜上排名第10名,不僅比台灣杉更出色,並且名列全球最節能的前十大超級電腦。而且,它的PUE值最低將可達到1.1、1.2,顯然比起一般資料中心的1.7、1.8更低。

打造臺灣首座AI超級電腦,供學研機構及新創團隊使用

其實,國網中心在今年上半曾經預告,AI主機10億元的採購案已決標,這臺國內自研自製的AI超級電腦,將由廣達、臺灣固網與華碩雲端結盟的團隊負責安裝,並建置在與台灣杉超級電腦所在的同一機房當中,同時,也宣告預計安裝完成時間就在年底之前。隨著這次的發布,也顯示新超級電腦一如預期建置完成。

而根據這次主機建置商華碩的聲明,在國網中心負責設計監造之外,關於主機建置上的分工,主要是由台灣大哥大負責機房建置與資安維運,廣達負責AI運算及資料儲存平臺,而華碩負責雲端服務平臺、雲端伺服器及AI應用整合。

從此次AI主機的執行計畫來看,目的上,也就是為了建構國家級AI研發與雲端服務環境,做為國內發展人工智慧的重要基礎。

對於未來AI雲端平臺的應用,在國網中心發表的聲明中已經提到,未來會將一半的運算資源,提供給政府主導的計畫,例如智慧機器人、自駕車實驗場域、AI創新研究中心等前瞻計畫與學研界使用;另一半的運算資源,則將提供創新產業使用,包括像是人工智慧應用於金融科技、智慧製造、智慧醫療/健康及智慧城市等領域,進一步促進各個產業,能運用人工智慧帶來創新、加值及應用,期許帶動國內產業及AI廣泛應用領域的蓬勃發展。

比起由2排機櫃組成的「台灣杉」,新造超級電腦「台灣杉二號」不僅運算效能更強大,佔用機房面積也更廣,由4排機櫃組成,兩排機櫃兩兩相對。事實上,這兩座超級電腦位於同一機房當中,在我們先前參觀台灣杉超級電腦時,旁邊還有約20~30坪的可使用空間,台灣杉二號即座落於該處。(上圖前方看到的四排機櫃,就是台灣杉二號,而畫面中最右邊深處,則是今年五月已經上線的台灣杉)

相較於已經淘汰且佔用6排機櫃「御風者」,這兩座新建超級電腦的佔地面積加起來,約跟老舊的御風者相當,但提供的運算量與計算能源效率,將更加出色數十倍。(圖片來源:國網中心)

一般而言,超級電腦大概每5年更新汰換一次,而之前臺灣的超級電腦「御風者」撐了近7年。去年開始,政府在超級電腦方面有了更多新的規畫,包括像是今年5月正式啟用的「台灣杉」(TAIWANIA),以及近期公布建置完成的「台灣杉二號」(TAIWANIA 2)。特別一提的是,在最新11月發布的全球超級電腦500強中,國內這臺主機方面建置就投入10億的「台灣杉二號」,以9 PFLOPS的實測計算效能,擠身全球第20名,而上一次最好成績,是在十年之前的2007年6月,當時我國的超級電腦躋身全球第35名。(圖片來源:國網中心) 

#台灣杉2號詳細規格一覽 

硬體(整體規格)●252個節點/9,072個CPU核心 ●2,016顆GPU ●193.5 TB記憶體 ●10 PB儲存容量 ●Mellanox InfiniBand EDR 100Gbps叢集互連網路●1.2 PUE
硬體(單一節點規格)●2顆18核心Xeon Gold 6154 ●8顆Nvidia Tesla V100 SXM2 32GB ●768 GB 記憶體 ●240 GB SSD + 4TB NVMe SSD
軟體環境 ●Slurm / Kubernetes ●Nvidia NGC Docker ●Ceph ●Spectrum Scale(GPFS) ●CentOS
AI架構●Tensorflow ●Caffe / Caffe 2 ●PyTorch / Torch ●其他

 資料來源:國網中心,iThome整理,2018年11月

熱門新聞

Advertisement