富士通技術長 Vivek Mahajan (圖片來源/富士通)

近年,各國高效能運算(HPC)軍備競賽持續白熱化,前段班國家開始推出Exascale等級超級電腦,中段班國家也持續增加國內超級電腦算力。例如,臺灣國網中心有意在5年內將超級電腦算力從13PFLOPS增加到1到200PFLOPS,韓國KISTI更預計在2024年啟用第6臺超級電腦,算力高達400到800PFLOPS。

HPC競賽白熱化的一大運算需求是AI運算任務。AI技術發展一直以來都影響著算力硬體技術發展和應用情境。例如,2018年,適合深度學習等AI運算工作的GPU,在Top 500全球超級電腦排行榜上貢獻的算力總和,首次超越CPU。

富士通技術長Vivek Mahajan觀察,AI運算需求不只影響到了國家級HPC發展。隨著AI從研究室走到實際商業應用場景,企業層級的AI需求,也為HPC發展帶來了新一波衝擊。

去年,日本開始用超級電腦來打造專屬於自己語言的LLM,富士通正是參與用超級電腦富岳來打造日本LLM的企業之一。在企業AI應用SI服務深耕30年,共同打造蟬聯多次世界排名第一超級電腦富岳的他們,對AI及HPC界發展尤其有感。

產業專用模型成趨勢,探索適合模型成重要課題

Vivek Mahajan認為,隨著AI更加普及,可以實際應用於生產場景不同面向,許多企業開始更積極、更深入擁抱AI。他們從利用通用型AI模型來輔助一般性工作,走到導入垂直產業專用AI模型,來進一步強化產業專門的工作流程。

「對企業而言,ChatGPT的確占有一席之地,但產業專屬的企業級LLM,也有存在的必要性。」像富士通就和不同產業企業共同打造過許多產業專用的AI模型。

Vivek Mahajan補充,採用垂直產業專用模型的趨勢,在醫療、製造、零售,以及電信等產業尤其明顯。「隨著企業更清楚他們要用AI達成的目的,垂直產業模型對他們的重要性也越來越高。」他評論。

雖然越來越多企業想採用垂直產業AI,但每一種模型的應用案例數量,遠比不上通用型AI,再加上,使用相同垂直產業模型的企業之間,多為競爭關係,不易取得同行對手的經驗。所以,企業想要導入這類限定用途的AI模型時,通常較難入手足夠的企業使用成果,來進行評估。Vivek Mahajan建議,導入垂直產業型AI時,可以用技術來評估。他推薦的做法是,利用自動化機器學習(AutoML)技術。

AutoML是2018年前一波AI浪潮時期的AI規模化作法,當時多數企業還沒有機器學習模型的建置經驗,AutoML可以將一個AI模型的訓練過程變成一套自動化的流程。企業只需要提供訓練用的資料,這套流程就會自動嘗試不同的機器學習演算法來建立模型,並且自動評測不同演算法模型的成效,來找出得分最高的模型,作為這批資料最適合的機器學習模型。企業不需要能力高強的資料科學家,也能使用廠商提供的AutoML服務,快速訓練出自己專屬的客製化機器學習模型。AutoML技術也因上手AI門檻低,被視為AI民主化的關鍵之一。

不過,這幾年,隨著AI發展越來愈多元化,相關模型和應用情境落差很大,較少看到專門聚焦建模的萬用型AutoML服務,反而是出現了MLOps發展趨勢,企業改由自己發展一套較自動化的流程,從建模、部署到維運,延伸到更完整AI應用生命周期。

Vivek Mahajan認為,企業要評選現成的垂直產業模型,或自行開發專用模型時,可以利用AutoML的自動評估功能,反覆嘗試,釐清自己的需求及所適用的技術。甚至,得回頭審視企業數據就緒(Data Readiness)程度,是否足以發展AI。

自行管理模型需求增,帶動企業HPC資源需求

當AI更加深入企業,產業專用模型涉及關鍵工作流程及企業機敏數據時,有些企業便會進一步採購更進階的算力硬體,在自有可控環境中執行這些AI相關運算。他強調,企業需要自己擁有足夠算力來滿足垂直產業模型的需求,這將是越來越重要的事。

市面上商用AutoML工具,已經發展到可以接受自然語言指令來自動化建立分類、預測、回歸、電腦視覺及自然語言處理等不同類別模型,還可以顯示建模方法及流程,以及評估不同建模方法的成效指標。

Vivek Mahajan認為,更多企業開始應用產業專用AI模型,會連帶使HPC需求也越來越普遍。

為了應用AI技術到產業專門的工作流程中,企業常需要利用自家資料來訓練或微調模型,因而產生機敏資料保護需求。應用模型於工作流程時,企業也會有一定程度服務水準需求,例如能支援多大量並行作業、反應速度、服務可用性時間等。

他建議企業要採用HPC時,考慮到初期投資成本,最好先利用雲端按需求提供的HPC服務來進行。其次再考慮技術支援、配套軟體及函式庫的可用性,以確保開發流程的順暢。等到企業使用HPC到一定程度,確定原本使用情境可以大規模應用於工作流程後,再釐清需解決問題問題的參數量,以及需要處理的數據規模,再來決定是否應大規模建置HPC硬體。

像富士通也是因此而將超級電腦富岳的HPC技術,拆解成較小算力規模的HPC服務來瞄準企業上手需求。他補充,這種從使用雲端資源走到地端自建硬體設備的做法,也進一步使企業用雲地混合模式來執行AI運算任務成為主流趨勢。

「人類一直以來有許多想解決的複雜問題,因為算力技術不足而遲遲無法著手。」Vivek Mahajan這句話道出了他心目中,算力技術發展的原動力。這不只是HPC蓬勃發展且持續成長,更是許多其他算力硬體技術及設計趨勢形成的重要原因。

Vivek Mahajan認為,不只AI需求會影響算力技術,還有更多解決不同問題的需求,會推動許多其他算力技術發展。

他舉例說明,如何疏導交通動線、如何妥善安排病床、如何更快對未來地震或火山爆發做出反應,都是人類持續嘗試優化應對方法的問題。隨著算力技術提升,這些老問題會有更新、更好的處理模式。甚至,有些問題直到近年算力技術足夠進步,人類才得以著手挑戰,例如模擬和分析分子數據,來加速藥物研製。

對企業而言,ChatGPT的確占有一席之地,但產業專屬的企業級LLM,也有存在的必要性。──富士通技術長 Vivek Mahajan 圖片來源/富士通

CPU與GPU更加緊密整合,提升大小硬體設備對AI運算支援度

近2、3年,因為AI熱潮帶來GPU持續短缺,也帶動算力技術加速朝CPU和GPU高度整合的方向發展,從晶片設計到伺服器系統設計,都可以看到CPU和GPU更緊密結合。

Intel、AMD等廠商競相推出CPU與GPU一體的晶片產品,就連Nvidia也推出了第一款CPU和GPU整合的超級晶片。從伺服器主機,到超級電腦等HPC硬體架構設計,也都持續朝著CPU與GPU並用的方向發展。

甚至到了2023年,連邊緣裝置都開始要支援AI,AI PC和AI手機成為許多廠商競相推出的產品,背後正是靠CPU、GPU,甚至NPU及其他專門晶片的高度整合,使小小一臺機器也能執行許多AI相關運算。

Vivek Mahajan點出,CPU與GPU緊密整合的設計已成一個必然趨勢,「如何在軟體面優化運算任務管理及算力資源調度,會是重要課題。」

例如富士通開發了一種運算資源調度工具。這個工具可以在256節點的HPC系統中,以短短100毫秒延遲時間,彈性調度CPU和GPU運算資源。這個工具會持續評估CPU和GPU可用性,以及不同運算任務所需的算力,來分配運算資源。當有新任務加入,或舊任務結束時,都會影響處理器的負載,此工具以任務不中斷的前提下,重新分配運算資源給進行中任務。這個工具不只可用於HPC運算環境,富士通更計畫用於自家40量子位元的量子電腦模擬器,與其他運算節點平行計算。

量子運算研究啟發更多新興算力技術發展

CPU與GPU整合是既有算力技術的改良,量子運算則是算力技術演進中,受到高度關注的一項。量子運算有可能打造出傳統電腦難達到的算力,更有效率處理超大規模機器學習、排列組合最佳化、複雜系統模擬等問題。

不過,量子運算技術仍在研究階段。像在去年10月,富士通與日本理化學研究所才發表了64量子位元的超導量子電腦,搭配40量子位元的量子模擬器,來比較前者雜訊中等規模量子(Noisy Intermediate Scale Quantum,NISQ)計算結果與後者零錯誤計算結果,以進一步研究量子錯誤緩解演算法,期待可以加速量子電腦研究。

Vivek Mahajan認為,量子電腦要真正投入關鍵應用(Mission Critical)運算,需要至少10萬個物理量子位元,因此這個技術距離實際商業化還需要不少時間。但是,受到量子運算的啟發,也出現了可實際投入商業應用的新算力技術。富士通從量子退火技術延伸出的數位退火技術(Digital Annealing)就是其中一種。

數位退火晶片是由傳統電腦晶片技術打造的硬體,因此不像量子電腦需要大量量子位元來進行量子錯誤修正,可以用來解決超大規模組合最佳化問題,目前已經用於藥物研製、資產組合管理、車隊管理等應用場景。富士通自身已經將此技術應用於優化工廠管理,豐田(Toyota)汽車也有導入此技術來進行供應鏈管理、物流管理及工廠生產流程優化。

「ChatGPT爆紅讓許多企業急著想用AI,但重點不是要不要導入AI,而是導入AI要達成什麼目的。」他觀察,企業導入AI最常犯的錯誤,不在於技術面,而是沒有釐清技術具體用途或能解決的問題。

Vivek Mahajan表示,企業不應為了跟風而盲目採用新技術。設定具體目標,後續應該採取的措施才會明朗,包括企業文化調整,以及員工能力再訓練。「不只是AI,導入任何新技術時,企業都應該如此。」他說。

 CTO小檔案 

富士通技術長Vivek Mahajan

學歷:阿拉巴馬大學電子工程碩士

經歷:IT界30年老將,同時具有商業和工程背景,曾任奇異、甲骨文、IBM等國際大廠的總經理及營收長等高階職位。2021年成為富士通技術長,主導運算、網路、AI、數據與資安、綜合技術應用等分類的產品開發。

圖片來源/富士通

 公司檔案 

富士通股份有限公司

地址:東京都港區東新橋一丁目5番2號

成立時間:1935年6月

主要業務:顧問、系統整合、硬體解決方案、軟體解決方案

員工數:124,000人

年營收:3兆7千億日元

董事長:時田隆仁

 IT大事記 

1935年:富士通公司成立

1939年:富士通進軍無線電傳輸領域

1954年:推出日本第一臺繼電器式電子電腦FACOM 100

1977年:開發日本第一臺超級電腦FACOM 230-75APU

1993年:聯合開發的NWT超級電腦取得Top 500榜首

1995年:臺灣富士通股份有限公司成立

2002年:開發PRIMEPOWER HPC2500超級電腦

2011年:與日本理化學研究所共同開發的京超級電腦啟用,成為Top 500榜首

2014年:開始與日本理化學研究所共同開發開發富岳超級電腦

2018年:推出量子啟發數位退火雲端技術服務

2019年:京超級電腦退役,推出動態影像人體識別AI技術Actlyzer

2020年:推出用來分析數據因果關係的AI技術

2021年:富岳超級電腦上線,成為Top 500榜首

2023年:開始與東京工業大學、東北大學及理化學研究所共同利用富岳超級電腦打造日本專屬大型語言模型。AI解決方案平臺Kozuchi上線,可以用自然語言進行AutoML的工具上線

熱門新聞

Advertisement