在4月12日,GPU大廠Nvidia預告,將於2023年推出一顆代號為Grace的資料中心等級處理器,鎖定人工智慧與高效能運算的應用場景,為他們在2020年9月宣布併購Arm的消息,訂定了一個眾所期待的新目標,也替處理器平臺之爭,以及中央處理器(CPU)與協同處理器/加速處理器之間的競爭與合作,重新定調。
這幾年以來,Nvidia之所以屢屢躍上大眾媒體版面,往往還是跟他們的消費型GPU有關,大多都是用於數位貨幣挖礦的消息(更早期多是電腦遊戲、動畫製作的應用),而在商業媒體的報導中,則是聚焦在他們發展的自動駕駛車、人工智慧應用技術,iThome過往也持續追蹤Nvidia GPU虛擬化、針對多個產業而發展的機器學習軟體平臺,以及其他廠商合作的GPU伺服器。
或許是基於如此多元的發展,以及不斷成長的運算效能,2018年曾有中國媒體以「超越摩爾定律的男人!」來稱呼Nvidia創辦人暨執行長黃仁勳,當時覺得這形容很誇張,而且又呼應Nvidia在許多大型研討會主題演講時不斷強調的重點,總讓人難以心服口服。然而,Nvidia今日之所以在個人消費端、學術界、商業領域,都能占有一席之地,絕非偶然,因此,現在再來審視他們如何超越摩爾定律一說,答案已越來越清晰。
硬體GPU的部分,當然是一切的開端,從個人電腦跨足伺服器、雲端服務、超級電腦,Nvidia一步步將圖形運算,從家庭娛樂推向商業和學術應用領域。不只是提供獨立顯示卡、獨立顯示晶片、GPU加速卡,他們更是積極發展相關基礎架構軟體元件,努力追趕伺服器虛擬化、容器化,以及K8s雲端原生架構,並且以此推出具有不同整合度的GPU伺服器、GPU整合設備,甚至是超級電腦。
此外,他們也不惜重本投入軟硬體與人力,我們認為,目的應該是為了確保更長遠的市場應用需求。
例如,提供可免費下載的雲端容器登錄服務NGC,讓所有開發人員能夠下載使用「各種」熱門的開原碼AI軟體框架,然而,背後的網路頻寬、平臺維運、軟體映像檔的調校/更新/維護,都是龐大的成本。Nvidia也積極發展與維運自家的超級電腦,並且也躋身Top500全球超級電腦,向全世界證明他們產品技術與系統整合的能耐。
以2020年11月的榜單為例,他們就有4座系統上榜,分別是2020年6月進榜的Selene(從第7名躍升至第5名),2019年6月進榜的DGX SuperPOD(最初是第20名,最近是26名),2016年11月進榜的DGX Saturn V(最初是第29名,最近是92名),2020年11月進榜的Nvidia DGX SuperPOD(第170名)。而這些系統就算不將軟硬體費用計入,但應該也會為Nvidia帶來不少的電力支出負擔。
AI應用軟體框架與不同產業應用的拓展,更是Nvidia讓人拍案叫絕的重要策略,他們從CUDA一路擴展、延伸到CUDA-X AI系列,再加上2020年併購Mellanox、Cumulus Networks、Arm,又將增添更多軟體層面的輔助開發環境。例如,今年他們針對源於Mellanox的DPU推出DOCA軟體開發套件,讓兩者搭配,提供類似GPU與CUDA 的相互拉抬的模式;Nvidia發表AI資安應用框架軟體Morpheus,當中就結合GPU、DPU,以及源於Cumulus Networks的遙測代理程式,提供推論與資料收集的功能。此外,他們預計2025年大量導入自動駕駛車的車用運算平臺Nvidia Drive Atlan,不只是採用Nvidia GPU、Arm CPU,也將搭配DPU。
無論如何,Nvidia仍將繼續拓展他們的軟硬體應用,而且可望會看到更多搭配Arm處理器,以及DPU的各式解決方案,接下來,就看Intel、AMD如何接招吧!
專欄作者
熱門新聞
2024-12-16
2024-12-16
2024-12-17
2024-12-16