走向全方位商業應用的IT傳奇

在4月12日，GPU大廠Nvidia預告，將於2023年推出一顆代號為Grace的資料中心等級處理器，鎖定人工智慧與高效能運算的應用場景，為他們在2020年9月宣布併購Arm的消息，訂定了一個眾所期待的新目標，也替處理器平臺之爭，以及中央處理器（CPU）與協同處理器／加速處理器之間的競爭與合作，重新定調。

這幾年以來，Nvidia之所以屢屢躍上大眾媒體版面，往往還是跟他們的消費型GPU有關，大多都是用於數位貨幣挖礦的消息（更早期多是電腦遊戲、動畫製作的應用），而在商業媒體的報導中，則是聚焦在他們發展的自動駕駛車、人工智慧應用技術，iThome過往也持續追蹤Nvidia GPU虛擬化、針對多個產業而發展的機器學習軟體平臺，以及其他廠商合作的GPU伺服器。

或許是基於如此多元的發展，以及不斷成長的運算效能，2018年曾有中國媒體以「超越摩爾定律的男人！」來稱呼Nvidia創辦人暨執行長黃仁勳，當時覺得這形容很誇張，而且又呼應Nvidia在許多大型研討會主題演講時不斷強調的重點，總讓人難以心服口服。然而，Nvidia今日之所以在個人消費端、學術界、商業領域，都能占有一席之地，絕非偶然，因此，現在再來審視他們如何超越摩爾定律一說，答案已越來越清晰。

硬體GPU的部分，當然是一切的開端，從個人電腦跨足伺服器、雲端服務、超級電腦，Nvidia一步步將圖形運算，從家庭娛樂推向商業和學術應用領域。不只是提供獨立顯示卡、獨立顯示晶片、GPU加速卡，他們更是積極發展相關基礎架構軟體元件，努力追趕伺服器虛擬化、容器化，以及K8s雲端原生架構，並且以此推出具有不同整合度的GPU伺服器、GPU整合設備，甚至是超級電腦。

此外，他們也不惜重本投入軟硬體與人力，我們認為，目的應該是為了確保更長遠的市場應用需求。

例如，提供可免費下載的雲端容器登錄服務NGC，讓所有開發人員能夠下載使用「各種」熱門的開原碼AI軟體框架，然而，背後的網路頻寬、平臺維運、軟體映像檔的調校／更新／維護，都是龐大的成本。Nvidia也積極發展與維運自家的超級電腦，並且也躋身Top500全球超級電腦，向全世界證明他們產品技術與系統整合的能耐。

以2020年11月的榜單為例，他們就有4座系統上榜，分別是2020年6月進榜的Selene（從第7名躍升至第5名），2019年6月進榜的DGX SuperPOD（最初是第20名，最近是26名），2016年11月進榜的DGX Saturn V（最初是第29名，最近是92名），2020年11月進榜的Nvidia DGX SuperPOD（第170名）。而這些系統就算不將軟硬體費用計入，但應該也會為Nvidia帶來不少的電力支出負擔。

AI應用軟體框架與不同產業應用的拓展，更是Nvidia讓人拍案叫絕的重要策略，他們從CUDA一路擴展、延伸到CUDA-X AI系列，再加上2020年併購Mellanox、Cumulus Networks、Arm，又將增添更多軟體層面的輔助開發環境。例如，今年他們針對源於Mellanox的DPU推出DOCA軟體開發套件，讓兩者搭配，提供類似GPU與CUDA 的相互拉抬的模式；Nvidia發表AI資安應用框架軟體Morpheus，當中就結合GPU、DPU，以及源於Cumulus Networks的遙測代理程式，提供推論與資料收集的功能。此外，他們預計2025年大量導入自動駕駛車的車用運算平臺Nvidia Drive Atlan，不只是採用Nvidia GPU、Arm CPU，也將搭配DPU。

無論如何，Nvidia仍將繼續拓展他們的軟硬體應用，而且可望會看到更多搭配Arm處理器，以及DPU的各式解決方案，接下來，就看Intel、AMD如何接招吧！

走向全方位商業應用的IT傳奇

專欄作者

熱門新聞