睽違5年的Nvidia GTC實體大會登場，新一代Blackwell GPU架構問世

圖片來源:

Nvidia

Nvidia的開發者大會Nvidia GTC在睽違5年後，本周一（3/18）再度舉辦連續4天的實體活動，拜AI風潮所賜，這是GTC大會15年來最盛大的一場，預計進行逾900場會議，實體與會人數超過1.1萬名，由Nvidia創辦人暨執行長黃仁勳（Jensen Huang）的演講揭開序幕，他介紹了Nvidia的各種新技術與產品，宣稱全新的Blackwell運算平臺是Nvidia專為生成式AI時代所打造的處理器，包括AWS、微軟、Meta、OpenAI、Dell、Google、甲骨文、Tesla與xAI都計畫採用。

這場會議備受外界矚目，因為Nvidia在全球AI晶片的市占率高達9成。黃仁勳認為，通用運算已失去動力，加速運算則到達了臨界點，人們需要另一種運算方式以繼續擴展，繼續降低運算成本，才能於可持續的同時繼續消耗更多的運算。此外，需要訓練各種型態資料的多模態AI的興起也讓運算需求升溫，人們需要更大的模型，也需要更大的GPU，Blackwell即是為了解決此一挑戰而設計的。

Blackwell為Nvidia新一代的GPU架構，是兩年前推出的Hopper架構的繼任者，其名稱是為了向美國首位進入國家科學院的黑人數學家David Harold Blackwell致敬。

根據Nvidia的說明，基於Blackwell架構的GPU是由2,080億個電晶體組成，採用客製化的台積電4NP製程所生產，所有Blackwell產品皆配備兩個具有光罩限制的晶粒，藉由每秒10TB的晶片互連技術，產生一個強大的GPU。此外，Blackwell支援第二代Transformer引擎，可加速大型語言模型（LLM）及專家混合模型（MoE）的推論及訓練，並提高其精度與準確度。

Blackwell透過NVLink及NVLink Switch等互連技術來強化GPU之間的通訊，配備解壓縮引擎來協助處理傳統上通常仰賴CPU的資料分析任務，以及擁有一個可協助系統復原的可靠性、可用性及可維護性引擎（RAS）。

這使得Blackwell在訓練上的FP8效能是Hopper的2.5倍，推論的FP4效能是Hopper的5倍，採用第5代NVLink技術則可達到Hopper的兩倍快，還可擴展至576個GPU。

現階段基於Blackwell架構的AI晶片主要為B100與B200，但Nvidia特別設計了GB200 Grace Blackwell Superchip超級晶片（下圖），透過NVLink將兩個B200連至Nvidia Grace CPU，再利用GB200建置了機架系統Nvidia GB200 NVL72。

全球最主要的AI晶片業者所發表的最新技術及產品，也受到全球主要AI業者及雲端服務供應商的青睞，包括AWS、Google Cloud、Microsoft Azure與Oracle Cloud Infrastructure皆已承諾要提供基於Blackwell架構的實例。

圖片來源／Nvidia

熱門新聞