Nvidia
Nvidia的開發者大會Nvidia GTC在睽違5年後,本周一(3/18)再度舉辦連續4天的實體活動,拜AI風潮所賜,這是GTC大會15年來最盛大的一場,預計進行逾900場會議,實體與會人數超過1.1萬名,由Nvidia創辦人暨執行長黃仁勳(Jensen Huang)的演講揭開序幕,他介紹了Nvidia的各種新技術與產品,宣稱全新的Blackwell運算平臺是Nvidia專為生成式AI時代所打造的處理器,包括AWS、微軟、Meta、OpenAI、Dell、Google、甲骨文、Tesla與xAI都計畫採用。
這場會議備受外界矚目,因為Nvidia在全球AI晶片的市占率高達9成。黃仁勳認為,通用運算已失去動力,加速運算則到達了臨界點,人們需要另一種運算方式以繼續擴展,繼續降低運算成本,才能於可持續的同時繼續消耗更多的運算。此外,需要訓練各種型態資料的多模態AI的興起也讓運算需求升溫,人們需要更大的模型,也需要更大的GPU,Blackwell即是為了解決此一挑戰而設計的。
Blackwell為Nvidia新一代的GPU架構,是兩年前推出的Hopper架構的繼任者,其名稱是為了向美國首位進入國家科學院的黑人數學家David Harold Blackwell致敬。
根據Nvidia的說明,基於Blackwell架構的GPU是由2,080億個電晶體組成,採用客製化的台積電4NP製程所生產,所有Blackwell產品皆配備兩個具有光罩限制的晶粒,藉由每秒10TB的晶片互連技術,產生一個強大的GPU。此外,Blackwell支援第二代Transformer引擎,可加速大型語言模型(LLM)及專家混合模型(MoE)的推論及訓練,並提高其精度與準確度。
Blackwell透過NVLink及NVLink Switch等互連技術來強化GPU之間的通訊,配備解壓縮引擎來協助處理傳統上通常仰賴CPU的資料分析任務,以及擁有一個可協助系統復原的可靠性、可用性及可維護性引擎(RAS)。
這使得Blackwell在訓練上的FP8效能是Hopper的2.5倍,推論的FP4效能是Hopper的5倍,採用第5代NVLink技術則可達到Hopper的兩倍快,還可擴展至576個GPU。
現階段基於Blackwell架構的AI晶片主要為B100與B200,但Nvidia特別設計了GB200 Grace Blackwell Superchip超級晶片(下圖),透過NVLink將兩個B200連至Nvidia Grace CPU,再利用GB200建置了機架系統Nvidia GB200 NVL72。
全球最主要的AI晶片業者所發表的最新技術及產品,也受到全球主要AI業者及雲端服務供應商的青睞,包括AWS、Google Cloud、Microsoft Azure與Oracle Cloud Infrastructure皆已承諾要提供基於Blackwell架構的實例。
圖片來源/Nvidia
熱門新聞
2024-11-25
2024-11-25
2024-11-15
2024-11-15
2024-11-26