人工智慧的重要性不言可喻,於是有了「得AI者,得天下」的論調,然而,該如何「得AI」?很多人會馬上想到資料、運算能力、軟體、AI模型等因素,網路存取能力與效率,很少排在前面的考量。

隨著GPU大廠Nvidia持續壟斷AI硬體的技術應用話題,大家都想找到他們稱霸市場的答案,其中,活用Nvidia自家GPU加速機制的統一運算架構(CUDA),以及軟硬體堆疊改良、擴充與普及,是最常見的回答。

不過,這幾年以來,雖然有越來越多廠商投入AI軟硬體研發,搭配方式與選擇理應日益豐富,但為何市場還是非常看好與看重Nvidia的發展?除了他們能提供相對清楚、有序的硬體產品發展藍圖,持續鎖定企業應用需求的軟體平臺,過去一直被整個業界低估的部分,主要是他們對網路技術的布局,近期隨著多家IT廠商組成的超乙太網路聯盟(UEC)成軍,也突顯整個IT產業發展盲點,那就是對於資料中心網路的不夠重視。

回顧2020年Nvidia完成併購資料中心網路設備大廠Mellanox,但他們並不急著大舉擴張網路產品線,局部參與軟體定義網路(SDN)與網路功能虛擬化(NFV)的發展,但未投入大量身家進軍電信網路轉型市場,而是思考如何將這些技術融入GPU加速應用領域。

另一方面,當伺服器廠商起初僅願意提供GPU伺服器,透過強調加速器硬體搭配的準系統,想要測試市場需求水溫之際,Nvidia決定一馬當先,推出自有品牌整合式AI系統伺服器DGX系列,而在歷經多個GPU架構世代的變革,如今也已培養出足以支撐整個AI資料中心運作的生態系,涵蓋伺服器、儲存系統,網路則是最後一塊拼圖。

2023年5月底Nvidia在台北國際電腦展宣布推出乙太網路加速平臺Spectrum-X,正式將乙太網路產品線投入AI產品組合當中,涵蓋網路交換器、資料處理器、光纖網路線材與收發器,以及網路作業系統與軟體開發套件,力圖打造新一代高效率乙太網路,能夠充分滿足AI雲端服務環境網路所需,並且預告他們手上另一條InfiniBand網路產品線,將用於支援更大規模的GPU系統叢集,實現Nvidia提出的企業AI工廠願景。

相較之下,其他同時握有AI加速運算技術的大型IT廠商,長期觀望AI市場的發展,心力大多還是放在主力的伺服器處理器,但市場動能目前仍然更關注GPU,而非CPU,近才開始急起直追,但眾聲喧嘩,能否盡快提出令所有成員都支持的標準,令人擔憂。

例如,英特爾透過第四代Xeon Scalable內建的進階矩陣延伸指令集(AMX),以及不同用途的硬體加速器,想要吃下這塊市場。

雖然英特爾曾發展與推出Data Center GPU Max系列,但後來又改弦易張,把希望寄託在下一代GPU架構Falcon Shore。而英特爾另一個近期被業界看好的AI加速器Gaudi 3,雖然在2024年4月推出,但搭配這款運算平臺的伺服器產品,9月陸續上市,影響力尚未發酵。

此外,英特爾乙太網路產品與基礎架構處理器(IPU)並未在該公司AI布局,發揮應有的加乘效果,而且,產品未來發展態勢不明。看來只能指望作為超乙太網路聯盟發起者之一的英特爾,在2025年能有更多著墨。

至於AMD,在資料中心產品線的經營上,長期以EPYC系列處理器的發展為重,等到Instinct MI100系列GPU推出之後,他們對於整個加速運算平臺的架構,才逐漸取得能與Nvidia AI相提並論的條件,而在網路技術的布局上,2022年陸續完成賽靈思(Xilinx)、Pensando的併購,取得FPGA加速、智慧型網路卡、資料處理器等技術,前兩種解決方案有部分支援AI應用,資料處理器則是推廣雲端服務業者採用,但隨著超乙太網路聯盟的成立,AMD決定用Pensando產品線支撐這部分用途,在2024年10月宣布推出AI網路卡Pollara 400,以及第三代資料處理器Salina,他們表示,Pollara 400將與AMD處理器、GPU的產品發展藍圖保持一致。不過,目前來看,AMD自家伺服器等級CPU與GPU對於SmartNIC的搭配方式,還需揭露更多資訊。

除了英特爾、AMD,博通(Broadcom)也被寄予厚望,因為他們提供網路卡、交換器、ASIC晶片,企業市占相當高的伺服器虛擬化平臺vSphere,也是他們推動AI的殺手應用,而且是各家AI軟硬體極力拉攏的重要平臺,究竟誰能奪下AI市場,還有許多變化。

 相關報導  

專欄作者

熱門新聞

Advertisement