從幾年以前開始,我和技術主筆張明德每次一談到資料中心運算架構的變化趨勢,總是會有「天下大勢合久必分,分久必合」的感觸。之所以如此認為,原因與我們本期所製作的封面故事《新世代加速運算來臨》有很大的關係,希望能夠探討近期陸續出現不少新型態的融合型運算產品,像是智慧型網路卡(SmartNIC)、資料處理器(DPU),以至儲存處理器(SPU)、運算型儲存裝置(CSD)。
事實上,若要追溯這一波波以加速運算為主角的風潮,自是必須從GPU加速器、協同處理器(Coprocessor),開始算起。
隨著機器學習、深度學習的應用需求大增,GPU伺服器逐漸成為資料中心運算不可或缺的部分,尤其是Nvidia Tesla P100 GPU與DGX系列整合應用設備推出後,更是開拓了GPU伺服器的新局,GPU不再只是資料中心的周邊應用,而是驅使許多用戶購置伺服器,以及廠商發表新品的主要動力,無論是資料中心或是超級電腦系統的發展與競爭,焦點幾乎都落在GPU與軟硬體生態系。
為了分食AI應用市場大餅,市面上出現各式AI加速晶片與加速卡,例如,Google發展的TPU(Tensor Processing Unit),英特爾也併購多家公司,並推出VPU(Vision Processing Units),以及AI專屬晶片。我們在前幾年也在伺服器廠商的相關合作對象中,看到新創公司Graphcore力推IPU(Intelligence Processing Unit)概念的加速卡。
另外,也有廠商希望基於技術相對成熟的FPGA來推出加速卡,例如英特爾與賽靈思,後續這兩家同時擁有FPGA與網路介面技術的公司,為了因應5G網路帶來的電信業資料中心變革與邊緣運算商機,更是延伸出SmartNIC產品線。
談到SmartNIC,另一家在網路介面具有舉足輕重地位的Mellanox也是關鍵。
他們早先發展出結合Arm處理器與網路晶片的產品,開始主推此種架構的SmartNIC產品,以及運算性能更強大的IPU/DPU。
而在2020年Nvidia完成併購該公司之後,更是將他們原本主推的RDMA、SmartNIC/DPU存取技術,與其發展的資料中心規模運算(Datacenter-Scale Computing)願景結合,起初是希望運用GPU與網路技術來跨足5G領域的AI應用,但更令人驚喜的是,與Nvidia長期合作發展vGPU應用的廠商VMware宣布,雙方要開發以DPU卸載伺服器虛擬化平臺多種服務的功能。而依循這樣的發展態勢,其他Hypervisor、超融合基礎架構平臺,以及基於Kubernetes而成的容器即服務平臺,勢必也會跟進。
此外,英特爾也宣示將推動混合運算架構的願景XPU,希望能夠橫跨CPU、GPU、FPGA與各種運算加速器,而要實現這樣的運算,他們提出了oneAPI概念,提供通用、開放、標準化的程式開發環境支援。
到了今年6月,似乎是為了不讓Nvidia DPU專美於前,英特爾宣布將推動基礎架構處理器(Infrastructure Processing Unit,IPU)。
他們表示,想要提供可程式化的網路裝置,能讓雲端與網路通訊服務業者採用,以減少日常IT資源負擔、釋放更多CPU效能,讓用戶可以透過兼具安全性、可程式化、穩定性的解決方案,更妥善地平衡運算與儲存的使用(顯然這訴求跟SmartNIC或DPU的主要特色是類似的)。而這樣的產品應該快要問世,因為他們提到,目前首款基於FPGA技術的IPU平臺,已部署在多個雲端業者環境,而另一款基於ASIC技術的IPU正在測試。
面對蓬勃發展的多元運算技術,雖然令人感慨CPU不再總覽全局,但我們樂觀其成,因為競爭帶來更多的機會,促使廠商加快創新腳步,這應是用戶之福。這讓我想到,中國清宮戲劇《如懿傳》太后面對後宮爭鬥的評論:「哀家從來不喜歡宮中只有一蓬花開得艷麗,百花齊放才是真正的三春盛景。」
專欄作者
熱門新聞
2024-12-10
2024-12-08
2024-12-10
2024-12-10
2024-11-29
2024-12-10