從配角晉升為主角的加速運算

從幾年以前開始，我和技術主筆張明德每次一談到資料中心運算架構的變化趨勢，總是會有「天下大勢合久必分，分久必合」的感觸。之所以如此認為，原因與我們本期所製作的封面故事《新世代加速運算來臨》有很大的關係，希望能夠探討近期陸續出現不少新型態的融合型運算產品，像是智慧型網路卡（SmartNIC）、資料處理器（DPU），以至儲存處理器（SPU）、運算型儲存裝置（CSD）。

事實上，若要追溯這一波波以加速運算為主角的風潮，自是必須從GPU加速器、協同處理器（Coprocessor），開始算起。

隨著機器學習、深度學習的應用需求大增，GPU伺服器逐漸成為資料中心運算不可或缺的部分，尤其是Nvidia Tesla P100 GPU與DGX系列整合應用設備推出後，更是開拓了GPU伺服器的新局，GPU不再只是資料中心的周邊應用，而是驅使許多用戶購置伺服器，以及廠商發表新品的主要動力，無論是資料中心或是超級電腦系統的發展與競爭，焦點幾乎都落在GPU與軟硬體生態系。

為了分食AI應用市場大餅，市面上出現各式AI加速晶片與加速卡，例如，Google發展的TPU（Tensor Processing Unit），英特爾也併購多家公司，並推出VPU（Vision Processing Units），以及AI專屬晶片。我們在前幾年也在伺服器廠商的相關合作對象中，看到新創公司Graphcore力推IPU（Intelligence Processing Unit）概念的加速卡。

另外，也有廠商希望基於技術相對成熟的FPGA來推出加速卡，例如英特爾與賽靈思，後續這兩家同時擁有FPGA與網路介面技術的公司，為了因應5G網路帶來的電信業資料中心變革與邊緣運算商機，更是延伸出SmartNIC產品線。

談到SmartNIC，另一家在網路介面具有舉足輕重地位的Mellanox也是關鍵。

他們早先發展出結合Arm處理器與網路晶片的產品，開始主推此種架構的SmartNIC產品，以及運算性能更強大的IPU/DPU。

而在2020年Nvidia完成併購該公司之後，更是將他們原本主推的RDMA、SmartNIC/DPU存取技術，與其發展的資料中心規模運算（Datacenter-Scale Computing）願景結合，起初是希望運用GPU與網路技術來跨足5G領域的AI應用，但更令人驚喜的是，與Nvidia長期合作發展vGPU應用的廠商VMware宣布，雙方要開發以DPU卸載伺服器虛擬化平臺多種服務的功能。而依循這樣的發展態勢，其他Hypervisor、超融合基礎架構平臺，以及基於Kubernetes而成的容器即服務平臺，勢必也會跟進。

此外，英特爾也宣示將推動混合運算架構的願景XPU，希望能夠橫跨CPU、GPU、FPGA與各種運算加速器，而要實現這樣的運算，他們提出了oneAPI概念，提供通用、開放、標準化的程式開發環境支援。

到了今年6月，似乎是為了不讓Nvidia DPU專美於前，英特爾宣布將推動基礎架構處理器（Infrastructure Processing Unit，IPU）。

他們表示，想要提供可程式化的網路裝置，能讓雲端與網路通訊服務業者採用，以減少日常IT資源負擔、釋放更多CPU效能，讓用戶可以透過兼具安全性、可程式化、穩定性的解決方案，更妥善地平衡運算與儲存的使用（顯然這訴求跟SmartNIC或DPU的主要特色是類似的）。而這樣的產品應該快要問世，因為他們提到，目前首款基於FPGA技術的IPU平臺，已部署在多個雲端業者環境，而另一款基於ASIC技術的IPU正在測試。

面對蓬勃發展的多元運算技術，雖然令人感慨CPU不再總覽全局，但我們樂觀其成，因為競爭帶來更多的機會，促使廠商加快創新腳步，這應是用戶之福。這讓我想到，中國清宮戲劇《如懿傳》太后面對後宮爭鬥的評論：「哀家從來不喜歡宮中只有一蓬花開得艷麗，百花齊放才是真正的三春盛景。」

相關報導

從配角晉升為主角的加速運算

專欄作者

熱門新聞