
iThome
以改善伺服器記憶體效能與擴充瓶頸,並且能打破跨裝置記憶體資源運用藩籬為主要訴求的CXL(Compute Express Link)技術,終於在近期進入實際應用階段。
在伺服器上,記憶體是最寶貴的資源之一。但受先天架構所限,當前伺服器的記憶體應用,不僅容量與頻寬增長都遇到瓶頸,資源調配也缺乏彈性,以致利用率不彰,促使過去10年以來,一系列記憶體共享與互連技術的誕生,從最早由IBM主導的CAPI與OpenCAPI,到後來不同業界廠商結盟推動的CCIX與Gen-Z,到Intel主導的CXL。
這些技術試圖以PCIe或其他高速傳輸介面為基礎,跨越多臺伺服器與異質處理器的藩籬,將分散的記憶體資源組成統一定址、可共享運用的記憶體空間,從而突破伺服器的記憶體應用限制。
經過廠商聯盟間的一連串折衝與合作關係調整後,CXL技術在2021到2022年間,先後吸收、併入Gen-Z與OpenCAPI等兩項同性質的競爭規格,另一同性質技術聯盟CCIX在2021年初以後也形同停擺,等同於讓CXL統一了整個記憶體互連技術,進而推動相關產品技術的全面發展,從元件層級到系統層級廠商先後投入這個領域,陸續發表一系列應用解決方案概念與產品。
CXL正式進入實用化
但CXL實用化的腳步,比我們預想的要慢。
我們在2022與2023年,曾兩次透過封面故事介紹CXL技術與產品發展情況。2022年我們初次介紹CXL,寫出《CXL崛起!帶動伺服器架構革命》,當時相關產品仍處概念雛型驗證,距離實用尚遠。
2023年第2次介紹CXL近況,我們寫出《CXL記憶體邁向實用階段》,當時市面上已經有數家廠商推出第1批CXL產品,涵蓋擴充記憶體模組,以及記憶體池等兩大類型,但此時整個應用環境尚未成熟,這些產品仍停留在廠商與用戶端測試驗證階段,還不能算是「可用」。所以我們當時只能說CXL正「邁向」實用化,距離「進入」實用化,還差了臨門一腳。
導致CXL實用腳步放慢的原因,我們認為可能有兩點:一是AI興起導致資料中心的運算力需求轉向GPU端,以致CXL這項圍繞著CPU建構的技術,市場需求因此降低,另一原因是CXL的主要推手Intel,近兩年來深陷營運危機,連帶拖累CXL技術的推動。
不過,在CXL其他協力廠商努力下,CXL應用仍有緩慢、但明確的進展,終於讓應用環境在2024年後半逐步成熟。
到了2025年初的現在,我們終於可以很有信心地說:CXL技術進入實用階段,應用環境已經成形,同時,在規格與產品發展方面也有新發展。
首先,在CXL周邊裝置方面,最基本的CXL記憶體擴充模組,開始向用戶供貨,因此,已經算是「可用」。而更進階的CXL記憶體池產品,也進入用戶測試階段,有興趣的用戶現在能採購測試樣品進行驗證,等於也宣告這類型CXL產品脫離了先前的廠商端概念展示階段
其次,在應用環境方面,伺服器主機端已經備齊啟用CXL周邊裝置的條件,從Intel、AMD的主流處理器與晶片組、BIOS,到主要的作業軟體平臺,都已支援並能啟用CXL周邊裝置。
規格與產品應用的新發展
除了第一批產品正式上市出貨,以及應用環境的成熟外,過去1年多以來,CXL的規格制定與產品應用,也出現多項重要的新發展。
在規格制定方面,CXL聯盟(CXL Consortium)在2023年底與2024年底,陸續推出強化的CXL 3.1,以及CXL 3.2規格。
在產品應用方面,在已有CXL產品如記憶體擴充模組與記憶體池之外,市面上,又出現一系列基於CXL的嶄新型態產品,例如Marvell的記憶體加速器晶片,同時整合了CXL記憶體擴充能力、多種硬體加速卸載引擎,以及Arm處理器;還有Panmnesia基於其CXL 3.1交換器晶片,提出的CXL-GPU共享記憶體應用概念,該公司將CXL的記憶體擴展與共享應用擴展到GPU領域。
UnifabriX則推出軟體定義式CXL記憶體共享裝置,基於其FabriX Memory OS軟體平臺而成,硬體設備稱作UnifabriX MAX,不僅可支援最新的CXL 3.1與CXL 3.2功能,還引進新的外接傳輸鏈路架構,可支援遠超以往的大頻寬。
這一連串新發展,也促使我們時隔2年之後,重新將目光聚焦到CXL技術上。接下來我們便從CXL規格的新發展,新的CXL產品應用型態,以及CXL產品應用入門等面向,來檢視CXL技術現況。