附加模組式的硬體加速單元,是目前儲存設備應用最廣泛的輔助運算類型,照片中分別是NetApp A400的卸載引擎卡(上),HPE SimpliVity OAC加速卡(中),EMC VMAX壓縮I/O模組(下)。(圖片來源/Dell EMC、NetApp、HPE)

由於較低的導入成本與技術門檻,附加模組型式的輔助處理器架構,是當前最普及的一種儲存設備加速硬體部署方式,首先被應用於高階儲存陣列產品,在中階儲存陣列與超融合系統領域,也有引進硬體加速附加模組的例子。

除了儲存廠商發展的硬體加速模組外,近2、3年來,在網路巨頭與新創廠商的推動下,又誕生了SmartNIC、資料處理器(DPU)與儲存處理器(SPU)等嶄新的儲存加速硬體產品。

高階儲存陣列上的硬體加速模組

早在2000年代中期,當時的儲存龍頭EMC,便為旗下Symmetrix DMX高階儲存陣列,提供了內含於乙太網路模組上的壓縮晶片,主要目的是用來減少網路傳輸頻寬需求,例如幫助減少SRDF遠端複製功能的傳輸頻寬,當資料傳送到網路之前,先透過壓縮晶片壓縮資料,待船送到遠端、寫入儲存區時,再解開為原始狀態。

後來Symmetrix DMX於2009年為新一代的VMAX系列取代,VMAX同樣擁有用於搭配SRDF遠端複製功能的前端I/O模組單元,後來也導入了功能更廣泛的硬體加速單元。在2016年中,此時剛與Dell合併不久後的Dell EMC,發表了VMAX的全快閃機型VMAX All Flash,同時也推出新的硬體加速模組。引進了用於提供Inline壓縮功能的硬體介面卡,稱做Compression I/O模組,可幫助縮減寫入儲存區的資料量,用途比Symmetrix DMX上的壓縮晶片廣泛許多。

接下來,Dell EMC在2018年推出的最新一代PowerMax高階儲存系列,又引進了新的資料縮減模組介面卡——Data Reduction I/O模組,不僅提供了壓縮功能,也兼具重複資料刪除功能,既可顯著減少寫入儲存區的資料量,同時也卸載了控制器的資料刪減運算負擔。

除了Dell EMC外,另一家一線大廠Hitachi Vantara,也在高階儲存陣列產品引進了專屬加速硬體,如2016年推出的上一代的旗艦機型VSP F1500/G1500,便透過ASIC晶片,來處理包括大型主機I/O處理與控制器互連傳輸在內的許多工作負載。

在2020年初推出的新旗艦機型VSP 5000上,Hitachi Vantara對核心架構做了調整,改以SVOS儲存作業系統軟體功能,取代過去的ASIC晶片,來處理大型主機相關的I/O處理作業,但也另外導入內含FPGA晶片的FAM模組(Fabric Accelerated Module),來作為控制器內部互連網路的中介,卸載控制器互連的I/O處理負擔。

在沒有FAM模組時,面對跨控制器之間的資料傳輸時,目標端控制器的處理器,除了必須處理來源端處理器發出的資料傳輸指令要求,同時,也必須處理資料傳輸作業,從而耗費許多處理器週期。而在有了FAM模組後,改由FAM模組來處理資料傳輸指令,並直接存取控制器記憶體,然後回覆給來源端控制器,藉此卸除目標端控制器相關處理負擔,Hitachi Vantara宣稱,藉此可為VSP 5000提供多達46%的IOPS效能提升。

中階儲存與超融合系統的硬體加速模組應用

隨著加速硬體晶片成本的降低,現在除了高階儲存陣列之外,也有其他儲存產品引進了硬體加速模組。

例如在中階儲存陣列方面,NetApp在2019年底發表的AFF A400,便是中階儲存陣列採用硬體加速模組的例子。AFF A400的控制器預載了1張基於ASIC的卸載引擎卡(offload engine card),這張卡含有2個100GbE埠,用於A400雙控制器之間的互連,還提供了用於壓縮、解壓縮,以及重複資料刪除特徵值運算比對等硬體運算功能,可為處理器卸載這些運算負擔。

另外,在超融合系統領域,目前屬於HPE旗下的超融合系統品牌SimpliVity,也是一個應用硬體加速模組的著名案例。相較於其他超融合平臺如Nutanix AOS與VMware vSAN,都是純粹的軟體定義儲存架構,完全依靠超融合伺服器的通用處理器,來承載所有運算工作。而SimpliVity的OmniStack儲存平臺則可搭配專屬的OAC(OmniStack Accelerator Card)加速卡,來幫助卸載壓縮與重複資料刪除運算。

OAC加速卡的核心,是一顆Xilinx Zynq FPGA SHA-1與壓縮引擎晶片, OmniStack平臺會把資料讀到OAC卡上,由OAC卡執行壓縮與重複資料刪除運算。

熱門新聞

Advertisement