在2023年上半,Nvidia積極主推融合式GPU產品GH200 Grace Hopper Superchip,到了5月舉行的台北國際電腦展期間,他們號召雲達(QCT)、美超微(Supermicro)、技嘉(Gigabyte)這三家廠商,向全球展出首批搭配這款運算平臺的伺服器,後續我們也報導雲達發展的2U機型QuantaGrid S74G-2U,以及Supermicro的1U機型ARS-111GL-DNHR-LCC

今年3月GTC大會期間,美超微針對巨量大型語言模型(LLM)運算環境的設置,推出多座機櫃組成的基礎組建模塊(foundational building blocks)解決方案,名為AI SuperCluster系列,其中就有搭配GH200 Grace Hopper Superchip的組合。

此系列伺服器系統目前提供3款產品選擇,均利用5座或9座48U尺寸機櫃的部署規模,總共供應256顆Hopper架構資料中心GPU,當中的兩款解決方案,均是搭配32臺採用Nvidia HGX H100或H200 8-GPU的伺服器系統,分別為5櫃型態、導入液態冷卻技術的SRS-48UGPU-AI-LCSU,以及9櫃型態、導入空氣冷卻技術的SRS-48UGPU-AI-ACSU,

  

而剩下的一款同樣為9櫃型態、導入空氣冷卻技術的SRS-MGX256-SU-001,卻是搭配256臺採用單顆GH200 Grace Hopper Superchip的1U伺服器。

就機櫃組成方式而言,SRS-MGX256-SU-001包含8座運算機櫃與1座交換器機櫃。以單座運算機櫃的角度來看,在伺服器方面,這裡可搭載32臺1U尺寸的ARS-111GL-NHR,等於能提供32顆GH200 Grace Hopper Superchip,記憶體組態為15 TB容量的LPDDR5X(32 x 480 GB),以及3TB或4.5TB容量的HBM3(32 x 96 GB或32 x 144 GB)。

    

而在交換器的部分,以運算交織網路(Compute Farbric)來看,SRS-MGX256-SU-001總共可搭配12臺64埠400Gb InfiniBand交換器,機型名稱為SSE-MQM9700-NS2F(Nvidia QM9700),當中4臺用於設置網路的骨幹(Compute Farbric Spine),其餘8臺用於設置網路的枝葉(Compute Farbric Leaf);

以網路管理機制的差異來看,負責提供頻外管理(Out-of-band)的設備,是8臺放置在機櫃頂端的48埠GbE乙太網路交換器,機型名稱為SSE-G3748R-SMIS,負責提供頻內管理(in-band)的設備,是4臺64埠100GbE乙太網路交換器,機型名稱為SE-MSN4600(Nvidia SN4600)。

產品資訊

Supermicro SRS-MGX256-SU-001
●原廠:Supermicro
●建議售價:廠商未提供
●建置規模:9座48U尺寸機櫃,含8座運算機櫃搭配1座交換器機櫃,總共256臺運算節點
●單座運算機櫃配置:32臺1U尺寸Grace Hopper Superchip單路伺服器ARS-111GL-NHR,搭配1臺400Gb Infiniband交換器MQM9700-NS2F、1臺置頂1Gb乙太網路(頻外管理)交換器SSE-G3748R-SMIS、1臺(頻內管理)100GbE交換器SSE-MSN4600-CS2FC
●單座交換器機櫃配置:4臺400Gb Infiniband交換器MQM9700-NS2F
●單臺運算節點配置:單張Nvidia Grace Hopper Superchip(Grace CPU、Hopper GPU(內建96 GB或144 GB ECC HBM3記憶體)、480 GB LPDDR5X記憶體)、8臺E1.S外形SSD與2臺M.2外形SSD、2個400 Gb InfiniBand埠(2張ConnectX-7,或ConnectX-7與BlueField-3各1)、2臺2000瓦電源供應器(1+1備援)

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】

熱門新聞

Advertisement