環顧整個FPGA加速運算領域,目前擁有最多款資料中心等級產品的賽靈思(Xilinx),今年11月中期間舉行的全球超級電腦年度大會SC21期間,他們發表新款頂級FPGA加速卡Alveo U55C。

這款產品目前已經上市,除了可透過賽靈私與認證經銷商取得,也可經由公有雲廠商推出的FPGA即服務來進行簡易評估,或由特定的代管資料中心業者提供封閉預覽。

相較於先前最高階的Alveo U280,外形為雙槽、全高全長尺寸的PCIe介面卡、內建8 GB容量的HBM2記憶體,以及225瓦的最大功耗,Alveo U55C則以單槽、全高半長尺寸的PCIe介面卡,以及150瓦的最大功耗,搭配16 GB容量的HBM2記憶體,提供與U280同樣的邏輯運算配備,像是130.4萬張查詢表(LUT)、260.7萬個暫存器、9,024個DSP切片,實現更大的運算密度(U280內建32GB DDR4-2400記憶體,U55C則未搭配DDR4記憶體,並提供多一倍容量的HBM記憶體,賽靈思表示,這樣可以節省功耗)。

此外,在網路傳輸介面的部分,U55C也額外支援了RoCEv2,以及資料中心橋接(Data Center Bridging Capability Exchange protocol,DCBx)等規格,可串接數百張U55C達成超大規模的橫向擴充,並且能結合與既有的伺服器基礎架構、網路配置。

在這樣的搭配之下,用戶可將網路存取頻寬合併成200 Gbps,建構基於FPGA而成的高效能運算叢集環境,並憑藉著高效能、低延遲,以及相對開放的特性,與InfiniBand網路解決方案競爭。

若採用多張Alveo U55C串接的組態,以及訊息傳遞介面(Message Passing Interface,MPI)的整合,開發者可運用賽靈思發展的統合軟體平臺Vitis,將Alveo資料處理流程的規模橫向擴展開來,使得高效能運算的應用可橫跨不同的伺服器平臺與網路基礎架構,共享工作負載的執行,以及記憶體的存取。

關於U55C的叢集應用解決方案,賽靈思表示,目前已開放封閉預覽,預計於2022年下半正式推出。

在實際應用的部分,賽靈思目前揭露3個高效能運算案例。首先,澳洲聯邦科學與工業組織(CSIRO),他們將U55C用於平方公里陣列(SKA)的無線電望遠鏡訊號處理,透過這種以網路連接大量FPGA加速卡的部署方式,能夠在整個高效能運算訊號處理叢集環境當中,提供超大規模的資料吞吐能力,能面對13.1萬臺的天線,即時執行資料的彙集、過濾、整備、處理,而且可橫跨數百張FPGA加速卡進行分散式處理。

 

 

這裡面總共使用了21臺伺服器、420張U55C(每臺節點20張U55C),以及20臺支援P4語言的100GbE交換器,整體吞吐量可達到15 Tb/s;在IT運算資源與電力的成本上,FPGA交織網路執行上述工作的同時,還可保有一半的頻寬餘裕,以及HBM記憶體容量,具有足夠的可靠度,而就每張U55C而言,平均耗電為90瓦,CSIRO在此搭配的是太陽能發電,以及柴油發電機提供備援電力。

第二個案例是電腦輔助工程(CAE),賽靈思透過每家汽車公司都必用的碰撞模擬軟體:Ansys的LS-DYNA來展現成效。根據他們的測試,若以x86處理器平臺為基準,搭配多張U55C之後,效能可提升至5倍以上,因此,能在單一資料流程處理過程的每個運算時脈週期中,執行更多工作。

賽靈思認為,x86架構之所以表現較差,關鍵在於:其配備難支撐大量I/O,以及頻寬的使用;在記憶體階層的使用上,彈性不足,而導致非必要的負擔;在面對資料搬移時,缺乏效率。

第三個例子則是圖學資料分析的處理,有一家圖學資料庫軟體廠商TigerGraph,他們搭配多張U55C、建立叢集,以此來加速執行兩種可創造最多用途的演算法,促成圖學式推薦處理,以及叢集式的運作引擎。

在這樣的應用情境當中,U55C可加快推薦引擎的查詢與預測速度,將所需時間從幾分鐘縮短至幾毫秒。

相較於基於CPU而成的叢集系統,多張U55C可帶來強大的運算能力與記憶體頻寬,以詐騙偵測與反洗錢的應用為例,圖學資料的查詢速度能因此提升至45倍,同時,還可以將誤判率大幅降低至個位數,所以在品質評分上,可增加35%。

   

產品資訊

賽靈思Alveo U55C
●原廠:賽靈思
●建議售價:廠商未提供
●外型:全高半長PCIe介面卡
●I/O介面:PCIe 3.0 x16或2個PCIe 4.0 x8
●搭配記憶體容量:無DDR記憶體,16 GB HBM2記憶體
●傳輸介面:2個QSFP28埠(100GbE)
●搭配處理器:無
●FPGA運算晶片:UltraScale+ XCU55C
●耗電量:115瓦

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】

熱門新聞

Advertisement