關於金融科技(FinTech)應用領域的加速運算產品,AMD過去曾陸續推出Alveo X3522 PVAlveo UL3524,因應低延遲存取的電子金融交易應用需求,今年10月他們發表新款金融科技加速卡Alveo UL342,基於採用與Alveo UL3524相同的FPGA晶片Virtex UltraScale+ VU2P,以及同樣的產品特性,具備與Alveo UL3524相當的效能,身形卻只需要一半(全高半長對上全高3/4長),占用的機箱空間更少,而且,成本更低,對於交易商、造市商(market makers)、金融機構而言,能夠快速部署到各式各樣的伺服器當中,也適用於代管型的交易資料中心。

Alveo UL342目前已進入正式上市狀態,可量產供貨給全球金融服務客戶使用,AMD也宣布3家率先採用的用戶。

首先是專供前臺交易解決方案的供應商Exegy,他們發展的軟硬體開發環境nxFramework,原本就是用於組建與維護金融產業的FPGA超低延遲應用系統,現在可支援UL3422(該公司網站支援平臺提及多個AMD FPGA加速卡產品,但尚未將Alveo UL342列入)。

第二家是Hypertec,是針對金融服務產業供應硬體、雲端服務與加值解決方案的廠商,旗下的高頻交易伺服器HF X410R-G6,已通過支援UL34222的認證。

第三家是Xelera,是開發高速網路技術與機器學習應用系統的廠商,他們與AMD合作解決高頻交易機器學習演算法的延遲瓶頸,而在該公司供應的AI推論加速解決方案Xelera Silva,也藉此運用XGBoost、 LightGBM、CatBoost等多種進階AI模型,獲得即時、機器基於學習而成的交易決策輔助機制。

回歸金融科技加速卡產品的探討,單就硬體架構而言,Alveo UL342搭配的FPGA晶片Virtex UltraScale+ VU2P(XCVU2P),本身內建78萬張查找表(LUTs)、1,680個數位運算處理器(DSP)切片,具有新穎的收發器架構、經過強化、調校的網路連線核心,是專為高速交易而組建的FPGA晶片,能實現超低延遲的交易執行。

而且,由於這款FPGA晶片搭配的GTF收發器,可促使存取延遲低於3奈米以下(2.34奈秒),AMD表示,採用標準現成的FPGA晶片,很難能提供如此卓越的即時交易(tick-to-trade)效能,例如,若是Virtex UltraScale+ VU9P搭配的GTY收發器,存取延遲需要16奈秒,相較之下,VU2P 足足領先了7倍。

透過可衡量即時交易系統效能的STAC-T0測試結果紀錄,同樣歷經乙太網路協定、收發器、媒體存取控制(MAC)、演算法邏輯(Algo)的處理,VU9P最低需要27.8奈秒,而VU2P最低只需13.9奈秒,表現明顯優異,而縱觀這4道處理程序,收發器是影響延遲的最主要因素。

相較於既有的Alveo UL3524,最新發表的Alveo UL3422的差異不只是外形較短,也縮減網路埠(4個QSFP DD埠降為2個QSFP DD埠)、用來連接多張加速卡的連接埠(4個ARF6埠降為2個ARF6埠),並且移除板卡內建的QDR II記憶體。

在軟體開發應用上,企業可透過AMD Vivado Design Suite套件的搭配,支援傳統的FPGA處理流程——暫存器傳輸層級(RTL)流程的開發,此套工具內建一整包的參考設計,以及效能基準的衡量,可供FPGA設計人員快速探索關鍵量測指標,並且根據不斷進步的演算法,以及新興的交易法規遵循要求,發展自定的交易策略。

若要在高頻交易系統支援低延遲的AI模型部署,AMD也補充說明,表示他們提供開放原始碼的FINN開發框架,這當中運用PyTorch與神經網路量化技術,可協助縮減AI模型的大小,同時還能維持精準度,實現AI輔助的交易策略,而且,FINN編譯器能夠產生量化神經網路(QNN)的硬體智財區塊,可用於AMD FPGA晶片當中。

產品資訊

AMD Alveo UL3422
●原廠:AMD
●建議售價:廠商未提供
●外形:全高半長
●內建運算晶片:Virtex UltraScale+ FPGA(XCVU2P-FSVJ2104-3-E)、16奈米製程
●內建記憶體:16 GB DDR4-2400,搭配64位元資料加上8位元ECC(64b + 8b)
●提供網路埠:2個QSFP-DD埠,可分接16個10/25GbE埠
●連接介面:PCIe 4.0 x8
●擴充插槽:2個ARF6接頭,可分接16個10/25 GbE埠,再以此連接多張介面卡
●熱設計功耗:125瓦

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】

熱門新聞

Advertisement