由於有越來越多深度學習的技術應用需求,除了仰賴GPU加速相關處理,FPGA也是眾所關注的運算平臺,而在英特爾於2015年併購Altera公司、2017年推出可程式化加速卡,另一家FPGA廠商Xilinx(賽靈思),也在2018年10月於自家舉行的開發者論壇(Xilinx Developer Forum),發表了FPGA加速卡Alveo系列,第一波主推的機型是U200和U250,接著,則是在一個月後的美國超級電腦大會SC18,推出新機型U280。

採用Alveo系列加速卡能帶來哪些好處?用戶若要執行重要的資料中心應用系統,像是即時機器學習推論、視訊處理、基因體學研究、資料分析,能受益於這樣的運算平臺,獲得低延遲的處理能力,大幅改善效能。

在4月底來臺舉行的Xilinx Technology Day活動當中,賽靈思大中華區業務副總裁唐曉蕾,介紹了該公司的策略框架:資料中心優先、加速核心市場發展、驅動自行調適的運算,而在資料中心優先的策略當中,又可區分為運算加速、運算儲存、SmartNICs 和網路加速等三大層面。
以運算加速而言,Alveo系列FPGA加速卡是賽靈思近期開始主推的產品,舉例來說,去年美國加州聖荷西市舉行的Xilinx Developer Forum主題演講上,賽靈思執行長Victor Peng和AMD技術長Mark Papermaster同臺宣布一項新的世界紀錄,那就是AMD EPYC處理器搭配Xilinx Alveo加速卡之後,在推論處理的吞吐量可達到每秒3萬張圖片的效能。
而在今年臺舉行的Xilinx Technology Day,唐曉蕾也再度以此強調FPGA在機器學習效能上的突破。

上面列出的測試組態與結果,取自AMD今年3月底發布的白皮書《Xilinx Deep Learning Solutionon AMD EPYC Processors》,裡面描述Xilinx Deep Learning解決方案,以及部署在AMD EPYC平臺的成效。我們注意到這當中提到的硬體規格與效能數據,近似去年Xilinx Technology Day宣布的FPGA加速卡測試結果。例如,處理器皆是2顆32核心AMD EPYC 7551,FPGA卡也都是8張Xilinx Alveo U250。

而在這份白皮書的測試結果裡面也提到,若採用賽靈思深層神經網路引擎xDNN v3,最高可處理到近3萬張圖片,這和先前雙方同臺發布的測試結果所差無幾。

從運算架構來看,這三張加速卡搭配的FPGA晶片,全都採用賽靈思的16奈米製程的Virtex UltraScale+。

而在運算速度上,賽靈思也在當時發布的新聞稿當中,強調Alveo系列的成效,已然超越純粹採用CPU的系統,以及搭配CPU和GPU的系統。

以機器學習的應用而言,若是以搭配高階CPU的系統(英特爾Xeon Platinum)作為比較基準,採用U250的系統能夠加速即時推論的處理,並提供20倍的吞吐量;若是以搭配高階GPU這類功能固定加速器的系統(Nvidia Tesla V100)為準,採用U250的系統在低延遲性的表現上,可達到低於2毫秒的反應速度──相較於搭配Nvidia Tesla P4 GPU的系統,採用U250/U200系統的延遲度,甚至可減至3倍之多。

如果是大數據搜尋的軟體系統(由RYFT發布的 Elasticsearch版本),以資料的檢索速度而論,搭配Alveo系列FPGA卡的系統,是採用CPU系統的90倍以上。

根據賽靈思在去年11月發布的Alveo資料中心加速卡白皮書,裡面列出兩組效能測試的比較,上面的圖表,主要是比較多種運算平臺的推論處理吞吐量與延遲度(Xilinx Alveo系列的部份,搭配了最佳化的軟體框架Xilinx ML suite),下面的圖表,則是比較各平臺之間的每瓦電力推論處理吞吐量差異。

在Alveo系列FPGA加速卡去年10月發布之初,賽靈思公布了公有雲服務業者與伺服器廠商的生態系。前者包含了AWS、華為雲、阿里雲,後者有HPE、富士通、Dell EMC、IBM。

而在OEM搭售這系列產品的伺服器廠牌上,賽靈思於去年11月發表U280之際,也宣布Dell EMC是首家通過他們認證的業者,在現行的Power Edge系列伺服器當中,R740、R740xd、R7425、R840、R940xa等機型,均可搭配Alveo U200加速卡,其他廠商也將陸續完成驗證,像是富士通、HPE、IBM。

在2018‧杭州雲棲大會上,我們看到阿里雲資深技術專家張振祥介紹他們對於FPGA的應用,以及所維運的FaaS(FPGA as a Service)舜天平臺,而其中的執行個體F2和F3,是採用賽靈思的FPGA加速運算技術,分別於2017年10月和2018年推出。

2018年11月舉行的美國超級電腦大會期間,賽靈思宣布,Dell EMC是第一家通過Alveo U200使用認證的伺服器廠商,有5款機型可搭配這張FPGA加速卡(例如,畫面當中的PowerEdge R740)

產品資訊

Xilinx Alveo系列
●原廠:Xilinx(02)8177-7800
●建議售價:廠商未提供
●機型:U200、U250、U280
●外型:主動散熱版為全高、全長PCIe介面卡,被動散熱版為全高、3/4長PCIe介面卡
●I/O介面:PCIe 3.0 x16(U280為PCIe 3.0 x8 w/ CCIX)
●搭配記憶體容量:64GB DDR4、32GB DDR4+8GB HBM2(U280)
●傳輸介面:2個QSFP28埠
●耗電量:100瓦到225瓦

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】

熱門新聞

Advertisement