偉薩在Computex活動中展出大數據處理專用的FPGA加速晶片。

圖片來源: 

攝影/翁芊儒

「就像GPU常用來加速影像辨識模型的運算,我們的加速卡是用來加速大數據資料的分析。」偉薩科技(WASAI)共同創辦人暨執行長張智淳表示。這家專攻特定大數據應用的國產晶片公司,試圖在GPU當道的AI和分析應用市場中,走出另一條特定領域應用的加速卡利基市場。

不同於多數CNN模型是大量運用矩陣乘法來運算,大數據分析則是一連串搜尋、排列、比對資料的過程,偉薩先自行研發了一套軟體加速引擎,再將加速引擎的技術透過Intel的FPGA平臺開發成專用晶片,並與多家伺服器廠商合作,推出巨量資料分析的軟硬體整合專用伺服器。主要可用來加速Hadoop MapReduce、Hive和Spark三類常見的大數據分析平臺,來處理網站Log記錄、感測器資訊、基因序列等非結構性資料,張智淳宣稱,相較於只靠CPU來計算,專用加速晶片可以提高3~6倍的運算效能,相同時間內可以執行更多次分析任務。

不過,偉薩的加速卡無法安裝於一般標準的商用伺服器上,企業也無法單買加速卡,而是得整套改換成偉薩的巨量資料分析專用伺服器,在計價方式,企業除了硬體費用外,從第二年起得支付一筆軟體授權年費,才能使用加速功能,否則機臺就只能執行一般的運算。

偉薩的巨量資料加速引擎又可以分為基因定序加速(DNA sequence),以及使用Spark/Hadoop框架做大數據分析的加速。

「基因定序」加速引擎使用了次世代定序的技術(Next Generation Sequencing , NGS),將DNA長鏈上所有ATCG的組成順序解構出來,藉此發現變異基因,來找到遺傳性疾病、分析癌症,來達到精準醫療的目的。張智淳表示,ATCG每個字母在基因演算法中有特殊意義,需要將原先雜亂無章的序列排列、比對、分析,進而重新定序,「本來一個人的基因資料可能超過100G,跑一個基因定序的流程要花30多個小時,但使用專用加速卡可以縮短到5個小時。」

除了用硬體加速分析,偉薩加速引擎也針對次世代基因定序分析的常用開源軟體BWA、GATK進行了優化,可讓這些軟體呼叫偉薩的加速晶片。

而使用Spark/Hadoop框架做大數據分析的加速,則是可以應用在車聯網、互聯網、電信資料的分析。張智淳舉例,車子上面有很多感應器,可以感應距離或車子本身健康狀況,包含胎壓、引擎與各式零件,蒐集足夠量的資料之後就能做統計分析,隨時幫車子健檢,來降低車子半路拋錨的機率,這同時也是目前在合作的案例,偉薩也同樣有針對Spark、Hadoop兩個開源軟體來優化。

儘管,得採用偉薩專用軟硬體才能加速,但所開發的Hadoop和Spark程式,仍可複製到其他地方或雲端來執行。

此外,張智淳也表示,兩年前偉薩就開始與Intel合作,使用FPGA平臺設計晶片,並與Intel的CPU共同販售,「目前合作的方式,是Intel販售CPU加上FPGA晶片,譬如說他的CPU加上我們的基因定序加速卡,就變成基因定序的Total Solution。」至於為何與Intel合作,除了使用FPGA平臺來設計晶片能少量生產、降低成本,也是因為Intel是CPU大廠,合作可帶來更多拓銷機會。

目前, 偉薩在基因定序領域的合作夥伴包括研華科技,以及宏碁伺服器團隊成立的公司安圖斯(ALTOS),在客戶部分,也持續與美國、日本的國家型研究計畫洽談合作,而臺灣的國網中心(TWCC)也有導入基因定序加速解決方案,提供研究單位測試使用;在大數據分析的領域,則是有互聯網、車聯網的合作案例,以及正在洽談中的電信資料分析,但詳細進程仍未能揭露。


Advertisement

更多 iThome相關內容