Nvidia揭露醫療AI新進展,包括全球最大自然語言生成模型SynGatorTron、新一代邊緣運算平臺HoloscanMGX,以及拿下世界紀錄的超快速第三代基因定序平臺UNAP。

圖片來源: 

螢幕截圖

Nvidia本月21日展開年度技術大會GTC,一口氣揭露不少醫療AI新進展,包括全球最大、擁有50億參數的臨床語料生成模型SynGatorTron,以及現有產品線中新推出的新一代醫療級邊緣運算AI平臺Clara Holoscan MGX,還有能快速進行第三代奈米孔基因定序分析的工作流程框架UNAP。其中,與Nvidia新藥開發模型一樣,語料生成模型也以Transformer架構為基礎,Nvidia更聯手英國的Cambridge-1超級電腦來訓練。

既有Clara生態系打下醫療AI開發基礎

Nvidia醫療AI發展,還有賴於Clara解決方案生態系。Nvidia Clara非常完整,涵蓋了一系列AI預訓練模型、AI模型訓練、應用程式和AI邊緣運算平臺相關的軟硬體服務,比如,在AI模型訓練部分,就有一套開源的AI開發框架Monai,它有自動標註工具來協助開發者圈出病灶,還有AutoML工具來自動化模型挑選、調參等工作,另也有自監督學習機制,可利用非標註資料來訓練模型,縮短標註時間成本。此外,Clara在AI模型訓練部分,還有一個Nvidia Flare的聯合學習(FL)框架,來讓醫院在共享模型而非資料的條件下,一起訓練AI模型。

又比如,在AI預訓練模型部分,則有40多種預訓練模型供開發者取用,不論是醫學系影像類、新藥發現、自然語言,還是手勢辨識等電腦視覺模型都包含在內,如MegaMolBART就是基於Transformer的大型新藥發現模型,可生成前所未見的分子。

在AI邊緣運算平臺部分,則有Nvidia Clara Holoscan邊緣運算開發框架,可介接醫療設備,將其產出的數據用來進行AI模型開發、訓練和部署等完整流程。除了Holoscan,Nvidia Clara還有多種醫學領域解決方案,像是基礎的開發套件、新藥發現、基因體定序分析等。

全球最大臨床語料生成模型,可產出逼真臨床紀錄資料

在這些基礎下,Nvidia亮相最新自然語言生成(NLG)模型SynGatorTron,可生成逼真的臨床語料。該模型是Nvidia與弗羅里達大學的健康研究中心UF Health共同開發,由累積10多年的200萬名病患資料訓練而成,參數量達到50億,是臨床語料領域中最大的NLG模型。

佛羅里達大學研究院Duane Mitchell表示,SynGatorTron可產出近似真實醫療紀錄的病人資料,比如能產出糖尿病患者的電子病歷,與實際患者相差無幾。

這也代表,研究人員可利用這套模型,產出合成資料,用來訓練其他AI模型。Nvidia解釋,由於醫療資料屬高度隱私,不容易取得,因此,合成近似資料不只能避免隱私問題,也能增加訓練資料量。

新一代醫療級邊緣運算平臺,即時處理醫療儀器數據

Nvidia推出新一代醫療級邊緣運算平臺Nvidia Clara Holoscan MGX,是原Clara Holoscan產品線的延伸。進一步來說,這個新產品整合了Nvidia工業級運算模組Jetson AGX Orin、Nvidia RTX A6000 GPU和Nvidia ConnectX-7 SmartNIC網路卡,成為一個可擴充的AI平臺,可用來串接多種醫療儀器,進行模型即時推論,效能可達每秒254至619兆次。

與Holoscan最大的不同是,Holoscan MGX專為醫療級設備所設計,符合IEC 60601和62304產業級安全規格,整合最新的嵌入式裝置安全功能和安全模組,像是監控關鍵操作的控制器、遠端軟體更新和系統恢復功能,以及嵌入式裝置安全功能的硬體信任根。

對醫療設備廠商來說,他們可直接嵌入Clara Holoscan MGX,或連接到既有設備的安裝基礎,來加速AI部署。與之搭配的Clara Holoscan SDK,是為高效能串流應用程式設計,開發者可用來打造新一代軟體定義醫療儀器。在這個SDK裡,包含了預訓練模型和可擴充的微服務框架,可在邊緣裝置或邊緣資料中心管理、部署應用程式。這個Holoscan MGX平臺預計於2023年第一季上市。

聯手各大好手,打造全球最快第三代基因定序AI平臺

在基因定序部分,Nvidia聯手史丹佛大學、Google和牛津奈米孔科技公司(ONT)開發一款第三代基因定序AI工作流程工具UNAP,以容器形式在Nvidia雲端平臺NGC執行,只需一個AI主機Nvidia DGX A100節點即可,大大簡化基因定序所需的運算基礎架構。

Nvidia指出,這個平臺在今年1月打破世界紀錄,將一個樣本的第三代基因定序時間縮短為7小時18分鐘,是之前最快紀錄14小時的一半,寫下金氏世界紀錄。

之後,Nvidia Clara團隊繼續以DGX-A100來優化這個基因分析工作流程,只需1個伺服器(含8張A100 GPU)就能在4小時10分鐘內完成全基因體分析。這個做法,也降低每位病人的運算成本,從568美元降為183美元,Nvidia強調,UNAP更重要的意義是,讓臨床醫師和研究員不必求助他人,即可在單位內用這套平臺來分析基因數據。

熱門新聞

Advertisement