Nvidia揭露3大醫療AI新進展，發布全球最大臨床語料生成模型可產出逼真病歷

Nvidia揭露醫療AI新進展，包括全球最大自然語言生成模型SynGatorTron、新一代邊緣運算平臺HoloscanMGX，以及拿下世界紀錄的超快速第三代基因定序平臺UNAP。

圖片來源:

螢幕截圖

Nvidia本月21日展開年度技術大會GTC，一口氣揭露不少醫療AI新進展，包括全球最大、擁有50億參數的臨床語料生成模型SynGatorTron，以及現有產品線中新推出的新一代醫療級邊緣運算AI平臺Clara Holoscan MGX，還有能快速進行第三代奈米孔基因定序分析的工作流程框架UNAP。其中，與Nvidia新藥開發模型一樣，語料生成模型也以Transformer架構為基礎，Nvidia更聯手英國的Cambridge-1超級電腦來訓練。

既有Clara生態系打下醫療AI開發基礎

Nvidia醫療AI發展，還有賴於Clara解決方案生態系。Nvidia Clara非常完整，涵蓋了一系列AI預訓練模型、AI模型訓練、應用程式和AI邊緣運算平臺相關的軟硬體服務，比如，在AI模型訓練部分，就有一套開源的AI開發框架Monai，它有自動標註工具來協助開發者圈出病灶，還有AutoML工具來自動化模型挑選、調參等工作，另也有自監督學習機制，可利用非標註資料來訓練模型，縮短標註時間成本。此外，Clara在AI模型訓練部分，還有一個Nvidia Flare的聯合學習（FL）框架，來讓醫院在共享模型而非資料的條件下，一起訓練AI模型。

又比如，在AI預訓練模型部分，則有40多種預訓練模型供開發者取用，不論是醫學系影像類、新藥發現、自然語言，還是手勢辨識等電腦視覺模型都包含在內，如MegaMolBART就是基於Transformer的大型新藥發現模型，可生成前所未見的分子。

在AI邊緣運算平臺部分，則有Nvidia Clara Holoscan邊緣運算開發框架，可介接醫療設備，將其產出的數據用來進行AI模型開發、訓練和部署等完整流程。除了Holoscan，Nvidia Clara還有多種醫學領域解決方案，像是基礎的開發套件、新藥發現、基因體定序分析等。

全球最大臨床語料生成模型，可產出逼真臨床紀錄資料

在這些基礎下，Nvidia亮相最新自然語言生成（NLG）模型SynGatorTron，可生成逼真的臨床語料。該模型是Nvidia與弗羅里達大學的健康研究中心UF Health共同開發，由累積10多年的200萬名病患資料訓練而成，參數量達到50億，是臨床語料領域中最大的NLG模型。

佛羅里達大學研究院Duane Mitchell表示，SynGatorTron可產出近似真實醫療紀錄的病人資料，比如能產出糖尿病患者的電子病歷，與實際患者相差無幾。

這也代表，研究人員可利用這套模型，產出合成資料，用來訓練其他AI模型。Nvidia解釋，由於醫療資料屬高度隱私，不容易取得，因此，合成近似資料不只能避免隱私問題，也能增加訓練資料量。

新一代醫療級邊緣運算平臺，即時處理醫療儀器數據

Nvidia推出新一代醫療級邊緣運算平臺Nvidia Clara Holoscan MGX，是原Clara Holoscan產品線的延伸。進一步來說，這個新產品整合了Nvidia工業級運算模組Jetson AGX Orin、Nvidia RTX A6000 GPU和Nvidia ConnectX-7 SmartNIC網路卡，成為一個可擴充的AI平臺，可用來串接多種醫療儀器，進行模型即時推論，效能可達每秒254至619兆次。

與Holoscan最大的不同是，Holoscan MGX專為醫療級設備所設計，符合IEC 60601和62304產業級安全規格，整合最新的嵌入式裝置安全功能和安全模組，像是監控關鍵操作的控制器、遠端軟體更新和系統恢復功能，以及嵌入式裝置安全功能的硬體信任根。

對醫療設備廠商來說，他們可直接嵌入Clara Holoscan MGX，或連接到既有設備的安裝基礎，來加速AI部署。與之搭配的Clara Holoscan SDK，是為高效能串流應用程式設計，開發者可用來打造新一代軟體定義醫療儀器。在這個SDK裡，包含了預訓練模型和可擴充的微服務框架，可在邊緣裝置或邊緣資料中心管理、部署應用程式。這個Holoscan MGX平臺預計於2023年第一季上市。

聯手各大好手，打造全球最快第三代基因定序AI平臺

在基因定序部分，Nvidia聯手史丹佛大學、Google和牛津奈米孔科技公司（ONT）開發一款第三代基因定序AI工作流程工具UNAP，以容器形式在Nvidia雲端平臺NGC執行，只需一個AI主機Nvidia DGX A100節點即可，大大簡化基因定序所需的運算基礎架構。

Nvidia指出，這個平臺在今年1月打破世界紀錄，將一個樣本的第三代基因定序時間縮短為7小時18分鐘，是之前最快紀錄14小時的一半，寫下金氏世界紀錄。

之後，Nvidia Clara團隊繼續以DGX-A100來優化這個基因分析工作流程，只需1個伺服器（含8張A100 GPU）就能在4小時10分鐘內完成全基因體分析。這個做法，也降低每位病人的運算成本，從568美元降為183美元，Nvidia強調，UNAP更重要的意義是，讓臨床醫師和研究員不必求助他人，即可在單位內用這套平臺來分析基因數據。

熱門新聞