NIH神經異常暨中風研究中心(NINDS) 資訊科技與生物資訊部門主任范揚政指出,在打造醫療AI時,不只要加強影像標註的細緻程度,在清理資料階段時,也要進行臨床驗證,才能提高模型辨識準確度。

圖片來源: 

攝影/王若樸

負責建置美國國衛院主要IT系統和大型資料庫的NIH神經異常暨中風研究中心(NINDS) 資訊科技與生物資訊部門主任范揚政指出,美國去年啟動醫療AI資料庫建置計畫,其中包括了與臺灣合作的全球腦中風影像資料庫(GSDR),要透過不同國家的腦中風資料集,來打造腦中風AI工具,提高急診準確率。范揚政表示,就美國來說,中風(腦出血)是第三大死因,在臺灣則是第四大死因,而且中風會造成個人長期、嚴重的失能,對社會和經濟都有重大影響。

要改善這個問題,就得把握中風發生後的黃金3小時,只要及時正確診斷、對症下藥,就能大幅降低中風後遺症的風險。全球腦中風影像資料庫計畫就決定從這部分下手,先建置一套標註過的腦出血電腦斷層掃描(CT)和核磁共振影像(MRI),再來打造一套腦中風AI輔助判讀工具,來縮短人工判讀流程。

進一步來說,GSDR鎖定腦中風發生後的三階段,分別是急性腦出血的辨識和分類、臨床診斷的決策支援,以及康復情況的預測(也就是中風嚴重程度的MRS評分)。在辨識階段,NIH的AI工具會先前處理腦中風影像,再來判斷是否為缺血性或出血性腦中風。如果是缺血性,則會進行影像的語義分割,來預測缺血性中風初期會影響的腦部區域,並產生一份報告給放射科醫師(如下圖)。范揚政強調,要提升腦中風AI工具的附加價值,得從影像標註的類別下手。而在資料清理階段的臨床驗證(Clinical Validation),則是提升AI模型準確度的關鍵。

他接著舉例,腦中風AI在判讀影像時,除了要辨識出血性或缺血性腦出血外,還要顧及可能受影響的腦部區域,比如語言、動作區,如此才能「提供醫師後續治療和開藥的決策。」因此在標註資料時,也應考量這些功能,來提高AI工具的附加價值。

此外,他也提醒,在建置腦中風AI工具時,資料清理階段的臨床驗證非常重要,因為這是提高準確度的關鍵。他表示,許多團隊在資料清理階段時,多半只注重欄位缺失值或不合常理的輸入值,比如BMI 500。「但是,臨床驗證必須把關,」也就是要注意醫療診斷報告是否出現矛盾,比如判斷中風患者中高度失能,但卻註明能上、下樓梯,「這就前後矛盾了。」(如下圖)

他也指出,經實際測驗,利用臨床驗證的資料集訓練的中風嚴重程度AI模型,其準確度可高達96%至99%,而未經過臨床驗證的資料集打造的AI模型,準確度只達80%。(如下圖)

目前,這套資料庫有3大資料集,其中2個來自NINDS,約有6萬1千筆腦中風影像資料。另一個資料集則來自臺灣的貢獻,收集了臺灣中風登錄(TSR)中14萬筆資料,范揚政指出,今年將與更多單位合作來擴增資料集,如美國醫療保險服務中心CMS和英國政府,預估未來2、3年後,總資料量將超過100萬筆。

今年5月時,中研院也聯合交大、陽明,共同成立數位醫學聯盟要打造腦中風資料集,來開發國產AI工具。這個聯盟也與NIH合作取得他們的腦中風分析資料,甚至是日本、歐洲的資料,來打造因地制宜的腦中風AI模型。文◎王若樸

 
 
 
 


Advertisement

更多 iThome相關內容