負責建置美國國衛院(NIH)IT系統和大型資料庫的主任范揚政表示,目前NIH正建置國家級醫療AI資料庫,透過去識別化,未來將全數資料共享。

圖片來源: 

攝影/王若樸

隨著醫療AI興起,近年來,不少國家開始建置國家級醫療AI資料庫,臺灣科技部也在2017年時,先鎖定影像,發起巨量醫療影像資料庫計畫,要建造屬於國人的AI醫療影像資料庫。

而美國則不限定影像領域,「在去年啟動了醫療AI資料庫計畫,」美國國家衛生研究院(NIH)神經異常暨中風研究中心(NINDS) 資訊科技與生物資訊部門主任范揚政說道。他在美國國衛院任職近20年,建置過不少主要IT系統和大型生醫資料庫,像是可預測蛋白質交互作用的資料庫IBIS、生醫轉譯研究資訊系統(BTRIS)、生醫研究訊息運算系統(BRICS)等,近來更專注於醫療AI資料庫的建置。

他指出,2018年時,美國國衛院與Google、微軟、麻省理工學院等在醫療AI領先的團隊,共同討論未來方向,一致認為唯有NIH建置AI-ready的資料庫,醫療AI才能大幅進步。

FHIR和FAIR是美國國衛院醫療AI資料庫的2大準則,首重資料可取性和共享性

於是,NIH訂定了幾個大方向,並啟動了醫療AI資料庫的建置計畫。首先,醫療AI資料庫的目標有兩個,第一是要創建、管理可用於AI生醫應用的資料集,而且這些資料集要可用、有代表性且合乎倫理;第二則是要共享和維護這些資料集。

要達到這兩個目標,「FHIR和FAIR就是2大準則。」其中,FHIR指的是一套資料標準,能用來描述資料格式(Data format)和元素(Element),此外,它也指用來交換電子病歷或生醫研究資料集的應用程式介面(API)。FHIR旨在強化醫療資訊的流通,不僅能讓醫療訊息用於多種裝置,比如電腦、手機、平板,還可提供資訊給第三方服務開發者,有助於醫療資訊的互通。

對NIH來說,FHIR還包括一個關鍵,也就是數位物件識別碼(DOI)。DOI就像參考文獻的身分證號碼,具永久且唯一的特質,不必擔心連結失效問題,因此可幫助研究人員快速找到資料庫中的特定數據,是進行整合分析(Meta Study)的利器,「這也是NIH這1、2年建置資料庫的重點。」

再來則是FAIR,也就是資料共享的原則,包括了可搜尋(Findable)、可取得(Accessible)、可交互使用(Interoperable)、可重複使用(Reusable)等特點。范揚政指出,FAIR原則是要確保研究員能儲存、使用和分享NIH產出的資料與軟體,來加速創新技術的研發。

在這個基礎上,他表示,未來NIH醫療AI資料庫建置完成後,將提供完全開放的資料共享(Data Commons)服務,「這也是NIH未來5至10年的AI資料庫走向,」就如同其他100多個已開放的研究資料庫一樣。

然而,資料開放難免引起個資隱私爭議。范揚政解釋,美國國衛院遵照新一套資料共享規則(Common Rules),除特殊疾病如精神疾病、愛滋病等之外,其他臨床實驗資料只要經去識別化,即可公開共享。這套規則,也適用於過往研究成果,也就是說,過往研究要是含有病人資料、且無法再次聯絡上病人時,只要將其資料去識別化即可釋出。

有別於美國做法,科技部前瞻司則指出,臺灣醫療影像AI資料庫是透過臺大、北醫、臺北榮總團隊來標記院內資料,資料庫未來完成後將置於國網中心平臺,但考量資料來源為病人病歷,資料庫將只限於學研團隊申請使用,來開發AI模型。文◎王若樸


Advertisement

更多 iThome相關內容