美國國衛院建立國家級醫療AI資料庫，未來資料將完全共享

負責建置美國國衛院（NIH）IT系統和大型資料庫的主任范揚政表示，目前NIH正建置國家級醫療AI資料庫，透過去識別化，未來將全數資料共享。

圖片來源:

攝影／王若樸

隨著醫療AI興起，近年來，不少國家開始建置國家級醫療AI資料庫，臺灣科技部也在2017年時，先鎖定影像，發起巨量醫療影像資料庫計畫，要建造屬於國人的AI醫療影像資料庫。

而美國則不限定影像領域，「在去年啟動了醫療AI資料庫計畫，」美國國家衛生研究院（NIH）神經異常暨中風研究中心（NINDS）資訊科技與生物資訊部門主任范揚政說道。他在美國國衛院任職近20年，建置過不少主要IT系統和大型生醫資料庫，像是可預測蛋白質交互作用的資料庫IBIS、生醫轉譯研究資訊系統（BTRIS）、生醫研究訊息運算系統（BRICS）等，近來更專注於醫療AI資料庫的建置。

他指出，2018年時，美國國衛院與Google、微軟、麻省理工學院等在醫療AI領先的團隊，共同討論未來方向，一致認為唯有NIH建置AI-ready的資料庫，醫療AI才能大幅進步。

FHIR和FAIR是美國國衛院醫療AI資料庫的2大準則，首重資料可取性和共享性

於是，NIH訂定了幾個大方向，並啟動了醫療AI資料庫的建置計畫。首先，醫療AI資料庫的目標有兩個，第一是要創建、管理可用於AI生醫應用的資料集，而且這些資料集要可用、有代表性且合乎倫理；第二則是要共享和維護這些資料集。

要達到這兩個目標，「FHIR和FAIR就是2大準則。」其中，FHIR指的是一套資料標準，能用來描述資料格式（Data format）和元素（Element），此外，它也指用來交換電子病歷或生醫研究資料集的應用程式介面（API）。FHIR旨在強化醫療資訊的流通，不僅能讓醫療訊息用於多種裝置，比如電腦、手機、平板，還可提供資訊給第三方服務開發者，有助於醫療資訊的互通。

對NIH來說，FHIR還包括一個關鍵，也就是數位物件識別碼（DOI）。DOI就像參考文獻的身分證號碼，具永久且唯一的特質，不必擔心連結失效問題，因此可幫助研究人員快速找到資料庫中的特定數據，是進行整合分析（Meta Study）的利器，「這也是NIH這1、2年建置資料庫的重點。」

再來則是FAIR，也就是資料共享的原則，包括了可搜尋（Findable）、可取得（Accessible）、可交互使用（Interoperable）、可重複使用（Reusable）等特點。范揚政指出，FAIR原則是要確保研究員能儲存、使用和分享NIH產出的資料與軟體，來加速創新技術的研發。

在這個基礎上，他表示，未來NIH醫療AI資料庫建置完成後，將提供完全開放的資料共享（Data Commons）服務，「這也是NIH未來5至10年的AI資料庫走向，」就如同其他100多個已開放的研究資料庫一樣。

然而，資料開放難免引起個資隱私爭議。范揚政解釋，美國國衛院遵照新一套資料共享規則（Common Rules），除特殊疾病如精神疾病、愛滋病等之外，其他臨床實驗資料只要經去識別化，即可公開共享。這套規則，也適用於過往研究成果，也就是說，過往研究要是含有病人資料、且無法再次聯絡上病人時，只要將其資料去識別化即可釋出。

有別於美國做法，科技部前瞻司則指出，臺灣醫療影像AI資料庫是透過臺大、北醫、臺北榮總團隊來標記院內資料，資料庫未來完成後將置於國網中心平臺，但考量資料來源為病人病歷，資料庫將只限於學研團隊申請使用，來開發AI模型。文◎王若樸

熱門新聞