臺灣人工智慧實驗室(AI Labs)在2020年初,以聯合學習方法與臺大醫院、健保署一同開發SARS-CoV-2檢測模型平臺,用來偵測肺炎病灶。這套模型不只部署在健保署和5家醫學中心,更開源給全球醫療專家使用,是臺灣第一套開源的聯合學習模型。圖片來源/臺灣人工智慧實驗室

對臺灣醫療界來說,剛結束的2020年是特別的一年。2020年初,COVID-19疫情爆發,臺灣人工智慧實驗室(AI Labs)聯手臺大醫院、健保署、疾管署,以聯合學習(Federated Learning)開發肺炎病癥檢測模型,隨後,臺北榮總也發表了以國產AI超級電腦驗證聯合學習可行性的成果,更成立全腦聯盟,聯手數家醫學中心進行腦部聯合學習專案。此後,即便歷經疫情間各行業的沈寂,聯合學習趨勢不減反增,還實現更多里程碑,「從此開啟臺灣聯合學習的時代,」AI Labs創辦人杜奕瑾直言。

聯合學習解決醫療AI小數據瓶頸

AI是場資料競賽,資料量越大、種類越多,AI的預測能力越好。但對醫療來說,先天的高度資料隱私特性,導致訓練資料取得不易。在小數據的限制下,醫院要開發夠強夠準確的AI,可謂難上加難。

因此近年來,國際興起一種分散式機器學習方法──聯合學習。它的核心概念是,以模型共享取代資料共享,在顧及資料隱私的前提下,解決訓練資料不足的問題。它的機制是,分散各地的端點將各自的模型參數,上傳至中央伺服器,再透過伺服器聚合(Aggregate)這些模型參數,經優化後再回放到各端點,進行下一輪模型訓練,不斷重複直到模型收斂。如此,各端點不必貢獻資料,也能享有集中式機器學習的效果。

這個源自Google為了訓練手機鍵盤App的作法,立刻引起苦於個資隱私瓶頸的金融圈、醫療界的重視,比如,微眾銀行發起一個跨國合作的聯合學習框架,要來打造信用卡防詐欺模型,或是英特爾聯手賓州大學醫學院,與29家跨國醫療機構開發腦瘤偵測AI演算法,又或是Nvidia攜手全球20家醫療機構,以聯合學習打造COVID-19肺炎病情惡化預警模型。

在屈指可數的聯合學習框架上,還出現了專門用於醫療的聯合學習框架Nvidia Clara以及國產的Harmonia,使醫療業在聯合學習發展上,成了領頭產業代表。

AI Labs助力、北榮驗證,揭開臺灣醫療聯合學習序幕

臺灣在2020年也跟上了這股醫療聯合學習的新浪潮。國際疫情急劇升溫時,催生了臺灣第一套開放全球使用的醫療聯合學習模型。當時,AI Labs聯手臺大醫院和健保署,以自家醫療影像平臺TAIMedimg的聯合學習架構,開發出SARS-CoV-2檢測模型平臺,用來偵測肺炎病灶。這套模型能在無症狀疑似個案的核酸檢驗報告出來前幾天,協助醫生從X光片判斷肺炎病癥,只要20秒就能完成,準確率達90%以上。

當時,行政院還主導將這套AI模型部署至健保署,只要醫院上傳胸部X光片,就會啟動模型檢測,如呈高風險,便會自動通報疾管署。這不僅是臺灣第一個獲政府採用的聯合學習模型,還是第一套開放給全球醫學專家使用的聯合學習模型。

同樣在2020年初,也出現了臺灣醫院自主發起的聯合學習應用試驗性研究,掀起醫院主導聯合學習的開端。這場試驗發起人為開發腦瘤偵測AI DeepMets的關鍵人物,也就是臺北榮總放射線部主任郭萬祐。他找來擅長AI研究的瑞典查爾摩斯理工大學交換生Lukas Nyström,利用國網中心臺灣杉二號的雲端虛擬環境,建置5個代表不同醫院的節點(Node),來測試聯合學習訓練方法。

在這場試驗後,他也啟動全腦聯盟,聯手臺大醫院、三軍總醫院、林口長庚醫院等醫學中心,來進行腦部聯合學習專案。至此,臺灣聯合學習時代在醫療業揭開序幕。

臺灣也有自產聯合學習開源框架,本土聯合學習力量漸強

緊接著,7月,AI Labs開源了自家聯合學習框架Harmonia,開放Harmonia-operator SDK和差分隱私(Differential Privacy)函式庫下載。AI Labs開源Harmonia的目的,是要讓聯合學習「Made easy」,讓使用者輕鬆訓練、部署聯合學習模型。

此前,臺灣一直是聯合學習後進者,沒有太多技術掌控力和話語權。但Harmonia的開源,讓這一情況有了新的轉變。一般常見的聯合學習框架有Google的Tensorflow Federated、OpenMined的PySyft、Nvidia的Clara、百度的Paddle Federated Learning(PFL),以及中國純網銀微眾銀行的FATE,但前兩者只限於模擬,無法用來部署。

而Harmonia的加入,不僅讓聯合學習工具的選擇更多元,還可實際部署,提高實用性。它採用工程師熟悉的環境和語言,如熱門的開源工具Kubernetes、Git Large File Storage和GitOps等。此外,Harmonia也具差分隱私函式庫,專門用來防止有心人竊取模型參數,從中推導出特定個資。

臺灣聯合學習醫療聯盟成立,生態系儼然成形

11月,臺灣醫療聯合學習迎來值得紀念的里程碑。當時,AI Labs號召六大指標醫院和政府機關,包括臺大醫院、三軍總醫院、臺北榮總、北醫附醫、臺北慈濟醫院、中國附醫,以及掌握健保大數據的健保署、負責制定醫材法規的食藥署,還有推動醫療AI政策的科技部和國發會,來共同成立臺灣聯合學習醫療聯盟。

聯盟的運作,會由各領域專家提出聯合學習協定,先行訓練出一套聯合學習樣板AI模型後,再邀請有意願的醫療單位加入,以各自的資料在端點訓練模型。聯盟一成立,便獲得不少醫院詢問,關鍵推手杜奕瑾舉例,不只臺灣各地醫學中心表明入盟意願,就連規模較小的區域醫院和地區醫院,也對入會有著濃厚興趣。目前,聯盟進行的聯合學習題目,已涵蓋醫療影像、醫療數據、多組位基因、個人生理資料等領域。

杜奕瑾指明,聯盟目標不只要提供醫院建置聯合學習系統的資源,還要以臺灣為示範場域建立平臺機制,來降低入門門檻。重要的是,聯盟還將提供聯合學習臨床驗證成果與相關法規認證的介接資源。

不只如此,臺灣聯合學習經驗在2020年也獲得不少國際注目。比如,由OECD國家倡議成立的國際指標性AI組織人工智慧全球夥伴聯盟(GPAI),就邀請臺灣分享醫療防疫聯合學與資料治理經驗,作為AI發展所需解決的跨機構資料共享難題參考。此外,多個國家也找上AI Labs,來簽訂聯合學習專案協議,像是全球基因組學與健康聯盟(GA4GH)。

東風已來,臺灣醫療FL模式成產業AI協力示範

至此,臺灣醫療聯合學習發展走過試驗落地、開發工具自產、產官聯盟正式成立的階段,加乘了國內醫療聯合學習的發展能量,生態系儼然成形。

更大的意義是,這一套聯合學習框架、工具和實務發展經驗,不只適用於醫療產業,只要有小數據或資料隱私考量,又需要大數據來訓練AI模型的場景,也可以借鏡醫界結盟的作法和經驗,來發展出其他產業或集團式的聯合學習實踐,甚至是用來嘗試更多過去受限資料不足無法展開的AI應用創新。杜奕瑾更透露,AI Labs正將醫療聯合學習模式,推廣到智慧城市和人機應用領域,將陸續提出相關計畫。

聯合學習東風已來,先行乘風起飛的臺灣醫療業,成為AI協力開發的產業代表,可以成為其他產業發展AI小數據的參考範例。

熱門新聞

Advertisement