2021加速轉型9大趨勢（七）醫療業走出聯合學習跨業結盟新模式，更成其他產業AI協力典範

臺灣人工智慧實驗室（AI Labs）在2020年初，以聯合學習方法與臺大醫院、健保署一同開發SARS-CoV-2檢測模型平臺，用來偵測肺炎病灶。這套模型不只部署在健保署和5家醫學中心，更開源給全球醫療專家使用，是臺灣第一套開源的聯合學習模型。圖片來源／臺灣人工智慧實驗室

對臺灣醫療界來說，剛結束的2020年是特別的一年。2020年初，COVID-19疫情爆發，臺灣人工智慧實驗室（AI Labs）聯手臺大醫院、健保署、疾管署，以聯合學習（Federated Learning）開發肺炎病癥檢測模型，隨後，臺北榮總也發表了以國產AI超級電腦驗證聯合學習可行性的成果，更成立全腦聯盟，聯手數家醫學中心進行腦部聯合學習專案。此後，即便歷經疫情間各行業的沈寂，聯合學習趨勢不減反增，還實現更多里程碑，「從此開啟臺灣聯合學習的時代，」AI Labs創辦人杜奕瑾直言。

聯合學習解決醫療AI小數據瓶頸

AI是場資料競賽，資料量越大、種類越多，AI的預測能力越好。但對醫療來說，先天的高度資料隱私特性，導致訓練資料取得不易。在小數據的限制下，醫院要開發夠強夠準確的AI，可謂難上加難。

因此近年來，國際興起一種分散式機器學習方法──聯合學習。它的核心概念是，以模型共享取代資料共享，在顧及資料隱私的前提下，解決訓練資料不足的問題。它的機制是，分散各地的端點將各自的模型參數，上傳至中央伺服器，再透過伺服器聚合（Aggregate）這些模型參數，經優化後再回放到各端點，進行下一輪模型訓練，不斷重複直到模型收斂。如此，各端點不必貢獻資料，也能享有集中式機器學習的效果。

這個源自Google為了訓練手機鍵盤App的作法，立刻引起苦於個資隱私瓶頸的金融圈、醫療界的重視，比如，微眾銀行發起一個跨國合作的聯合學習框架，要來打造信用卡防詐欺模型，或是英特爾聯手賓州大學醫學院，與29家跨國醫療機構開發腦瘤偵測AI演算法，又或是Nvidia攜手全球20家醫療機構，以聯合學習打造COVID-19肺炎病情惡化預警模型。

在屈指可數的聯合學習框架上，還出現了專門用於醫療的聯合學習框架Nvidia Clara以及國產的Harmonia，使醫療業在聯合學習發展上，成了領頭產業代表。

AI Labs助力、北榮驗證，揭開臺灣醫療聯合學習序幕

臺灣在2020年也跟上了這股醫療聯合學習的新浪潮。國際疫情急劇升溫時，催生了臺灣第一套開放全球使用的醫療聯合學習模型。當時，AI Labs聯手臺大醫院和健保署，以自家醫療影像平臺TAIMedimg的聯合學習架構，開發出SARS-CoV-2檢測模型平臺，用來偵測肺炎病灶。這套模型能在無症狀疑似個案的核酸檢驗報告出來前幾天，協助醫生從X光片判斷肺炎病癥，只要20秒就能完成，準確率達90%以上。

當時，行政院還主導將這套AI模型部署至健保署，只要醫院上傳胸部X光片，就會啟動模型檢測，如呈高風險，便會自動通報疾管署。這不僅是臺灣第一個獲政府採用的聯合學習模型，還是第一套開放給全球醫學專家使用的聯合學習模型。

同樣在2020年初，也出現了臺灣醫院自主發起的聯合學習應用試驗性研究，掀起醫院主導聯合學習的開端。這場試驗發起人為開發腦瘤偵測AI DeepMets的關鍵人物，也就是臺北榮總放射線部主任郭萬祐。他找來擅長AI研究的瑞典查爾摩斯理工大學交換生Lukas Nyström，利用國網中心臺灣杉二號的雲端虛擬環境，建置5個代表不同醫院的節點（Node），來測試聯合學習訓練方法。

在這場試驗後，他也啟動全腦聯盟，聯手臺大醫院、三軍總醫院、林口長庚醫院等醫學中心，來進行腦部聯合學習專案。至此，臺灣聯合學習時代在醫療業揭開序幕。

臺灣也有自產聯合學習開源框架，本土聯合學習力量漸強

緊接著，7月，AI Labs開源了自家聯合學習框架Harmonia，開放Harmonia-operator SDK和差分隱私（Differential Privacy）函式庫下載。AI Labs開源Harmonia的目的，是要讓聯合學習「Made easy」，讓使用者輕鬆訓練、部署聯合學習模型。

此前，臺灣一直是聯合學習後進者，沒有太多技術掌控力和話語權。但Harmonia的開源，讓這一情況有了新的轉變。一般常見的聯合學習框架有Google的Tensorflow Federated、OpenMined的PySyft、Nvidia的Clara、百度的Paddle Federated Learning（PFL），以及中國純網銀微眾銀行的FATE，但前兩者只限於模擬，無法用來部署。

而Harmonia的加入，不僅讓聯合學習工具的選擇更多元，還可實際部署，提高實用性。它採用工程師熟悉的環境和語言，如熱門的開源工具Kubernetes、Git Large File Storage和GitOps等。此外，Harmonia也具差分隱私函式庫，專門用來防止有心人竊取模型參數，從中推導出特定個資。

臺灣聯合學習醫療聯盟成立，生態系儼然成形

11月，臺灣醫療聯合學習迎來值得紀念的里程碑。當時，AI Labs號召六大指標醫院和政府機關，包括臺大醫院、三軍總醫院、臺北榮總、北醫附醫、臺北慈濟醫院、中國附醫，以及掌握健保大數據的健保署、負責制定醫材法規的食藥署，還有推動醫療AI政策的科技部和國發會，來共同成立臺灣聯合學習醫療聯盟。

聯盟的運作，會由各領域專家提出聯合學習協定，先行訓練出一套聯合學習樣板AI模型後，再邀請有意願的醫療單位加入，以各自的資料在端點訓練模型。聯盟一成立，便獲得不少醫院詢問，關鍵推手杜奕瑾舉例，不只臺灣各地醫學中心表明入盟意願，就連規模較小的區域醫院和地區醫院，也對入會有著濃厚興趣。目前，聯盟進行的聯合學習題目，已涵蓋醫療影像、醫療數據、多組位基因、個人生理資料等領域。

杜奕瑾指明，聯盟目標不只要提供醫院建置聯合學習系統的資源，還要以臺灣為示範場域建立平臺機制，來降低入門門檻。重要的是，聯盟還將提供聯合學習臨床驗證成果與相關法規認證的介接資源。

不只如此，臺灣聯合學習經驗在2020年也獲得不少國際注目。比如，由OECD國家倡議成立的國際指標性AI組織人工智慧全球夥伴聯盟（GPAI），就邀請臺灣分享醫療防疫聯合學與資料治理經驗，作為AI發展所需解決的跨機構資料共享難題參考。此外，多個國家也找上AI Labs，來簽訂聯合學習專案協議，像是全球基因組學與健康聯盟（GA4GH）。

東風已來，臺灣醫療FL模式成產業AI協力示範

至此，臺灣醫療聯合學習發展走過試驗落地、開發工具自產、產官聯盟正式成立的階段，加乘了國內醫療聯合學習的發展能量，生態系儼然成形。

更大的意義是，這一套聯合學習框架、工具和實務發展經驗，不只適用於醫療產業，只要有小數據或資料隱私考量，又需要大數據來訓練AI模型的場景，也可以借鏡醫界結盟的作法和經驗，來發展出其他產業或集團式的聯合學習實踐，甚至是用來嘗試更多過去受限資料不足無法展開的AI應用創新。杜奕瑾更透露，AI Labs正將醫療聯合學習模式，推廣到智慧城市和人機應用領域，將陸續提出相關計畫。

聯合學習東風已來，先行乘風起飛的臺灣醫療業，成為AI協力開發的產業代表，可以成為其他產業發展AI小數據的參考範例。

熱門新聞