HTC健康醫療事業部總經理張智威,就算是只有小量真實數據的醫療解讀難題,藉助遷移學習,也能訓練出高準確率的預測模型(攝影/何維涓)。

「臺灣的優勢是醫療,但是最後的關鍵還是需要數據!」HTC健康醫療事業部總經理張智威直言,沒有數據,做不出AI的預測系統。

這位在人工智慧的領域已經投入多年的專家,早從2006年就加入Google研究院,甚至後來還成為了Google中國研究院院長,直到5、6年,張智威低調回來臺灣,一頭栽進了臺灣醫療領域的AI應用研發。

類神經網路早在1980年代就誕生了,10年前就有一篇MoGo的論文,預測有一天電腦下圍棋會贏過人類,果真AlphaGo在今年初打敗人類世界的圍棋冠軍,他認為,資料量的規模和運算能力的成長,是AI近來興起的關鍵。

不過,雲端計算的能力在2008年就已經商業化,大數據也在2006年就開始興起,像是Google好幾年前就擁有龐大的數據庫,成為世界第一大的搜尋引擎,但是當時Google為何沒有用AI?他的答案是:「當時並沒有用AI的急迫性!」

當時Google搜尋引擎的網頁評分系統和廣告推薦都並不需要用AI,就能提供給使用者的準確的結果,再加上,其實搜尋的結果和廣告推薦都沒有真實的數值(Ground Truth),因此,就連Google擁有豐富的數據和運算能力,也沒有採用深度學習的模型。

直到現在,AI技術更為成熟了,他秀出一張實測結果,5種不同的演算法,針對不同資料量來訓練時,數據越多,演算法的準確率就越高。他表示,如果數據夠多,就可以選擇運算成本較便宜的演算法,但若是數據不夠多,不管是多厲害的演算法,效果都不彰。「大量資料是必要的,沒有資料就沒辦法做AI!」張智威直言,AI系統的準確度,仰賴訓練的資料量。

也因此,他看上擁有龐大健保資訊的臺灣醫療產業應用。尤其,他認為,醫療診斷需要更好的典範轉移,以他自己過去心臟問題的看診經驗來說,打從他發現心臟不適後,到醫院掛號等待,終於輪到自己看診時,醫生卻只有5分鐘時間可以看診,就算是在這5分鐘的時間內,醫生也無法確診,還要安排更多檢驗,檢驗完畢後再回來看診,醫生才能確診後,開藥給病患回家吃,來來回回就耗費了好幾天,如果下次又感受到身體不適,又得重複一樣的流程,他認為,醫療診療,可以發展出更有效率的流程。

從被動應對式看診,轉為主動、預測式看診

他的目標,是將現有這種被動應對式(Reactive)的看診流程(病人先就醫,醫生才能看診),轉變成主動出擊(Proactive),甚至是預測式(Preventive)的看診模式,甚至還可以從集中式(必須到醫院看診),進一步發展成可以分散式進行的就診流程。

他解釋,應該要有一套設備,平時能用來追蹤病患的健康狀態,將這些每日身體資料儲存在雲端,一旦雲端的健康系統發現病患身體狀況可能有問題時,可以主動發送警告通知病患,建議病患到醫院檢查,而醫生也因為能事先取得足夠多的數據,更容易確診,更快治療病患的問題,病患的身體狀況也能得到更好的照顧。

而且,一旦許多病患原本只能到醫院才能收集的資訊,可以在平時就完成。他指出,未來醫院不再需要集中在城市的某些地方,而是一個分散的系統,分散在一個地區的各地,讓民眾到達醫療機構變得方便,而醫院不再需要非常完整且精密的醫療儀器,而是一個病人與醫生的互動場所。

因此,張智威率領了HTC研究與健康醫療部門,想要開發出一套醫療診斷檢測設備稱為DeepQ,這套設備希望可以做到驗血驗尿診斷、呼吸診斷、光學診斷、生命特徵診斷,以及問診。

除了整合各種檢驗技術,提供如驗血驗尿診斷、呼吸診斷、生命特徵診斷(心律不整、高血壓等)。張智威還希望,可以在這套設備中提供光學診斷能力,利用電腦視覺技術,讓電腦也能偵測中耳炎和黑色素瘤等。

還有一個DeepQ希望提供的功能是實現醫生的問診機制。張智威指出,醫生問診的目的是,縮減病患需要做的檢查,以及發現潛在症狀的可能性,透過最少的問題,來定義出最準確的診斷猜測,現在已經有些網站提供病患自行搜尋症狀,系統經過分析後再給予使用者可能疾病結果,但是,他表示,這樣的使用者體驗不夠友善。

張智威想將AlphaGo成功運用AI技術的經驗,運用到這套醫療診斷系統上。他的構想是,透過增強學習,讓代理人(Agent)詢問病患病症,根據病患回覆的病症給予病患預測的狀態,並用報酬的機制,答對給予獎勵,判斷錯誤或是問太問題就扣分,不斷的訓練。

因此,他比較了圍棋與醫療診斷,這兩種AI應用情境的差異。首先圍棋的棋譜可能性是有限的集合,但人類身體的狀況則是有無限種可能。再者,圍棋的輸出是二元結果,只有輸或贏兩種,但是,張智威估算,人體疾病目前約有800種。最後一項差異,圍棋AI程式可以出其不意,任意地探索新的下棋法,但是醫療診斷必須遵循用藥指示,不能輕易嘗試新方法來治療。

有鑒於醫療診斷和圍棋的差異,張智威將人體用階層式分層,將身體的分成不同部分,主代理人選擇一個身體部分的代理人問診,需要考慮的包含病患醫療資料、身體的部位和疾病的好發時間,最後,達成大約7.24個問題,就可以完成問診。

另一個想要運用AI輔助醫療診斷的題目是光學診斷。張智威以中耳炎判讀應用為例,用CNN 和DNN演算法辨識,但是,不同於AlphaGo可以找到大量棋譜來訓練。張智威團隊只取得了1,000多個圖像樣本,因為訓練樣本不足導致他們開發的中耳炎判讀演算法,準確率大約只有75%。

醫療真實影像不足,靠遷移學習找解方

後來,HTC團隊開始想辦法解決訓練樣本不足的問題,後來想到一個點子,就是上網尋找類似的圖片,來作為訓練樣本。他們上網上找了各式各樣的影像,不只局限於耳道的影像,再透過CNN模型,將原本的上千張耳道病變圖片,上網搜尋的圖片比對,找出特徵相似的對應關係。例如有一張耳道病變圖片,看起來就像是切片柳丁,或是另一張可能看起來像是拉花的咖啡俯視圖。

透過這個方法,就可以將大量相似圖片但往往中耳炎無關的影像,拿來作為用來訓練中耳炎判讀演算法的素材。他表示,這就是一種遷移學習的作法,將某個領域的知識轉移到另一個不同的領域上應用,最後,他們得到的辨識模型,準確率高達90%以上。這也解決了他們在光學診斷上,耳道病變圖片不足的問題。

張智威表示,中耳炎辨識不是特例,像心電圖也是一種不見得有那麼大量資料(Not-So-Big Data)的判斷分析,也可以嘗試透過遷移學習的方法,來彌補小數據的不足。

張智威將這套作法,稱為小數據學習(Small Data Learning),透過降低維度,例如將真實耳道照片,抽象為局部特徵圖片,就可以取得更多類似的無關但相似的圖片來輔助訓練,再搭配多種生成對抗網路(GAN)模型,可以建立遷移學習的訓練方式,來解決真實醫療影像不足的問題,也能做出高準確率的辨識模型。不過,他也認為,目前AI都還只是擅長辨識物件,AI只學習到了人腦的額葉(Frontal Lobe)運作,離真正的AI還很遠。

熱門新聞

Advertisement