臺灣人工智慧實驗室(AI Labs)籌組臺灣聯合學習產業大聯盟,也同時推出聯合學習平臺服務,將聯合學習模型開發和驗證分為4階段進行。

圖片來源: 

攝影/王若樸

臺灣人工智慧實驗室(AI Labs)聯手各政府部會發起臺灣聯合學習產業大聯盟,於3月30日正式揭露聯盟專用的聯合學習平臺服務,可分為訂閱使用、AI開發、聯合訓練和聯合驗證等四大階段,過程中,AI Labs也將提供技術支援,來協助聯盟成員進行聯合學習。聯盟入會會員年費為1萬元至5萬元不等,依各產業聯盟而定。

臺灣人工智慧實驗室率先推出聯合學習平臺服務

聯合學習(Federated Learning,簡稱FL)是一種分散式機器學習方法,能以共享模型來取代共享資料,解決傳統集中式機器學習需要大數據的問題。國內最早發起FL專案的臺灣人工智慧實驗室(AI Labs),最近就將他們在醫療業聯合學習的成功經驗進一步擴大,在國發會指導下,聯手政府部會、工研院和資策會等單位,成立臺灣聯合學習產業大聯盟,要把聯合學習推廣到不同產業。該大聯盟底下已有不少產業聯盟,包括醫療聯盟、城鄉暨交通聯盟、金融聯盟、製造聯盟,以及文化商務聯盟等。

AI Labs也在聯盟成立之際,推出臺灣首款FL平臺服務。這個平臺,整合了AI Labs用來訓練AI模型的技術平臺TMI Lightning,以及自建的模型建造器Model Zoo,還有收集國內外開放資料集的Data Zoo。

該平臺共有3個使用介面,首先是專家學習系統Expert Learning,可給Local端用來半自動標註影像,再來是Edge Dashboard,負責管理Local端AI模型,最後則是Harmonia Dashboard,專門管理聯合學習訓練的模型。

分4階段進行模型開發和驗證

該平臺服務有4階段導入流程,首先是AI模型上架,由發起FL議題的盟主,上傳自家初始模型到Harmonia Dashboard上,其他想參與的加盟者,可瀏覽、訂閱加入。接著,再透過專家學習介面,來測試模型。

第二階段則是初始AI模型開發。發起FL議題的盟主和加盟者得先制定AI研究協定,比如要打造肺結節病灶追蹤的模型,就得講究病灶標註的輪廓,必須訂好標註規則和其他所需資料。

協定制定好後,再由盟主匯入資料、透過半自動專家學習標註影像。訓練資料準備好後,就開始進行初始模型訓練,使用者可透過TMI Lightning框架來訓練模型,也可從其中的Data Zoo和Model Zoo來挑選模型架構,加速開發。

進一步來說,Data Zoo收錄了近百組國內外開放醫療資料集,可做為新模型開發的基礎。而Model Zoo則有將近50組的影像AI和聯合學習常用的演算法,可加速AI學習。

初始模型訓練好後,就能上板,讓議題盟主用來測試。比如,用上板模型當作半自動專家系統,來標註醫療影像,測試模型對臨床資料的表現。

初始模型完成後就進入第三階段:聯合訓練。首先,聯盟成員得先擬定聯合學習計畫,比如制定研究協定和聯盟加入條件等,並選擇訓練資料類型。之後,再將初始模型部署到加盟者端,開始進行聯合訓練。成果評估沒問題後,就將模型上版,要是表現不夠好,第三階段就會重來一次,直到模型收斂。

最後一階段就是聯合驗證。這個階段的目的,是要讓更多成員來測試模型,平臺也會透過推播機制,來通知其他成員,比如醫院,用其臨床資料來測試。

在這些過程中,AI Labs會扮演技術輔導角色,比如協助提供預訓練模型、標註模式定義,或其他系統操作輔導等。AI Labs內部200人的團隊,也會依使用者需求,來提供人力支援服務。

另一方面,AI Labs也公布聯盟會員收費規則,團體會員為1萬元至5萬元不等,視所屬產業聯盟而定,而教育學術團體會員年費為5,000元,個人會員則是2,500元,但平臺服務收費得視需求而定。未來,AI Labs也將設置網站,來說明平臺服務使用辦法。

聯合學習在國際還有新玩法,Google就用來取代Cookie作廣告精準推薦

聯合學習的目的,是要解決傳統集中式機器學習限制。因為,要有好的AI,就要有足夠多的資料。但這種集中式機器學習方法,對要兼顧資料隱私的企業來說是一大挑戰。因此幾年前,Google率先採用聯合學習,來改善虛擬鍵盤Gboard的選字推薦功能。他們讓用戶端手機下載一支公版訓練程式,讓程式直接用手機端資料來學習、訓練,再將訓練好的參數上傳到中央伺服器,優化後再回傳到各端點,進行下回合訓練,直到模型收斂。Google最後也將這套AI,部署到百萬支Android手機上。

今年,Google更進一步把聯合學習用於廣告的精準推薦上。為顧及網路瀏覽資料的隱私,Google逐步淘汰第三方Cookie,但為了讓廣告依然仍準確投放,Google利用分群聯合學習技術(FLoC),讓廣告主可觸及「一群」擁有共同興趣的使用者,把個別使用者隱身於群眾中,而且,FLoC是在使用者裝置上運算,不會將使用者的瀏覽歷史紀錄上傳到雲端。Google測試也指出,透過FLoC進行關聯性廣告的轉換效果,可達到使用Cookie的95%。文⊙王若樸


熱門新聞

Advertisement