富士通研究所所長原裕貴

黑盒子AI,是深度學習的優勢也是包袱。正因為超越了人定規則的框架,才能從資料挖掘出更具預測力的推論模型,但也因此,無法讓人得知模型為何做出這樣的預測。這類無法解釋的AI,在深度學習爆紅之後,成為了學界和業界爭論不休的技術和信賴課題。

AI實用派有大量擁護者,例如Google,在2012年發現,深度學習可以大幅提高語音辨識的正確率後,就大力應用到各領域。同年的ImageNet影像辨識大賽中,CNN框架AlexNet也以85%的準確率大敗其他演算法而奪冠,更掀起深度學習在電腦視覺和影像處理上的風潮。CNN之父Yann LeCun還主張,不見得所有問題都需要AI解釋,因此力推不需仰賴人力標記的自監督式學習(Self-Supervised Learning,SSL),並認為,這是AI典範最有機會出現大變革的方向。

但,AI的解釋力,終究是業界無法閃躲的問題,尤其各國政府看見其爭議性後,已紛紛祭出法規來規範AI應用,歐盟GDPR的透明處理原則,更賦予用戶,對於個人化自動化決策(Automated Individual Decision-Making),擁有請求解釋、拒絕適用的權利,所以,像金融機構不靠人只用AI決定拒絕貸款時,就得給出拒絕的理由,或在醫療領域,也無法完全靠AI診斷,還需醫生綜合考量後做出決策,因為現有法律上認定,只有真人才能為診斷當責。

因此,也有一派專家積極尋找打開AI黑盒子的方法。例如IBM,應用LIME技術結合自行開發的對比解釋方法(Contrastive Explanations Method,CEM),來發展解釋機器學習模型的工具;而日本的富士通研究所,則是運用深度張量(Deep Tensor)以及知識圖譜(Knowledge Graph),試圖解釋深度學習模型,更結合傳統統計方法開發出廣泛學習(Wide Learning)技術,走出了可解釋AI的另一條路。

以深度張量與知識圖譜技術,提供DL模型解釋依據

富士通最著名的AI應用之一,是2017年與國際體操聯盟聯合開發的體操評分AI,結合雷射感測器,將選手的每個動作如四肢位置、關節曲直、旋轉角度等肉眼難辨的差異,即時建立成3D影像,再透過AI影像辨識來估算得分。這個全新的AI體操評分機制,目前已在2019年世界體操錦標賽中完成驗證,等奧會核准通過後,更可望成為2020年東京奧運的輔助裁判工具。這項技術的關鍵推手富士通研究所,就是富士通先進技術的第一線研發主力。

富士通研究所早在2017年,就揭露對可解釋AI的研究進展,結合了深度張量、知識圖譜兩種技術,來解釋以圖結構(Graph)類型資料所訓練的深度學習模型。

比如一項針對特定疾病與基因變異關聯性的研究,富士通研究所先用深度學習演算法,訓練出疾病與基因變異關聯預測模型,並將圖結構的訓練數據,改以張量(Tensor)這種數學表達形式來呈現。

接著,針對該模型的每個輸入數據及輸出結果進行反向驗證,以輸入數據中張量之間的相似性,來提取出影響AI決策的特徵,藉此來判斷哪些因素對AI推論結果有關鍵性的影響,再進一步以知識圖譜來呈現這些因素之間的關係,方便研究人員或醫生,來解釋特定疾病與變異基因的關聯。

不過,富士通研究所所長原裕貴表示,知識圖譜技術並非用來解釋AI的預測結果,而是呈現出各因素間的關聯,讓研究者自己找出有說服力的解釋。目前,日本醫學研究與開發機構(AMED)與京都大學合作的基因研究專案,已經開始採用這項技術。

另一個應用,則是金融業的融資信用評估模型,用來解釋信用評等與借貸者條件的關聯性。因為深度張量,能分析如匯款記錄之類的圖形結構數據,來確定影響信評AI決策的關鍵因素;而知識圖譜本身能收集廣泛的公司數據,包括有關母公司、子公司、股份持有人和董事會成員等,來呈現其關連性,並顯示出影響較大的因素,讓研究者能近一步解釋AI決策生成的原因。

以傳統統計方法建立多重假設,來解釋DL模型決策結果

2018年底,富士通研究所又揭露了可解釋AI研究的另一個新方向,稱為廣泛學習,專門用於個人化決策類型的深度學習模型。

一般深度學習,是尋找輸入數據與預測結果間的關聯,來建立起一個用來推論的模型,但廣泛學習,是先將數據屬性(欄位)進行排列組合,並從統計結果中找出更傾向標記結果(Labeling Categories)的重要假設,來建立起一個分類模型的方法。

原裕貴表示,快速從大量數據組合中提取出重要假設,同時快速消除不必要的假設,來建立一個分類模型,就是廣泛學習的技術概念。

而建立假設的過程,舉例來說,輸入數據有10項屬性,年齡、性別、有無駕照、是否結婚、興趣、職業、年齡、偏好的購物場所、網頁瀏覽紀錄、天氣等,每個屬性的變化可能是2種(是或否、男或女)、多種(年齡、興趣)到上百種(例如1%到99%),就需要將所有可能性進行排列組合,這也是建立假設的過程。

接著,廣泛學習會自動統計出每一種數據組合的結果,若統計結果中,100名擁有駕照的人,僅60人已經購買了該產品,購買率為6成,但10個已婚男子中,卻有9人都購買了該產品,購買率為9成,以此就能推斷,已婚男性相較於擁有駕照者更容易購買該產品,就能形成一條假設,富士通稱為這是一個知識區塊(Knowledge Chunk)。

廣泛學習模型,會建立大量知識區塊,並測試每一個區塊是否傾向標記結果,例如符合這些假設的人,是否會成為購買者(這就是標記結果)。接著,再透過知識區塊之間的關聯性,進一步調整其權重,讓模型做出比一般深度學習更精準的決策,比如富士通研究所在醫療數據的測試中,廣泛學習比深度學習的準確率提高了10~20%。

用AI來解決社會上的公平性問題,避免人為判斷偏差的爭議,是接下來的發展重點。─── 富士通研究所所長 原裕貴 攝影/洪政偉)

富士通研究所先將廣泛學習在應用到行銷業務場景中測試,除了能用來分析客戶是否將購買了特定產品,也能反推出哪個類型的客戶最有可能是該商品的購買者,比如在上述案例中的已婚男性可能有很高的購買率,就能主動向這類客群進行分眾行銷。富士通研究所指出,廣泛學習的優勢,不僅在於更精準的決策結果,更重要的是,這種模型決策過程,容易讓人解釋,哪些假設對預測結果具有更強的影響力,而且,在訓練資料不足情況下,就算只有幾十筆資料,廣泛學習仍然可以建立可供判斷用的假設,這也意味著,若日後積累了更多數據,還能執行更準確的測試。

未來,富士通研究所則希望能將廣泛學習應用到更多場景,例如製造業瑕疵檢測,試圖找出造成瑕疵的原因,並解決訓練資料不足的問題,或用於醫療診斷時的輔助,比如讓AI根據患者的治療用藥進行藥物分析,找出「40多歲吸菸男性患者服用A藥物可以大幅改善症狀」的證據,讓醫生更容易對患者解釋和說明開藥依據。

此外,原裕貴表示:「AI運算中,仍有一段最佳化、最佳解題的計算,可藉助DAU來處理,跟以前單純用AI演算法去處理相比,AI演算法加上最佳化解題的運算方式,可以算得更快。」這個DAU,就是富士通研究所研發的另一項技術,量子退火晶片(Digital Annealing Unit,DAU),可以平行計算上千個變數的多項式方程式,來找出最佳解,可用來處理特定AI問題的最佳解計算。

這項技術已經初步產品化,已先用於日本郵政的物流配送調度上,因為日本郵局調度貨車派送要考慮的因素很多,包括了車輛類型、郵差工時、運送成本、包裹種類、運輸距離、載重和容量限制、包裹重量、運送時間,甚至還要考慮道路情況等63項條件,光是5臺車派送包裹給6名顧客,就可能會有 10億種組合,想要找出最佳的物流調度方式,靠傳統的計算方法非常困難。

2018年時,日本郵政在埼玉市的新岩槻郵局進行了這項DAU實驗計畫,利用數位退火服務來尋找最佳物流路線和運輸方式,當時經過4~5個月的測試後發現,原有52輛貨車可以減少到48輛就夠了,貨物裝載率也提升12%,而且,只需要1秒,就可以依據輸入條件,找出一個物流方式最佳解。

不過,DAU也有其缺點,難以靠其他技術或演算法來驗證結果,得靠實證來檢驗。原裕貴坦言,數位退火技術不是尋求數學上的最佳解,而是找出一個比現在作法更好的答案,「富士通實測時,還沒有因此而帶來更高成本,但也有機會持續改進。」

透過自動化調校模型表現的技術,解決AI預測力下降問題

一邊打開AI的黑盒子,富士通研究所也要解決其他造成AI不被信賴的問題。其中,隨著時間、環境變化及新輸入資料的影響,AI模型預測準確率會逐漸下降,原裕貴稱之為「劣化」。

以金融信用風險評估模型為例,會受到經濟狀況變化、匯率、價格、利率的波動以及海外趨勢、法規的影響,在首次訓練完並部署後,準確度會逐漸變差,一般作法上,得定期增加新數據,重新訓練模型來改善。

可是,AI模型的維運人員無法時時監測模型表現,即使模型劣化嚴重也不一定能即時得知,若未即時改善,模型劣化後做出的錯誤決策,更可能降低企業內外部服務的效率,甚至造成業務過失,再加上,模型重新訓練的過程,又得再次耗費人力標注與訓練的成本。

為此,富士通研究所也在2019年10月時,發表了一個全球首創的AI模型「自動」修正預測力的技術,稱為「高耐久性學習技術(High Durability Learning)」。簡單來說,這項技術是將AI模型訓練用數據,繪製成分布圖,同時也將分佈圖轉換為拓撲空間(Durable Topology Space)的表現形式,接著,將模型使用過程中的輸入數據,持續繪製成兩種圖表,來看監看數據分布的趨勢變化。

藉由兩種數據分布圖的變化,AI模型就能自動偵測輸入資料跟模型表現之間的關係,並調整決策的參考依據,來維持模型準確率,延緩模型劣化速度及重新訓練的頻率。富士通研究所實際以3,800家企業的財務數據及信用風險評模型來測試,剛訓練完成的AI模型準確率為91%,隨著環境變化,當模型劣化到僅剩69%時,有應用高耐久性學習的模型還能維持在89%。

AI模型的品質,還有一個更根本的議題,就是AI倫理,原裕貴表示,這也是全世界都很關注的議題,富士通很早就開始關注,也在去年3月公開一份全集團都得遵守的AI承諾書,要來發展以人為本的AI技術。「用AI來解決社會上的公平性問題,避免人為判斷偏差的爭議,或是,建立公平處理的AI,來防止AI造成更多的不公平,就是接下來的發展重點。」他說。

 

CTO小檔案

原裕貴

富士通研究所所長

學歷:日本東京大學工學博士

經歷:1984年加入富士通研究所,並在1991年成為MIT營運研究中心客座研究員,2009年擔任軟體與解決方案研究部長、2013擔任社會創新研究部長,2015年則轉任知識情報處理研究部長,且兼任大數據戰略負責人,2017年起任職富士通AI事業部專員,直到2019年上任富士通研究所所長。

 

公司檔案

富士通

● 地址:東京都港區東新橋1-5-2汐留市中心

● 成立時間:1935年

● 網址:www.fujitsu.com/jp/

● 員工數:132,138人(2019年3月31日)

● 年營收:3兆9524億日圓

● 執行長:時田隆仁

● 科技部門:富士通研究所

● 科技部門主管:原裕貴

● 科技部門人數:約900名

公司大事紀

● 2015年:推出數位商務平臺MetaArc以及人工智慧系統平臺Zinrai

● 2016年:開發了類量子電腦的量子退火運算技術

● 2017年:與國際體操聯盟合作建立體操比賽的AI裁判系統

● 2018年:總部決定從IT企業轉型為DX(Digital Transformation)企業。開始開發可解釋AI技術Wide Learning

● 2019年:發表開發高耐久性學習技術(High Durability Learning)

熱門新聞

Advertisement