Google在雲端平臺新加入內建深度學習模型TabNet,用戶可以簡單地使用深度學習來處理表格資料,TabNet具有兩項優點,除了可解釋性之外,還提供高效的執行效能,Google提到,這個演算法很適合用於零售、金融和保險業,實作像是預測信用評分、詐欺偵測和數值預測等應用。

Google提到,雖然表格資料是人工智慧應用中,最常見的資料類型,但是將表格資料應用於深度學習中,並沒有獲得充分的研究,目前大多數應用程式,仍然使用決策樹演算法,Google進一步解釋其中的原因,因爲決策樹很適合用於表格資料,而且具有很好的可解釋性,這在金融服務這類高風險的實際應用中非常重要,另外一個原因則是,過去的深度學習架構並不適合用於表格資料。

之所以要在表格資料使用深度學習技術,Google認為,跟圖像、語音和語言等領域相同,新的深度學習架構能帶來明顯的效能改善,由於深度學習近期在圖像以及語言的發展,也驅使了研究團隊開發可將深度學習用於表格資料的架構。

而且神經網路與決策樹演算法相比,神經網路使用稱為反向傳播方法,是能夠直接從錯誤訊號學習的有效方法,Google提到,深度神經網路可以於表格資料,提供基於梯度下降的端到端學習方法,這帶來的好處包括從部分標記的資料中學習,或稱半監督式學習,還能夠使用另一個訓練模型的資訊,以學習解決相關的任務。

TabNet被設計能夠學習類決策樹的映射方式,以獲取決策樹可解釋性的優點,而且又因為使用深度學習方法,因此能獲得高效能的好處。TabNet採用稱為順序注意力(Sequential Attention)的機器學習技術,用戶可以了解模型中的每一個步驟,選擇模型特徵的原因,這個機制可以解釋模型獲得最終預測結果的過程,還可用來改進模型,增加精準度,Google提到,因為順序注意力機制,TabNet的效能表現比其他神經網路和決策樹方法都還要好,還提供可解釋的特徵歸因。

現在Google發布TabNet,作為雲端人工智慧平臺訓練服務內建的演算法,TabNet提供了超參數調整功能,因此即便用戶不了解該方法背後的技術原理,仍可以達到高執行效能。超參數調校會在單一訓練工作中,進行多次試驗後開始作用,Google提到,雖然超參數比預測值效能還要好,但因為需要經過多次的試驗,因此超參數調校功能需要付出較高的計算成本。

熱門新聞

Advertisement