DeepMind公布首個可用來發現矩陣乘法新演算法的AI系統AlphaTensor

圖片來源:

DeepMind

Alphabet旗下人工智慧子公司DeepMind本周揭露了最新的AI系統AlphaTensor，可用來找出更有效率的矩陣乘法演算法，該AI系統的基礎為擊敗全球三大棋藝AI的AlphaZero，使得DeepMind相信AlphaZero不僅可應用在遊戲領域上，也能用來解決懸而未決的數學問題。

高中就學過的矩陣乘法是代數中最簡單的運算之一，它在現代運算中無處不在，也對數位世界帶來巨大的影響，例如該運算被用來處理手機上的圖像、辨識語音命令、替電腦遊戲產生圖形、進行模擬以預測天氣，或是壓縮資料及影片以於網路上傳遞等。這使得全球的企業都耗費了許多成本來開發可有效執行矩陣乘法的運算硬體，因此，就算只是在效率上有微小的改善，都能帶來廣泛的影響。

幾個世紀以來，數學家們都相信標準的矩陣乘法是最有效率的演算法，一直到德國數學家Volken Strassen在1969年發現了更快的演算法。然而，DeepMind團隊卻利用AI技術，找出許多新的、而且優於人類設計的矩陣乘法演算法。

AlphaTensor為AlphaZero的延伸，AlphaZero是個完全未經訓練的神經網路，經由自己對戰來進行強化學習，而奠基於此的AlphaTensor一開始也未被灌輸任何既有的矩陣乘法演算法，而是藉由自我學習日益進步，重新發現了歷史上的各種快速矩陣演算法，包括Strassen的在內，最終超越了人類，找到比現今更快的演算法。

舉例來說，倘若傳統的學校教學中要計算一個4x5乘以5x5的矩陣要乘100次，之後人類的進步將它減少至80次，AlphaTensor所發現的演算法只需要乘76次，這代表AlphaTensor的演算法突破了50年前由Strassen所建立的紀錄，還能以AlphaTensor所發現的、用來乘小型矩陣的演算法作為基礎，放大至任何規模的大型矩陣，也印證了矩陣乘法的演算法領域比原先以為的還要豐富。

此外，DeepMind也利用AlphaTensor來替特定的硬體尋找最適當的演算法，包括Nvidia V100 GPU與Google TPU v2，而AlphaTensor也不負所望地在同樣的硬體上，在乘以更大矩陣的速度上比常用的演算法快了10%~20%，展示了AlphaTensor的靈活性。

更快的矩陣乘法除了能應用於現今的許多運算任務上，改善各種領域的運算效能之外，DeepMind亦期望可藉由此一研究拋磚引玉，啟發其他人利用AI來發現其它基本運算任務的演算法。

熱門新聞