Google AI系統DeepMind高中數學考試不及格

情境圖（圖片來源／pixabay）

Google AI系統能打敗人類世界棋王，但是無法通過高中程度的數學考試。

Google旗下DeepMind團隊上周公佈一份名為《分析神經模型的數學推理能力》的研究報告。在這項研究中，DeepMind團隊讓一個名為DeepMind的AI系統接受一項涵括算術、幾何、機率、測量和微積分的數學測試，考題有40題，大約是英國高中數學的程度。

結果DeepMind雖然在某些題目上表現不錯，但是碰上以文字、加減乘除符號、函式等組成的問題時，卻看不懂題目而無法作答。最後，在40道題目中，這個人工智慧系統只答對14題，只拿到「E」的分數，也就是說是不及格。

例如其中一道題目「1+1+1+1+1+1+1」，連國小生都知道答案是7，但DeepMind卻答成了6。

研究人員解釋，DeepMind神經模型最長可以計算出現次數（n）6次以下的數值，但如果n=7，它就算不出來。當AI碰到同一數字出現多次，它會認為輸入值遭到亂搞了。奇怪的是，碰上更長的加總題目，DeepMind卻算得出來。研究人員承認還是找不出很好的解釋，但相信可能是因為AI神經網路會不斷察看每道問題而做出正確解答。

此外，當研究人員要求DeepMind在一長串數字中找出「位值」（place value），它就能答得很好，因為它可以按數字大小排出順序，而且也能將小數四捨五入。

研究人員說，人類智慧優於神經模型之處，在於對於事物複合式推論的能力。推論是一種複雜、多面向能力的展現。在解答問題時，人腦動用了多種認知能力，包括將符號分類（如區分成數字、加減乘除符號、文字、變數）、規劃（如找出正確順序的函數）、演算、運用工作記憶來儲存中間值、還要運用學到的規則或定理等。相反的，以卷積和遞迴神經網路發展出的DeepMind擅長模式比對、機器翻譯、及強化式學習，但彈性遠不及人腦。它們不太能將事物推論到已有經驗的環境外，更無法處理刻意來亂的輸入資訊。

AI或許目前當不成數學老師，但目前的AI已經相當厲害。DeepMind公司的AlphaGo接連打敗人類圍棋冠軍李世乭、柯潔。去年12月DeepMind的AlphaZero又在星海爭霸 2（StarCraft II）測試賽中，以5比0打贏世界頂尖職業玩家。此外，自學畫畫、創作音樂也都難不倒AI。

熱門新聞