情境圖(圖片來源/pixabay)

Google AI系統能打敗人類世界棋王,但是無法通過高中程度的數學考試。

Google旗下DeepMind團隊上周公佈一份名為《分析神經模型的數學推理能力》的研究報告。在這項研究中,DeepMind團隊讓一個名為DeepMind的AI系統接受一項涵括算術、幾何、機率、測量和微積分的數學測試,考題有40題,大約是英國高中數學的程度。

結果DeepMind雖然在某些題目上表現不錯,但是碰上以文字、加減乘除符號、函式等組成的問題時,卻看不懂題目而無法作答。最後,在40道題目中,這個人工智慧系統只答對14題,只拿到「E」的分數,也就是說是不及格。

例如其中一道題目「1+1+1+1+1+1+1」,連國小生都知道答案是7,但DeepMind卻答成了6。

研究人員解釋,DeepMind神經模型最長可以計算出現次數(n)6次以下的數值,但如果n=7,它就算不出來。當AI碰到同一數字出現多次,它會認為輸入值遭到亂搞了。奇怪的是,碰上更長的加總題目,DeepMind卻算得出來。研究人員承認還是找不出很好的解釋,但相信可能是因為AI神經網路會不斷察看每道問題而做出正確解答。

此外,當研究人員要求DeepMind在一長串數字中找出「位值」(place value),它就能答得很好,因為它可以按數字大小排出順序,而且也能將小數四捨五入。

研究人員說,人類智慧優於神經模型之處,在於對於事物複合式推論的能力。推論是一種複雜、多面向能力的展現。在解答問題時,人腦動用了多種認知能力,包括將符號分類(如區分成數字、加減乘除符號、文字、變數)、規劃(如找出正確順序的函數)、演算、運用工作記憶來儲存中間值、還要運用學到的規則或定理等。相反的,以卷積和遞迴神經網路發展出的DeepMind擅長模式比對、機器翻譯、及強化式學習,但彈性遠不及人腦。它們不太能將事物推論到已有經驗的環境外,更無法處理刻意來亂的輸入資訊。

AI或許目前當不成數學老師,但目前的AI已經相當厲害。DeepMind公司的AlphaGo接連打敗人類圍棋冠軍李世乭柯潔。去年12月DeepMind的AlphaZero又在星海爭霸 2(StarCraft II)測試賽中,以5比0打贏世界頂尖職業玩家。此外,自學畫畫創作音樂也都難不倒AI。

熱門新聞

Advertisement