抵達通用AI的另一險路

星出版

人工智慧（AI）研究的長遠目標，是創造出可以展現類似人類智能的機器——這種機器可以快速學會新工作，看到不同作業之間的類似之處，並且能夠靈活地解決新問題。這項目標被稱為「通用人工智慧」（artificial general intelligence, AGI），以區別現今的有限AI。今天的AI產業面臨的基本問題是：我們目前是走在創造出真正智慧型AGI機器的道路上，還是將再次陷入困境，進入又一個AI冬天？當前的AI熱潮，已經吸引了數以千計的研究人員和數以十億美元計的投資，幾乎所有這些人才和資金，都正被用在改善深度學習技術上。

通往AGI的兩條道路

AI研究者在製造智慧型機器方面有兩條路可走。其一是我們的現行做法，也就是致力使電腦在特定功能上超越人類，例如比人類更會下圍棋或更會從醫學影像中辨識癌細胞。這種做法所抱持的希望是：如果我們能使電腦在一些困難的事情上勝過人類，我們最終將找到方法，使電腦在所有事情上勝過人類。在這種AI研發方式下，系統如何運作並不重要，電腦是否靈活也不重要。唯一重要的是，AI電腦能比其他AI電腦更好地做某件事，而且最終能比最優秀的人類做得更好。

創造智慧型機器的第二條路是著眼於靈活性。在這種AI研發方式下，AI的表現不一定要好過人類。研發的目標是創造出聰明且靈活的機器，不但能夠做很多事，還可以將它們從某件事中學到的東西應用在其他事情上。採納這種方式下的成功，可能是創造出一部能力如同五歲兒童或甚至只是一隻狗的機器。這種做法所抱持的希望是：如果我們能夠先了解如何創造靈活的AI系統，那麼在這個基礎上，我們最終將能創造出智能等同或甚至超越人類的系統。

在早期的一些AI熱潮中，第二條路受到青睞，但事實證明這太難了。科學家意識到，機器要具有五歲孩子的能力，必須掌握大量的日常知識。AI研究者無法想出方法把這些日常知識寫進電腦程式裡，或使電腦習得這些東西。

知識比較困難的部分不是陳述一個事實，而是以有用的方式表示那個事實。且以「Balls are round」（球是圓的）這句話為例。五歲的孩子知道它是什麼意思，我們雖然可以輕鬆地把這句話輸入到電腦裡，但電腦如何理解？「ball」與「round」這兩個英文單字都有多種意思，「ball」可以是指舞會，而舞會不能說是圓的；披薩是圓的，但披薩不像一顆球。電腦要理解「ball」，就必須將這個英文單字和不同的意思聯繫起來，而每一個意思都與其他英文單字有不同的關係。此外，物體會動，例如有些球會彈跳，但足球的彈跳方式與棒球不同，而棒球的彈跳方式又與網球不同。你和我都是藉由觀察，迅速認識到這些差別。我們不需要任何人告訴我們球如何彈跳；我們只是把球扔到地上，觀察隨後發生的事。我們不知道這些知識如何儲存在我們的大腦裡，但是對我們來說，掌握球如何彈跳之類的日常知識是毫不費力的。

然而，AI科學家想不到方法使電腦學會這些東西。他們發明了schema和frame之類的軟體結構來組織知識，但無論他們怎麼做，最後都搞出一堆無用的混亂東西。世界相當複雜；一個孩子知道的事物，以及這些事物之間的聯繫，看來是多到電腦無法處理。我知道這似乎應該是很容易的事，但迄今就是沒有人知道如何使電腦明白「球是什麼」這麼簡單的一件事。

這個問題被稱為「知識表示」（knowledge representation）。一些AI科學家認為，知識表示並非只是AI的一個大問題，它其實是AI唯一的問題。他們聲稱，在我們找到方法在電腦中表示日常知識之前，我們不可能製造出真正的智慧型機器。

現今的深度學習網路並不掌握知識。下圍棋的電腦並不知道圍棋是一種遊戲，它不知道這種遊戲的歷史，也不知道對手是電腦還是人類，甚至不知道「電腦」和「人類」是什麼意思。

AI科學家最近試用了一種不同的知識編碼方法。他們創建了大型人工神經網路，並以大量文本訓練這些網路，例如數萬本書的全部文字，以及幾乎整個網際網路上的文字。經過這種訓練，這些網路掌握了特定字詞組合出現的機率。這些語言網路可以做令人驚訝的事，例如你給這種網路幾個字詞，它可以寫出與這些字詞有關的短文，而我們很難分辨那是人類還是神經網路寫的。

這些語言網路是掌握了真實的知識，抑或只是藉由記住無數字詞的統計資料來模仿人類？AI科學家對此意見不一。在我看來，如果深度學習網路不以大腦那種方式建立世界的模型，這種技術就不可能實現AGI這個目標。深度學習網路表現良好，但這不是因為它們解決了知識表示問題，而是因為它們完全避開了這個問題，改為倚賴統計和大量資料。深度學習網路的運作方式十分聰明，它們的表現令人印象深刻，而且在商業上很有價值。我只是想指出，它們並不掌握知識，這種技術並非走在創造出能力等同五歲孩子的AI發展路上。

大腦作為AI的模範

假設我想表示關於一個常見物體如釘書機的知識，面對這個問題，早期的AI研究者會試著列出釘書機不同部分的名稱，然後描述每一個部分的作用。他們可能會寫下這樣一條關於釘書機的規則：「當釘書機的頂部被壓下時，一個釘書針會從一端出來。」但要理解這句話，「頂部」、「端」、「釘書針」等名詞必須加以定義，「壓下」和「出來」之類的不同動作也必須定義。此外，只有這條規則是不夠的，它沒有說明釘書針出來時朝哪個方向，接下來會發生什麼事，又或者當釘書針卡住時應該怎麼做。AI研究者因此必須寫更多規則，而這種知識表示方法會產生無止境的定義和規則。AI研究者不知道如何使這種方法行得通，批評者甚至認為，即使所有規則都可以清楚說明，電腦仍將不會「知道」釘書機是什麼。

大腦則以完全不同的方式儲存關於釘書機的知識：它習得一個釘書機的模型；這種模型是知識的化身。想像一下，你的頭腦裡有個微型釘書機，跟真的釘書機幾乎一模一樣，形狀相同、零件相同、運動方式相同，只是小得多。這個微小的模型代表了你所知道的關於釘書機的一切，而且不需要標記釘書機的任何一部分。如果你想記起釘書機的頂部被壓下時會發生什麼事，你可以按下這個小模型，看看會發生什麼事。

當然，你的頭腦裡並沒有一個微小的實體釘書機。但新皮質的細胞習得一個虛擬模型，而它可以產生同樣的作用。在你與真實的釘書機互動的過程中，大腦習得它的虛擬模型，而這個模型包含你觀察到的關於真實釘書機的一切，包括它的形狀和你在使用時發生的事。你對釘書機的認識嵌入這個模型中，你的大腦裡並不是儲存著關於釘書機的一系列事實和規則。

釘書機的頂部被壓下時，會發生什麼事？你要回答這個問題，並不是找出頭腦裡儲存的釘書機相關規則，然後告訴我答案。實際情況將是你的大腦想像釘書機的頂部被壓下，然後大腦裡的釘書機模型會記起接下來將發生的事。你可以用言語告訴我答案，但這些知識並不是儲存在語言或規則中，相關知識就是那個模型。（本文摘錄整理自《千腦智能新理論》第8章，星出版提供）

圖片來源_星出版

書名千腦智能新理論（A Thousand Brains: A New Theory of Intelligence）

傑夫・霍金斯（Jeff Hawkins）／著；許瑞宋／譯

星出版

定價：480元

作者簡介

傑夫・霍金斯（Jeff Hawkins）

神經科學研究公司Numenta共同創辦人，紅杉神經科學研究所（Redwood Neuroscience Institute）創辦人，掌上型運算領域的創始人之一。美國國家工程學院院士，著有《創智慧》（On Intelligence）。圖片來源_Amazon

熱門新聞