人工智慧(AI)研究的長遠目標,是創造出可以展現類似人類智能的機器——這種機器可以快速學會新工作,看到不同作業之間的類似之處,並且能夠靈活地解決新問題。這項目標被稱為「通用人工智慧」(artificial general intelligence, AGI),以區別現今的有限AI。今天的AI產業面臨的基本問題是:我們目前是走在創造出真正智慧型AGI機器的道路上,還是將再次陷入困境,進入又一個AI冬天?當前的AI熱潮,已經吸引了數以千計的研究人員和數以十億美元計的投資,幾乎所有這些人才和資金,都正被用在改善深度學習技術上。
通往AGI的兩條道路
AI研究者在製造智慧型機器方面有兩條路可走。其一是我們的現行做法,也就是致力使電腦在特定功能上超越人類,例如比人類更會下圍棋或更會從醫學影像中辨識癌細胞。這種做法所抱持的希望是:如果我們能使電腦在一些困難的事情上勝過人類,我們最終將找到方法,使電腦在所有事情上勝過人類。在這種AI研發方式下,系統如何運作並不重要,電腦是否靈活也不重要。唯一重要的是,AI電腦能比其他AI電腦更好地做某件事,而且最終能比最優秀的人類做得更好。
創造智慧型機器的第二條路是著眼於靈活性。在這種AI研發方式下,AI的表現不一定要好過人類。研發的目標是創造出聰明且靈活的機器,不但能夠做很多事,還可以將它們從某件事中學到的東西應用在其他事情上。採納這種方式下的成功,可能是創造出一部能力如同五歲兒童或甚至只是一隻狗的機器。這種做法所抱持的希望是:如果我們能夠先了解如何創造靈活的AI系統,那麼在這個基礎上,我們最終將能創造出智能等同或甚至超越人類的系統。
在早期的一些AI熱潮中,第二條路受到青睞,但事實證明這太難了。科學家意識到,機器要具有五歲孩子的能力,必須掌握大量的日常知識。AI研究者無法想出方法把這些日常知識寫進電腦程式裡,或使電腦習得這些東西。
知識比較困難的部分不是陳述一個事實,而是以有用的方式表示那個事實。且以「Balls are round」(球是圓的)這句話為例。五歲的孩子知道它是什麼意思,我們雖然可以輕鬆地把這句話輸入到電腦裡,但電腦如何理解?「ball」與「round」這兩個英文單字都有多種意思,「ball」可以是指舞會,而舞會不能說是圓的;披薩是圓的,但披薩不像一顆球。電腦要理解「ball」,就必須將這個英文單字和不同的意思聯繫起來,而每一個意思都與其他英文單字有不同的關係。此外,物體會動,例如有些球會彈跳,但足球的彈跳方式與棒球不同,而棒球的彈跳方式又與網球不同。你和我都是藉由觀察,迅速認識到這些差別。我們不需要任何人告訴我們球如何彈跳;我們只是把球扔到地上,觀察隨後發生的事。我們不知道這些知識如何儲存在我們的大腦裡,但是對我們來說,掌握球如何彈跳之類的日常知識是毫不費力的。
然而,AI科學家想不到方法使電腦學會這些東西。他們發明了schema和frame之類的軟體結構來組織知識,但無論他們怎麼做,最後都搞出一堆無用的混亂東西。世界相當複雜;一個孩子知道的事物,以及這些事物之間的聯繫,看來是多到電腦無法處理。我知道這似乎應該是很容易的事,但迄今就是沒有人知道如何使電腦明白「球是什麼」這麼簡單的一件事。
這個問題被稱為「知識表示」(knowledge representation)。一些AI科學家認為,知識表示並非只是AI的一個大問題,它其實是AI唯一的問題。他們聲稱,在我們找到方法在電腦中表示日常知識之前,我們不可能製造出真正的智慧型機器。
現今的深度學習網路並不掌握知識。下圍棋的電腦並不知道圍棋是一種遊戲,它不知道這種遊戲的歷史,也不知道對手是電腦還是人類,甚至不知道「電腦」和「人類」是什麼意思。
AI科學家最近試用了一種不同的知識編碼方法。他們創建了大型人工神經網路,並以大量文本訓練這些網路,例如數萬本書的全部文字,以及幾乎整個網際網路上的文字。經過這種訓練,這些網路掌握了特定字詞組合出現的機率。這些語言網路可以做令人驚訝的事,例如你給這種網路幾個字詞,它可以寫出與這些字詞有關的短文,而我們很難分辨那是人類還是神經網路寫的。
這些語言網路是掌握了真實的知識,抑或只是藉由記住無數字詞的統計資料來模仿人類?AI科學家對此意見不一。在我看來,如果深度學習網路不以大腦那種方式建立世界的模型,這種技術就不可能實現AGI這個目標。深度學習網路表現良好,但這不是因為它們解決了知識表示問題,而是因為它們完全避開了這個問題,改為倚賴統計和大量資料。深度學習網路的運作方式十分聰明,它們的表現令人印象深刻,而且在商業上很有價值。我只是想指出,它們並不掌握知識,這種技術並非走在創造出能力等同五歲孩子的AI發展路上。
大腦作為AI的模範
假設我想表示關於一個常見物體如釘書機的知識,面對這個問題,早期的AI研究者會試著列出釘書機不同部分的名稱,然後描述每一個部分的作用。他們可能會寫下這樣一條關於釘書機的規則:「當釘書機的頂部被壓下時,一個釘書針會從一端出來。」但要理解這句話,「頂部」、「端」、「釘書針」等名詞必須加以定義,「壓下」和「出來」之類的不同動作也必須定義。此外,只有這條規則是不夠的,它沒有說明釘書針出來時朝哪個方向,接下來會發生什麼事,又或者當釘書針卡住時應該怎麼做。AI研究者因此必須寫更多規則,而這種知識表示方法會產生無止境的定義和規則。AI研究者不知道如何使這種方法行得通,批評者甚至認為,即使所有規則都可以清楚說明,電腦仍將不會「知道」釘書機是什麼。
大腦則以完全不同的方式儲存關於釘書機的知識:它習得一個釘書機的模型;這種模型是知識的化身。想像一下,你的頭腦裡有個微型釘書機,跟真的釘書機幾乎一模一樣,形狀相同、零件相同、運動方式相同,只是小得多。這個微小的模型代表了你所知道的關於釘書機的一切,而且不需要標記釘書機的任何一部分。如果你想記起釘書機的頂部被壓下時會發生什麼事,你可以按下這個小模型,看看會發生什麼事。
當然,你的頭腦裡並沒有一個微小的實體釘書機。但新皮質的細胞習得一個虛擬模型,而它可以產生同樣的作用。在你與真實的釘書機互動的過程中,大腦習得它的虛擬模型,而這個模型包含你觀察到的關於真實釘書機的一切,包括它的形狀和你在使用時發生的事。你對釘書機的認識嵌入這個模型中,你的大腦裡並不是儲存著關於釘書機的一系列事實和規則。
釘書機的頂部被壓下時,會發生什麼事?你要回答這個問題,並不是找出頭腦裡儲存的釘書機相關規則,然後告訴我答案。實際情況將是你的大腦想像釘書機的頂部被壓下,然後大腦裡的釘書機模型會記起接下來將發生的事。你可以用言語告訴我答案,但這些知識並不是儲存在語言或規則中,相關知識就是那個模型。(本文摘錄整理自《千腦智能新理論》第8章,星出版提供)
圖片來源_星出版
書名 千腦智能新理論(A Thousand Brains: A New Theory of Intelligence)
傑夫・霍金斯(Jeff Hawkins)/著;許瑞宋/譯
星出版
定價:480元
作者簡介
傑夫・霍金斯(Jeff Hawkins)
神經科學研究公司Numenta共同創辦人,紅杉神經科學研究所(Redwood Neuroscience Institute)創辦人,掌上型運算領域的創始人之一。美國國家工程學院院士,著有《創智慧》(On Intelligence)。圖片來源_Amazon
熱門新聞
2024-11-18
2024-11-20
2024-11-12
2024-11-15
2024-11-15
2024-11-19
2024-11-14