Google旗下人工智慧研究機構DeepMind,開發出會辨識古希臘文字的人工智慧Ithaca,而且Ithaca不只能夠辨識古希臘文字,還能恢復損壞銘文上的文字,辨識來源位置,甚至是估算銘文被創建的年代。

Ithaca恢復文字的準確率達62%,並且能以71%準確率辨識來源位置,而且能精確的估算銘文年代,範圍限縮到30年間,歷史學家已經使用Ithaca重新評估希臘歷史的重要時期。

歷史學家透過古時候的文字,了解過去的文明,早在2500年前,希臘人就開始在石頭、陶器和金屬上書寫,紀錄租約、法律、曆法和神諭等各種內容,歷史學家可以透過這些文字,知道地中海地區以前發生的大小事。

這些歷史銘文在近幾個世紀以來,不少已經遭到搬移和破壞,現代的年代測定技術,又無法運用在這些材料上,使得銘文解讀困難且耗費時日。因此DeepMind與威尼斯卡福斯卡里大學合作,開發出用於解譯這些銘文的人工智慧Ithaca,Ithaca取名自荷馬奧德賽中希臘島嶼的名字,建立在DeepMind文字恢復系統Pythia之上。

Ithaca使用來自非營利性組織帕卡德人文學院,全世界最大的希臘銘文數位資料集進行訓練,DeepMind提到,自然語言處理模型通常使用多字詞進行訓練,因為字詞出現的順序、位置,以及之間的關係,提供了額外的含義和上下文資訊。

不過,因為歷史學家有興趣使用Ithaca分析的銘文多數已經損壞,而且丟失大區塊的文字,所以DeepMind為了使模型仍然可用,除了使用多字詞訓練之外,也使用單字來訓練,Ithaca模型核心的稀疏自注意力機制,會平行評估這兩個輸入,並根據需要用於預測銘文。

DeepMind也提供多種視覺輔助工具,讓歷史學家更容易解讀Ithaca的輸出,Ithaca會輸出多個文字恢復假設,供歷史學家以專業知識進行選擇,在地理位置歸因上,Ithaca會在地圖上顯示可能的分布機率,來顯示其不確定性,而且透過顯示多個可能的區域機率,也能夠讓歷史學家了解這些區域在古代,可能存在潛在地理關聯。

Ithaca在追溯銘文年代時,會產生公元前800年到公元800年,以十年為單位的預測日期分布,這使得歷史學家可以利用模型視覺化結果,提供更可信的判斷。Ithaca還會使用常見的電腦視覺技術,凸顯對預測結果貢獻最大的輸入,藉由顯示不同顏色強度,突出顯示影響Ithaca對缺失文字、位置和日期做出預測的單詞。

Ithaca協助修復文字的能力極佳,與研究人員合作的歷史學家,在單獨修復古代文字的時候,具有25%的準確度,但在使用Ithaca後,修復文字的準確度達到72%,這個結果凸顯了人機合作的潛力,能更好地推進歷史解釋,並建立歷史事件的相對年代。

透過Ithaca的幫助,目前歷史學家不認為重要的雅典法令,是在蘇格拉底和伯里克里斯等名人生活的年代所制定。長期以來,人們一直覺得這些法令是在公元前446/445年前制定的,但是經Ithaca的分析,新的證據表示這些法令制定是在公元前420年代。儘管年份差異不大,但是對歷史學家理解古代雅典政治史卻非常重要。

DeepMind與Google雲端和Google Arts & Culture合作,推出Ithaca免費互動版本,並且進一步開源程式碼、預訓練模型,以及互動式Colaboratory筆記本,與研究人員、教育者和博物館工作人員,共享這些研究成果。

熱門新聞

Advertisement