DeepMind新AI可解譯古希臘銘文、年代和地理位置

Google旗下人工智慧研究機構DeepMind，開發出會辨識古希臘文字的人工智慧Ithaca，而且Ithaca不只能夠辨識古希臘文字，還能恢復損壞銘文上的文字，辨識來源位置，甚至是估算銘文被創建的年代。

Ithaca恢復文字的準確率達62％，並且能以71％準確率辨識來源位置，而且能精確的估算銘文年代，範圍限縮到30年間，歷史學家已經使用Ithaca重新評估希臘歷史的重要時期。

歷史學家透過古時候的文字，了解過去的文明，早在2500年前，希臘人就開始在石頭、陶器和金屬上書寫，紀錄租約、法律、曆法和神諭等各種內容，歷史學家可以透過這些文字，知道地中海地區以前發生的大小事。

這些歷史銘文在近幾個世紀以來，不少已經遭到搬移和破壞，現代的年代測定技術，又無法運用在這些材料上，使得銘文解讀困難且耗費時日。因此DeepMind與威尼斯卡福斯卡里大學合作，開發出用於解譯這些銘文的人工智慧Ithaca，Ithaca取名自荷馬奧德賽中希臘島嶼的名字，建立在DeepMind文字恢復系統Pythia之上。

Ithaca使用來自非營利性組織帕卡德人文學院，全世界最大的希臘銘文數位資料集進行訓練，DeepMind提到，自然語言處理模型通常使用多字詞進行訓練，因為字詞出現的順序、位置，以及之間的關係，提供了額外的含義和上下文資訊。

不過，因為歷史學家有興趣使用Ithaca分析的銘文多數已經損壞，而且丟失大區塊的文字，所以DeepMind為了使模型仍然可用，除了使用多字詞訓練之外，也使用單字來訓練，Ithaca模型核心的稀疏自注意力機制，會平行評估這兩個輸入，並根據需要用於預測銘文。

DeepMind也提供多種視覺輔助工具，讓歷史學家更容易解讀Ithaca的輸出，Ithaca會輸出多個文字恢復假設，供歷史學家以專業知識進行選擇，在地理位置歸因上，Ithaca會在地圖上顯示可能的分布機率，來顯示其不確定性，而且透過顯示多個可能的區域機率，也能夠讓歷史學家了解這些區域在古代，可能存在潛在地理關聯。

Ithaca在追溯銘文年代時，會產生公元前800年到公元800年，以十年為單位的預測日期分布，這使得歷史學家可以利用模型視覺化結果，提供更可信的判斷。Ithaca還會使用常見的電腦視覺技術，凸顯對預測結果貢獻最大的輸入，藉由顯示不同顏色強度，突出顯示影響Ithaca對缺失文字、位置和日期做出預測的單詞。

Ithaca協助修復文字的能力極佳，與研究人員合作的歷史學家，在單獨修復古代文字的時候，具有25％的準確度，但在使用Ithaca後，修復文字的準確度達到72％，這個結果凸顯了人機合作的潛力，能更好地推進歷史解釋，並建立歷史事件的相對年代。

透過Ithaca的幫助，目前歷史學家不認為重要的雅典法令，是在蘇格拉底和伯里克里斯等名人生活的年代所制定。長期以來，人們一直覺得這些法令是在公元前446/445年前制定的，但是經Ithaca的分析，新的證據表示這些法令制定是在公元前420年代。儘管年份差異不大，但是對歷史學家理解古代雅典政治史卻非常重要。

DeepMind與Google雲端和Google Arts & Culture合作，推出Ithaca免費互動版本，並且進一步開源程式碼、預訓練模型，以及互動式Colaboratory筆記本，與研究人員、教育者和博物館工作人員，共享這些研究成果。

熱門新聞