去年,中研院打造一套了具有深度理解能力的對談系統,不只能理解中文,還能解答小學數學題(如上圖),就連整個數學算式推導過程,都可以完整在答案欄上寫出,就像人類在試卷紙上作答那樣。

圖片來源: 

攝影/余至浩

「小明有20元,小明有5顆蘋果,小華有10顆蘋果,一顆蘋果2元,小明買給小華4顆蘋果,小華吃了一顆,小華剩下幾顆蘋果?」這道小學數學題,你能馬上回答的出來嗎?但是中研院的中文AI對話引擎可以。

臺灣自然輸入法發明人許聞廉表示,因為中文特性,使得語意分析的重要性比國外更重要,這也是以中文為母語的臺灣在地的競爭優勢。 攝影/洪政偉

去年,中研院智慧型代理人系統實驗室著手打造了一套具有深度理解能力的對談系統,不只能理解中文,還能解答中文描述的小學數學題,正確解出這道數學題的答案是「13顆蘋果」,甚至還可以在答案欄上完整推導運算過程求得答案,就像人類在試卷紙上作答那樣。就算將題目臨時改成「小華蘋果不是10顆,而是8顆,答案是多少?」也都難不倒它,而背後一手打造這套系統的關鍵人物,正是中文自然輸入法發明人,也是現任中央研究院資訊科學研究所特聘研究員許聞廉。

長年在臺從事中文自然語言研究多年的許聞廉,不只是臺灣最早開發出具備中文語意分析能力的自然輸入法的發明者,更是帶動臺灣電腦中文化普及的重要推手。

不同於倉頡等其他中文輸入法,許聞廉開發出的自然輸入法,因為能依照上下文選取同音字,大幅改善了過往以來的中文輸入句子的重音字或搶字難題,所以,1992年一推出就獲得熱烈回響,短短數年內就衝破百萬次下載,即使如今已快屆滿30年,很多企業或個人用戶都仍是它的愛用者,將它當作是辦公室或家中電腦常用的鍵盤打字輸入工具。

但為何會想打造一套臺灣在地的中文注音輸入法?許聞廉回答也很簡單,「就是因為自己需要用到。」他表示,1980年代當時IBM的電腦一推出,顛覆整個文書處理作業方式,從傳統打字機,轉變成以PC為主的鍵盤輸入,但是一直缺乏一個好用的中文輸入法,可以讓他在電腦上流暢打字。於是當時還在國外大學教書的許聞廉,便決定在1989年回臺進到中研院,負責中文輸入法的開發,甚至連鍵盤都自己從頭設計一個專用中文輸入鍵盤,更花了4年時間開發推出首版自然輸入法。

早在10多年前,許聞廉在開發中文自然輸入法時,就已開始結合中文語意分析技術,用於自動選字,讓使用者打字時,只要輸入音節、聲調,由機器依據前後句子,來自動幫你選出適當的用字。

早期中文自然輸入系統,多採用預先寫好的規則腳本來選字

不過,許聞廉表示,早期的中文輸入系統,需透過預先寫好的規則腳本,來判斷前後句子的常用字來自動選字,雖然並未結合機器學習,但也開始採用統計分析方式,來計算出一句話裡的每個字詞組成的出現機率,這也是後來自然語言機器學習技術的發展基礎。

以中文自然輸入法來說,一開始語料庫的建立,是來自紙本新聞,總共蒐集了超過700萬個中文字詞,轉換成電腦可讀的形式,來建立中文語意規則,再套用到注音輸入法的選字規則上。例如,皮膚「科」與「柯」醫師,注音同樣都是念ㄎㄜ,但句子左邊銜接的名詞輸入是皮膚時,經由統計機率的分布,得出指的是看診分類的「科」,就會寫成一種規則,以後當出現類似的前後句子,就會選出這個字;反之,醫師在句子右邊,則是指人名的「柯」,以此類推。

他表示,第一版中文自然輸入法推出時,大約設計了數千到近萬個規則排列,已經可以做到中文自動選字、自動校正。只不過,他坦言,當時的中文輸入系統,在語意分析處理上,還無法像現在的處理量這麼龐大,反應速度也不夠快,常常輸入一個字,就要等待許久,以注音輸入常用的「是」為例,光是同義字就有100多個字,但一開始這套輸入法系統全部安裝完也只才700KB,因此,輸入完常常得等待數秒,經過數十個判斷規則,才能找到正確的用字。或是也無法做到需要更複雜的前後語句判斷來選字。

1992年自然輸入法推出後,至今歷經20多年演進,經過10多次大小改版,除了原有的語意核心之外,也不斷地修正、改進輸入法的中文語意分析能力,來提升選字正確率,甚至也改安裝在運算力更強的硬體上執行,而且還能跨不同作業環境,除了微軟Windows,也支援了蘋果Mac OS。

不只是中文輸入,許聞廉後來也將中文語意分析技術,用來建立一套自動問答系統。雖然一開始功能還很陽春,只能回答基本題,但已跨出臺灣中文自然語言技術發展的一大步,除了先在中研院內部使用,來回答有關中研院生活資訊相關事項,2000年時,他更與寶來證券合作,讓這套問答系統能以網路客服形式來回答用戶提問,也是當時最早推出自動問答服務的企業網站。後來還採更進階統計分析的機器學習方法,來協助語意規則的建立,以提升中文問答能力。

大約2010年以後,類神經深度學習技術的出現,則是更進一步了帶動自然語言處理技術的更大突破,從大量語料學習不同詞彙所要表達的語義,來達到語意的理解,也是當前自然語言處理最熱門的研究。

雖然深度學習技術有其發展優勢,不過,許聞廉表示,不像影像辨識,不需要用到理解,所以深度學習可以發揮出很好的效果,「但換成是辨識中文語意,要做到自然語言理解需要的語意分析,達到中文理解面,深度學習就不太行,特別是在處理需要包含推論的多輪式對談上。」他說。

他進一步說明,因為深度學習是以數學函數來表達學習到的建構模式,缺乏對於文字本身語法、語義分析,還有背景知識的理解,僅通過從大量中文語料學習,而沒有經過任何複雜的語法拆解、語義分析等語意理解過程,一旦遇到需要理解力的問題時,機器就很容易看不懂。

以一個簡單數學題為例,「當你身上有100元,父親再給了你20元,就能買一輛腳踏車,所以腳踏車多少錢?」,因為敘述中出現「再給」的用語,代表「金額增加」的概念,所以答案是介於100元到120元之間,一般人理解上很容易,但是機器要回答就不是容易的事,「而只有當機器給出了正確答案,才代表它看懂這句話的意思,也就達到了理解。」他說。

中研院研發國產AI問答引擎,連數學題也能作答

為了讓AI做到理解面,許聞廉與實驗室團隊自去年起也採用了新的語意理解技術,來設計出新一代問答系統,來打造出一套具備深度中文理解能力的全新問答系統。

有別於傳統問答系統,他表示,這代問答系統採用了準則式(Principle-based)語意理解技術,這是一個全新的機器學習語言模型,尤其適合用在語意相似的描述,可以有更清楚的分辨力,結合了傳統規則式(Rule-based)與統計(Statistical)兩類作法的優點,不只能對於題目進行分析,能看懂每一個句子給出的假設條件,還能理解句子背後隱藏的意圖,才能在看完一連串敘述後,由已知條件推導正確回答出「小華剩下13顆蘋果」的答案,即使換個問法也難不倒它。「這也是機器要學習最困難的地方,」他表示,截至目前,這套系統已經能夠自動解答小學三年級的數學應用題,可以扮演起教學助理的角色,來幫助小學生更容易學習。未來還有英文版本。

除了自動問答以外,近年來,語意分析技術也被用在具備有對話式、自動化的Chatbot(聊天機器人),或是會講話的智慧喇叭。這些輸入介面或操作方式的不同,也帶來中文自然語言處理上的一大挑戰。

以中文語音輸入為例,許聞廉認為,就比注音輸入在語意分析處理上,更容易造成混淆,而影響了辨識的正確率。例如注音輸入,是以音節、聲調的抑揚頓挫來在鍵盤上選字,但改用語音輸入後,以口說的方式將聲音轉成文字,很容易會受到外在環境的影響,例如說出一個音節,機器可能聽錯成3個不同高低聲調,混淆度就增加為原本的3倍,如此一來,辨識的準確度就可能會受影響。

尤其,中文的語法結構鬆散,以達到雙方溝通為目的,一句話有時可以出現複數動詞、倒裝語序,或是省略用法,但英文就不行,這些語言上的用法差異,造成中文比英文更難理解,人類學習是如此,機器當然也是。

「這也是以中文為母語的臺灣的競爭優勢,」許聞廉指出,要做到中文的理解面,語意分析能力就十分重要,必須是要對於中文句子背後的語法、語義分析,還有背景知識結構有清楚透徹地了解,才可以把中文自然語言系統做得更好。也正是因為中文特性,使得中文語意分析的重要性比國外更重要,不像英文語句有很多剖析方式,可以提升它的正確率,但中文就不行,他強調:「中文自然語言技術是臺灣在地AI很重要的基礎力。」

對於近兩年,語音辨識、語音互動等語音應用在全球迅速竄紅,也吹進臺灣,甚至不少專家都預言,語音輸入將會是未來各種應用程式或裝置的下一代互動介面,甚至可能會取代鍵盤,但許聞廉則持不同看法,他反倒認為,兩者將會併存,並不會因為有了語音輸入,以後就不需要鍵盤。

他解釋,語音輸入有其便利性,尤其是在不適合攜帶或放置鍵盤的地方,就很適合用它來操作,例如家中廚房、汽車等,但如果是需要大量文字輸入為主的中文輸入作業,未來仍需鍵盤輔助。整理⊙李岷錡、文⊙余至浩

 

專家小檔案

許聞廉

● 職稱:中央研究院資訊科學所特聘研究員

● 研究團隊: 智慧型代理人系統實驗室

● 代表成果:1992年發明自然語言輸入法

● 最新進展:2018年新一代問答系統,能理解和解答中文描述的小學數學題

熱門新聞

Advertisement