臺灣去年下半開始出現多款能講中文的智慧喇叭,而且除了中國品牌,也有不少是來自臺灣自有品牌,包括遠傳「愛講」、鴻海「小度」,以及華碩「小布」智慧喇叭等,但裡面裝的卻都不是臺灣自行發展的中文AI語音引擎,而是用國外引擎,如遠傳「愛講」搭載的是中國出門問問的語音引擎。(攝影/蘇文彬)

不同於搭載Alexa數位語音助理的Amazon Echo或是Google Assistant的Google Home智慧喇叭,現在還只能說英文,或其他非中文語言,臺灣去年下半開始出現多款能講中文的智慧喇叭,而且除了中國品牌,也有不少是來自臺灣自有品牌,包括遠傳「愛講」、鴻海「小度」,以及華碩「小布」智慧喇叭等,能用臺灣民眾熟悉的中文回應用戶的提問,或回答各種生活資訊,還能陪你閒聊。

明明是臺灣在地喇叭,骨子裡卻是用國外語音AI引擎

只不過,如果細心留意的話會發現,這些市面上已經買得到的智慧喇叭,有的聽起來中文有些怪怪的,例如早上打招呼會說「早上好」,設定待辦事項則回你:「已為您建好鬧鐘」,還會略帶點卷舌音,問他「賈伯斯是誰」,則要改說:「喬布斯」它才聽得懂,因為是中國品牌的智慧喇叭,不論是小米「小愛同學」、獵豹「小豹」等,都是用中國的AI語音引擎。

但就算是臺灣目前已經上市的3款國產智慧喇叭,大多裝的也都不是臺灣自有的中文AI語音引擎,如遠傳愛講使用中國出門問問的AI語音技術,鴻海小度則是內建百度的AI對話引擎,截止目前只有華碩一家是採用自有技術。

連在家使用的民眾自己可能都搞不清楚,每天對著自己講話的喇叭,骨子裡裝的竟是國外或中國語音引擎。 乍看之下,常有人以為臺灣沒有在地化的中文AI語音引擎,所以臺灣廠商要開發自己的聲控裝置時,就只好選用國外的語音引擎,因為臺灣自己沒有,就只能從國外找,或是認為臺灣跟不上國外語音技術的發展腳步,這是不得不的作法。

更有國內智慧喇叭業者當面坦言,在臺灣很難找到一套成熟可用的中文AI語音引擎,可協助他們儘快將產品推出上市,只能用國外的中文辨識引擎,尤其是中國製的語音技術,因為處理中文語意理解問題,廠商多半在中國,如科大訊飛、百度等,臺灣企業很容易就會採用中國製的中文AI語音產品。

臺灣AI技術實力並非一定就不如國外,只是一直以來沒有被發掘,所以很多人都不知道,或也不被大家所重視,但其實臺灣一直有在持續發展在地化AI技術,尤其是中文自然語言理解(Natural Language Understanding,NLU)技術,也是現在臺灣企業發展AI應用最優先也是最關鍵的一步。

語言技術天生就是一種在地化應用

不像瀏覽器或作業系統軟體,語言科技有它本身的特殊性,深受在地化的影響,因為語言應用和使用上,在不同的國家或地域差異性很大,即使是臺灣和香港,同樣說中文,用語和說話方式還是會不一樣,會有自己專屬的用詞、使用習慣,所以語言應用要做得好,就一定要用在地的資料,甚至只有靠自己做,才有辦法讓它貼進自己在地風格,符合你的需求,因為只有在地人才最清楚自己使用習慣、說話用語。哪怕是之前在Zenbo機器人使用Google語音技術的華碩,現在也都決定智慧喇叭全面改成自有技術,不再使用國外語音引擎。

因為語言科技就是一個需要高度在地化的應用,用來理解在地的這群人所用文字或說話習性。如果是用別的國家訓練出來的語言引擎,就會很難做出符合這個國家所需要的在地應用。所以就連遠傳要將中國AI語音引擎,拿進來臺灣都還要自己用在地語料訓練過,不能直接套用。

另從技術應用需求來看,語言技術更是未來所有企業都需要,甚至所有IT都會用到的一門技術,因為它就是下一代UI(使用者介面)。以前要把介面改成中文化,只要支援中文編碼,就能讓視窗介面裡的字體呈現中文字,現在更進一步做到理解面,必須要能夠支援中文自然語言理解技術,才能讓這個語音介面有辦法跟你說中文。因為語意理解是一個在地技術,必須要用在地語料才能做得好,如果用的都不是在地的語意理解技術,以後沒有符合臺灣在地需求的中文引擎,不論是介面或程式,就很難普及。

用在地語料發展NLU,臺灣產業Chatbot用最早

不論是用文字或語音表達語言,都需要自然語言理解技術,當機器人理解人類輸入的語句後,便會選擇對應的句子來回應,或是依指令執行特定任務。也不分是在聊天軟體內的Chatbot(聊天機器人),或是會講話的智慧喇叭,都是相同的原理。

以文字自然語言理解發展來說,臺灣企業其實早從3年前就開始使用中文自然語言技術,來開發出具備有對話式、自動化的Chatbot,來取代傳統人工作業手段,例如,金融業、零售業、社群媒體等都有。

不過,企業在設計自家Chatbot應用時,剛開始主要還停留在FAQ式問答,多用於行銷與客服,即是透過預先寫好的規則腳本,只能對指令與關鍵詞做出回應,或只懂垂直領域的知識,但是到後面,不少企業開始透過結合自然語言理解、機器學習技術,來增加Chatbot的中文對話互動能力,學習理解使用者意圖,讓Chatbot使用者不會覺得互動過程過於呆板,或流於制式,甚至更進一步採用深度學習技術,來建立更複雜自然語言理解模型,藉此來達到更自然地對話互動方式。例如上下文理解,或是多輪式對話等,也讓臺灣Chatbot發展更為多元。

又如臺灣最大部落格平臺痞客邦,近來也打造出一個能推薦附近周圍的美食Chatbot,靠的就是利用20萬篇網路食記文章,近3千家熱門餐廳資料,經過一段時間的語意辨識NLU模型訓練,現在已能做到依據輸入語句來評價這家餐廳食物、服務或環境的好壞,想要找哪裡有好吃餐廳的人就可以問它。

甚至也有越來越多臺灣本土Chatbot廠商加入,提供企業更多客製化Chatbot,或是各種Chatbot自動化編排工具,讓企業可以更容易用它開發自己的機器人對話應用,而且不只大型公司,專攻Chatbot的臺灣AI新創也不少,如碩網、優拓等,很多都是利用在地語料來打造中文在地NLU引擎,用於提供不同行業領域知識的Chatbot所用。隨著臺灣Chatbot生態系成形,也帶動臺灣中文NLU技術發展,往前邁出一大步。

文字語言之後,緊接下來,語音也因為自然語言理解技術,逐漸在AI對話應用上嶄露頭角,加上語音辨識技術的成熟,開始讓Chatbot互動介面,可以做出更多不一樣的變化,不再只能透過傳統對話視窗打字互動,使用者也能對著它講話,Chatbot依據聽到的語句,理解之後再回答對方問題。

近年來,臺灣也開始有些廠商推出語音Chatbot應用服務。例如2015年成立的竹間智能科技,是由前微軟亞洲互聯網工程院副院長簡仁賢一手創辦,他曾是中國微軟小冰研發背後重要推手,幾年前也回到臺灣,決定要發展在地的中文AI理解引擎,不只文字,現在也能用於電話的中文語音Chatbot客服,還可以依據上下文理解進行多輪對話,目前臺灣也有幾家金融業者在測試。

【業界觀點】臺灣AI實驗室創辦人杜奕瑾:別讓臺灣淪為AI技術代工廠

「語音介面取代,以後會越來越多。」臺灣AI實驗室創辦人杜奕瑾指出,未來人機介面,勢必朝向自然語言對話(Natural Conversation)發展,以後任何應用程式,或裝置互動介面,只要想做到自然口語,就一定會需要在地語音辨識能力。

尤其,語音辨識、中文自然語言理解都是一種高度在地化的技術,需要理解當地這群人的文字、詞彙用語及說話習慣,才能辨識得更準確,甚至只有在地人自己做,才能做到符合在地需求的應用,這也是臺灣發展在地AI技術力的機會。

過去,臺灣一直沒有像美國這樣的軟體產業,所以只能一味跟著國外的腳步走,但是AI與IoT的崛起,將使得全球產業重新再洗牌,杜奕瑾也呼籲,這時候臺灣不能再是大老二文化,只有代工思維,應該把這些軟體核心技術掌握在自己手中 ,「不要讓臺灣再度淪為AI技術的代工廠。 」

熱門新聞

Advertisement