台灣的中文語音輸入軟體技術上大致分為兩大「門派」,資策會「超級耳朵」及蒙恬「聽寫王」都是採IBM的核心技術。早在去年就推出「說亦通」語音辨識和「說會通」聲控軟體的大時科技,則是技術移轉自國科會的金聲三號,土洋大戰一觸即發。

今年在中文連續語音輸入軟體市場上真是熱鬧滾滾,繼年初資策會產品開發處推出「WinSpan SpeechPro」超級耳朵中文語音輸入軟體後,日前蒙恬科技推出「聽寫王」,聲碩科技「說亦通第二代」也即將上市,IBM則計畫在7月推出ViaVoice的零售版本。

台灣的中文語音輸入軟體技術上大致分為兩大「門派」,資策會「超級耳朵」及蒙恬「聽寫王」都是由IBM授權,採ViaVoice的核心技術。早在去年就推出「說亦通」語音辨識和「說會通」聲控軟體的大時科技,則是技術移轉自國科會的金聲三號,大時並在今年5月將語音事業部門獨立為聲碩科技公司,此外,宏碁電腦軟體事業部也是由國科會授權,發展聲控軟體。

這些語音輸入軟體各有特色,「超級耳朵」可辨識阿拉伯數字、中文街道名稱等,「聽寫王」則是國內第一套結合語音與手寫辨識的產品,「說亦通第二代」更結合原本的「說會通」聲控系統,成為連續語音輸入和聲控兼備的軟體。

大時科技是國內最早投入語音技術開發的廠商之一,大時並在今年5月將語音事業部門獨立為聲碩科技公司。聲碩總經理楊大衛表示,國內研究語音技術的導師首推台大教授李琳山,在85年時國科會將李琳山的研究成果開放給民間申請技轉,也就是金聲三號計畫,大時和聲碩就是承接自金聲三號技術。

楊大衛表示不擔心競爭者眾的問題,他認為目前台灣語音輸入市場幾乎是一片空白,只要會用到中文輸入的人都是潛在客戶,聲碩有了第一代產品的經驗,未來掌握市場將更為容易。

楊大衛也表示,語音開發是相當艱難的技術,人才十分難尋,聲碩不少研發人員都曾參與李琳山的研究,因此人才也是聲碩的競爭優勢之一。不過他仍希望多一些業者投入市場,共同加速商品化的腳步,以吸引更多人才研發語音科技。

語音技術「鼻祖」之一的IBM,投入語音研發已經有26年的歷史,IBM中文語音產品部經理陳佩欣指出,IBM對語音輸入市場採比較開放的策略,歡迎有意投入的業者和IBM合作,由IBM授權核心技術,合作廠商則開發其他功能及使用者介面(UI),或作特定領域的應用,如法律、金融、醫療等。

陳佩欣表示,除了連續語音輸入軟體外,目前也有不少業者有意和IBM合作研發其他的語音應用產品,如數位錄音機,可將錄下來的聲音直接數位化,應用在演講記錄等都很方便。

陳佩欣指出,ViaVoice技術應用在其他語言版本都有推出零售市場的產品,目前全世界售出超過100萬套,中文繁體字版今年4月起也隨IBM Aptiva桌上型電腦搭售,零售版也預計將在7月上市。他並不擔心市場競爭問題,他認為語音輸入還是很新的市場,新的產品需要多一些業者共同造勢,開發潛力無窮大。

目前這些中文連續語音輸入產品都是屬於硬體需求較「高檔」的軟體,除了CPU要求至少在Pentium 100以上外,32MB以上的RAM也是必備條件,軟體中也都會附上專用的耳機及麥克風。消費者在選購時,除了辨識率外,在訓練時間、錯字修改、周圍環境、套用的程式、加詞功能、速度等,都不妨比較看看。

熱門新聞

Advertisement