「Via Voice」系統基本要求是Pentium100以上的機器,但是最好是用Pentium166 MMX以上,才能有比較高的辨識率。

「Via Voice」是IBM公司開發出來的一套語音輸入法,目前已開發出美國英語、英國英語、法語、德語、西班牙語、義大利語、日語等七種語言的產品,預計四月份第八個開發的語言產品-中文語音輸入,會先跟IBM的個人電腦一起併售。

在語音輸入法方面,「中文」的語音輸入法可以說是困難度比較高的,主要的原因是中文的同音字詞太多了,同樣的發音可能有不同意義的字詞符合。以使用「微軟新注音」或是「漢音注音」等輸入法為例,這些輸入法會依使用者的前後文,自動幫使用者挑出適當的字詞,就算注音的拼法都沒錯,也會常常挑到不是使用者所要的字詞。而語音輸入在這方面的困難度就更大了,每個人的發音都不盡相同,甚至會有錯誤的語音,平常人與人談話可以允許一些語音上的錯誤,但是電腦就沒有辦法了。

為了彌補因為發音習慣所造成的差異,一般的語音輸入法都要建立使用者個別的「語音」資料庫。透過這個語音資料庫的建立,可以讓系統更容易聽懂使用者的口音,尤其是像一些有台灣國語口音的使用者,或像是對「之」「茲」之類的發音不正確的使用者來說,語音資料庫的建立,能大大的提高語音輸入法的辨識率。「Via Voice」的「語音適應」提供個255個句子,讓使用者建立個別的語音資料庫,並可以讓系統針對不同的語音資料庫進行語音適應訓練。

除了口音之外,說話的速度與口齒的清晰也會影響到語音輸入的辨識率,一般來說,說話速度大約在每分鐘80-120個字之間,會有比較高的辨識率。語句必須保持連貫不能吞吞吐吐,不要有拖音或語助詞。此外,標點符號也是透過語音輸入,標點符號的使用會影響辨識的效果,因為詞句的選用是比照前後的文字關係,善用標點符號來可以讓詞句的選用更正確。

一套語音輸入法的成敗,可以說完全取決於「辨識率」的高低。在安裝「Via Voice」時,安裝程式會自動偵測你的系統是否為Pentium166 MMX以上的機器,如果不是,安裝程式會出現警告訊息,提示你的系統效能不夠,可能會影響辨識率。筆者分別在Pentium133以及Pentium266的機器上測試這套軟體,辨識率差別相當大。除了「人的因素」以及「CPU的要求」之外,「麥克風」與「音效卡」也會對辨識率產生影響,比較好的麥克風可以過濾掉一些雜音。

「Via Voice」的語音輸入介面是一個類似「Wordpad」編輯器的「語音版」,不管是要輸入到郵件軟體或其他的編輯器,都必須先在「語音板」上輸入,再依「複製-貼上」的步驟,將由語音輸入的文字貼到你要使用的軟體上,或者你也可以把透過語音輸入的文字存成檔案,其所支援的檔案格式包括「Word6.0」、「純文字」以及「RTF」等三種檔案格式。

另外,「Via Voice」並不能口語輸入英文,必須透過鍵盤輸入,這對某些需要或喜歡中英文夾雜的文章來說,可能就比較麻煩了。

熱門新聞

Advertisement