語音辨識技術的應用在生活中並不陌生,電話自動語音系統就是其中一種應用。透過語音辨識技術與網路、汽車、手機等結合,可展現更多應用。IBM軟體事業處協理盧全一就舉例,語音辨識技術與客戶關係管理(CRM)結合,可讓語音辨識不再只是下指令,還能轉為實際執行動作,以能提升工作效率。
語音辨識的應用市場可分為兩部分:企業應用與消費者市場。過去的Call Center比較屬於被動式接聽,但是,語音辨識技術在行動裝置上有非常大發揮的空間,配合手機或E-Mail,可讓電話語音留言直接傳送到使用者身邊,不會耽誤到任何一項業務推進的行程。
IBM與昇陽就聯手合作推出VoiceXML,微軟也不甘勢弱的與Intel共同打造Speech Application Language Tags(SALT)與之抗衡。無論是IBM或是微軟都看好嵌入式系統上的語音辨識技術應用,微軟更於去年年中推出.NET Speech SDK,並且表明不支援VoiceXML。
IBM則為開發嵌入式廠商的中介軟體WebSphere Everyplace Embeded,並且也在2002年年底推出支援VoiceXML與Java的WebSphere Voice Application Access(WVAA),這些都能使程式開發人員更快更多的語音應用。
在消費者市場,盧全一表示,目前以語音輸入為最普遍的應用,像是華碩的筆記型電腦就曾搭售ViaVoice語音辨識軟體。他說:「語音辨識技術可以幫助使用者輸入文字,也有發音校正等功能。」日前,IBM就提供ViaVoice核心技術與總合科技合作,共同推出「IBM互動式全民英檢」軟體。
這套軟體主要是提供一套模擬的環境,共分5個等級,目前先推出初級、中級、中高級。盧全一說:「這套軟體就好像一個補習班,讓使用者先熟悉英檢考試的環境,並且可下載歷屆題庫,隨時練習。」
除了在電腦上的應用外,盧全一還提到:「在美國已經成功導入2003 Honda雅哥汽車的『Touch by voice』系統。透過GPS,駕駛員可以說出欲前往的地點,而系統也會在駕駛的過程中,以自動語音的方式提醒駕駛員左右轉等。」
蒙恬科技的語音辨識系統也來自於IBM的ViaVoice技術核心,蒙恬軟體研發部協理林宗範表示,蒙恬的TTS(Text to Speech)部分,已配合自動總機系統商合作實體出貨。在Voice Command部分,以「聽寫王」等產品在廣東與香港有很好的銷售成績。
但是,語音辨識技術在「聲音轉文字」的應用上,因受到環境與人聲變動的影響,目前辨識效果並不好。蒙恬要讓語音辨識技術朝安全領域發展,林宗範就舉例,未來手機功能會越來越強大,所隱藏的個人資訊將越多,透過辨聲系統可讓手機認主人,更可確保透過手機交易的安全性。
熱門新聞
2025-02-26
2025-02-25
2025-02-26
2025-02-24
2025-02-24