Google上周(15日)在北京發表手機上的中文語音搜尋(Google Mobile App內建功能),可以讓使用者以語音代替按鍵輸入,來搜尋網站內容。

Google全球副總裁Vic Gundotra承諾:「未來這項語音辨識技術,將成為Android SDK的元件。任何開發者都可以利用這項技術來整合其他應用,完全免費。」

Google Mobile App是Google為手機打造的一套手機應用程式,去年推出了英文語音搜尋功能,可以讓使用者用英語口語來搜尋網站內容,不需要手動輸入。現在,Google終於推出第二種語言的版本,也就是中文的行動語音搜尋。

手機會錄製使用者說的話,將聲音傳到雲端伺服器中,來辨識出搜尋網站要用的中文字。

使用者只要點選搜尋框旁邊的麥克風按鈕,就可以開始錄製使用者說的話,Google Mobile App會把聲音傳送到Google伺服器中進行語音辨識。再將辨識出來的文字,自動傳到搜尋引擎中,最後,將找到的網站內容傳回到使用者的手機螢幕上。

Google臺灣區總經理簡立峰表示,因為語音辨識需要大量運算處理,藉由雲端伺服器的運算能力才得以實現。整個辨識過程包括兩個階段,首先是聲音辨識(Voice),其次是文字辨識(Text),前者利用語音資料庫來辨識,後者則是使用了Google大量的使用者搜尋記錄。

當手機將使用者聲音檔上傳到伺服器後,會先和聲音資料庫比對,找出使用者講的內容是資料庫中的哪句話。為了能辨識出各種不同的口音,Google蒐集了各種口音的聲音資料,目前以北京、香港、臺灣等地大都市的口音資料居多。

雲端伺服器辨識出使用者所講的聲音內容後,下一步要辨識聲音所對應的文字內容。因為中文有很多同音字,同一句聲音有很多種不同的文字內容,所以,Google利用搜尋引擎的查詢Log記錄,找出最常用的文句作為使用者想要輸入的內容。

Vic Gundotra指出:「語音搜尋成功的關鍵是精確性,這項中文語音辨識技術利用了大量使用者檢索Google的歷史資料,來優化正確性。」越常被搜尋的關鍵詞,語音辨識的正確率就越高,不過,特殊領域的專有名詞就反而不容易被辨識出來。

除此之外,這項語音辨識技術進一步利用使用者修正來提高語音辨識的正確率。領導語音辨識開發的Google產品經理Gummi Hafsteinsson表示:「當語音辨識結果和使用者的預期不符時,系統會列出可能的文字清單,讓使用者選擇正確的項目。所有使用者選擇的修正結果,都會累積到語音辨識系統的資料庫中,讓未來的辨識結果更正確。」

不過,因為中英語所採用的辨識演算模式不同,Google表示,目前還無法混用,使用者必須切換語系來選擇要採用哪一種語音搜尋功能。另外,因為語音辨識的運算都需要雲端伺服器來處理,所以,手機必須連上網路才能使用,無法搜尋本地端內容。

Vic Gundotra表示,幾周後會正式推出中文語音搜尋,先支援Android、iPhone和Symbian S60作業系統的高階手機,但Android SDK提供語音辨識元件的時間則還未決定。文⊙王宏仁

熱門新聞

Advertisement