因應語音辨識蔚為風潮,Mozilla宣佈啟動第一個旨在訓練語音辨識app的開源資料集的群眾募資計畫Common Voice。 

這項專案在6月間釋出,目前已開始訓練階段。Mozilla指出,現今許多軟體大廠,包括Google、蘋果及亞馬遜都各自推出了語音辨識服務,喊了個指令就可以開始作業,似乎很方便,但是這種大廠控制的語音辨識生態圈卻可能扼殺了創新者的進入。 

一來,大廠只會著重特定英文、中文、西文等等主流語言,而忽略了使用者較少的其他語言。二者,這些生態圈產生的資料集也為大廠控制,使得也有意開發語音控制裝置的學生、新創公司及研究人員能存取的資料相當有限。 

Common Voice專案現在開始到秋天,邀請開發人員大聲誦讀句子以協助語音辨識引擎的訓練,貢獻量沒有上限,該計畫預計蒐集1萬小時的語音錄音檔,也可協助聽取驗證錄音檔的準確性 

Mozilla表示,資料量足夠後,預計2017年下半可以將Common Voice資料庫開源釋出,用以支援語音辨識裝置、app及作業系統的開發。

熱門新聞

Advertisement