Google直接在手機部署機器學習模型,離線也能使用語音輸入文字
傳統語音辨識引擎使用的模型過於龐大,無法放在行動裝置上,Google參數化模型並在最佳化之後,能壓縮模型到只剩80MB
2019-03-14
| Mozilla | Common Voice | 資料集 | 語音辨識
Mozilla共享了語音群眾外包計畫Common Voice最新的結果,一個包含42,000人共18種語言的1,400小時語音片段資料集。
2019-03-01
協助聽力受損用戶溝通, Google推出即時提供字幕和聲音增強App
Google在Android系統推出即時提供字幕應用程式Live Transcribe和聲音增強應用程式Sound Amplifier
2019-02-05
該語音輸入解決方案就能捕捉以極低的音量所發出的話語訊號,除了說話時的氣流方式可能需要練習之外,其它的說話方式就如同耳語一般
2019-01-07
臉書的語音團隊釋出第一個全卷積的語音辨識系統,系統的可學習部分能僅由卷積層組成,而且效能可以與循環架構相當。
2018-12-26
AWS用新方法改良自然語言模型,讓Alexa語音辨識錯誤率降低15%
正確理解用戶所說的話,是語音助理服務致勝的關鍵,AWS最近透過新方法來改良自然語言模型,使Alexa的語音辨識錯誤率降低15%
2018-12-14
Google開源可準確辨識不同人聲的AI演算法,即時辨識多人對話挑戰賽中平均100句只錯7句
這個模型可以解決多人對談中的大難題,「誰在什麼時間說了什麼話」的語音辨識挑戰,在 NIST SRE 2000 CALLHOME基準測試中的最低錯誤率只有7.6%
2018-11-13
| Mozilla | 語音辨識 | Common Voice
捐出你的聲音! Mozilla開源語音資料專案Common Voice開始募集正體中文音檔
Mozilla開源語音資料庫專案Common Voice目前已收集超過900個小時的語音資料,其中以英語居多,並已釋出英文語音資料集的第一個版本供外界使用,6月開始該專案開始募集德語、法語的語音資料,並在6月底開始募集正體中文語音資料。
2018-07-19
| 微軟 | Microsoft Build 2018 | AI | 電腦視覺 | 語音辨識
Build 2018:微軟認知服務大更新,提供企業更多將產品AI化的工具
微軟最近針對自家旗下的認知服務進行一系列的更新,推出不少新功能,像是語音服務、Bing視覺搜尋、客製物體偵測模型等,要讓企業更容易將AI技術帶入自家產品中
2018-05-09