語音辨識 | Page 4

| google | 語音辨識 | 機器學習

Google直接在手機部署機器學習模型，離線也能使用語音輸入文字

傳統語音辨識引擎使用的模型過於龐大，無法放在行動裝置上，Google參數化模型並在最佳化之後，能壓縮模型到只剩80MB

2019-03-14

| Mozilla | Common Voice | 資料集 | 語音辨識

Mozilla公開全球最大公共領域轉錄語音資料集

Mozilla共享了語音群眾外包計畫Common Voice最新的結果，一個包含42,000人共18種語言的1,400小時語音片段資料集。

2019-03-01

| google | 語音辨識 | 輔助App

協助聽力受損用戶溝通， Google推出即時提供字幕和聲音增強App

Google在Android系統推出即時提供字幕應用程式Live Transcribe和聲音增強應用程式Sound Amplifier

2019-02-05

| 語音輸入 | 語音辨識 | 微軟 | 無聲輸入

微軟正申請「無聲」語音輸入專利，悄悄話也能辨識

該語音輸入解決方案就能捕捉以極低的音量所發出的話語訊號，除了說話時的氣流方式可能需要練習之外，其它的說話方式就如同耳語一般

2019-01-07

| GAN | 臺灣人工智慧實驗室 | AI基因分析平臺 | Google Brain | 機器人 | 滴滴 | RL | 派車 | 醫療影像標註資料庫 | IBM | 臉書 | CNN | 語音辨識 | Google Lens | AI | IT周報

AI趨勢周報第70期：韓研究員開發圖像轉換系統InstaGAN，讓照片人物長褲換短裙

韓國研究員用生成對抗網路（GAN）開發一套圖像轉換系統InstaGAN，可將照片中人物穿著的褲裝，轉換為短裙，或將風景照中的羊群，變成一群長頸鹿。

2019-01-03

| 臉書 | 卷積神經網路 | 語音辨識

臉書開源第一個使用卷積神經網路技術的端到端語音辨識系統

臉書的語音團隊釋出第一個全卷積的語音辨識系統，系統的可學習部分能僅由卷積層組成，而且效能可以與循環架構相當。

2018-12-26

| AWS | Alexa | 自然語言理解 | 語音辨識

AWS用新方法改良自然語言模型，讓Alexa語音辨識錯誤率降低15％

正確理解用戶所說的話，是語音助理服務致勝的關鍵，AWS最近透過新方法來改良自然語言模型，使Alexa的語音辨識錯誤率降低15％

2018-12-14

蘋果如何用AI讓HomePod上的Siri聽得到你說什麼？

智慧音響HomePod置於家中任一位置，使用者可從遠處呼叫Siri，再加上家中的背景噪音，蘋果要如何去除背景噪音，讓HomePod聽清楚使用者的指令？

2018-12-05

| 語音辨識 | google | AI | 神經網路

Google開源可準確辨識不同人聲的AI演算法，即時辨識多人對話挑戰賽中平均100句只錯7句

這個模型可以解決多人對談中的大難題，「誰在什麼時間說了什麼話」的語音辨識挑戰，在 NIST SRE 2000 CALLHOME基準測試中的最低錯誤率只有7.6%

2018-11-13

| Mozilla | 語音辨識 | Common Voice

捐出你的聲音! Mozilla開源語音資料專案Common Voice開始募集正體中文音檔

Mozilla開源語音資料庫專案Common Voice目前已收集超過900個小時的語音資料，其中以英語居多，並已釋出英文語音資料集的第一個版本供外界使用，6月開始該專案開始募集德語、法語的語音資料，並在6月底開始募集正體中文語音資料。

2018-07-19

Computex創新應用直擊：智慧應用更多元，農業、家居、寵物、減肥、刷牙都能用

Computex臺北國際電腦展其中有一區InnoVEX新創特區，展示許多新奇的智慧應用，包括智慧農業預測系統，藉由感測器數據分析和AI技術、智慧寵物玩具球，以及鼓勵兒童運動的智慧手錶、以Wi-Fi連線的智慧牙刷、不用寫程式的機械手臂教導系統，還有可離線執行的Deep Force影像辨識和snips語音辨識系統等。

2018-06-11