Amazon Transcribe現支援中文語音辨識

Transcribe現在共支援16種語言,最新加入的語言為中文和俄文

2019-08-26

思科宣布將買下語音協作平台Voicea以協助會議紀錄

Voicea提供結合AI與自動化語音辨識的轉錄服務,能夠接受命令、執行任務,還可記錄會議重點,並分享這些資訊或建立可執行的描述

2019-08-13

工研院打造智慧照護機器人PECOLA,今年Q4將進安養院實測

工研院以一年多時間研發出智慧照護機器人PECOLA,鎖定獨居老人,以智慧家具樣貌呈現,不僅能辨識、分析老人飲食狀況,還可透過WiFi訊號來偵測老人睡眠與其心跳和呼吸率。今年第四季將於安養中心進行實測。

2019-07-26

Google更新即時語音轉字幕App,新增聲音事件和儲存文本功能

針對聽力受損者的需求,Google準備更新安卓系統的即時語音轉字幕應用程式,新增顯示聲音事件、在裝置端複製和儲存字幕3天等功能

2019-05-17

IBM研究院發布自動為新聞播報生成字幕的AI模型

IBM研究院利用長短期記憶網路和聲學神經網路模型,搭配輔助的語言模型,開發出自動為新聞播報生成字幕的模型

2019-05-15

AWS利用喚醒詞語音資料過濾背景音,使Alexa辨識錯誤率降低15%

AWS透過喚醒詞聲音快照,並將接隨後的語音與之比對,接收到的語音若與喚醒詞吻合,則將該語音視為Alexa要接收的語句

2019-04-23

AWS研究團隊找到改善Alexa語音和聲音辨識的新方法

AWS最近發表了兩篇改善Alexa語音和聲音辨識的論文,透過機器學習處理Alexa語音辨識的問題

2019-04-19

AWS針對吵雜環境場景,用半監督式學習提升語音辨識模型準確度

AWS運用半監督式學習方法,讓語音辨識系統即使在吵雜環境依然能準確辨識大量詞彙的對話

2019-03-21

Google直接在手機部署機器學習模型,離線也能使用語音輸入文字

傳統語音辨識引擎使用的模型過於龐大,無法放在行動裝置上,Google參數化模型並在最佳化之後,能壓縮模型到只剩80MB

2019-03-14

Mozilla公開全球最大公共領域轉錄語音資料集

Mozilla共享了語音群眾外包計畫Common Voice最新的結果,一個包含42,000人共18種語言的1,400小時語音片段資料集。

2019-03-01

協助聽力受損用戶溝通, Google推出即時提供字幕和聲音增強App

Google在Android系統推出即時提供字幕應用程式Live Transcribe和聲音增強應用程式Sound Amplifier

2019-02-05

微軟正申請「無聲」語音輸入專利,悄悄話也能辨識

該語音輸入解決方案就能捕捉以極低的音量所發出的話語訊號,除了說話時的氣流方式可能需要練習之外,其它的說話方式就如同耳語一般

2019-01-07