| AI | google | 深度學習 | 語音辨識 | 卷積神經網路

雞尾酒效應挑戰達成,Google打造出在吵雜環境能辨識特定人聲的模型

最近Google用深度學習建立了一套可以辨識特地對象聲音的語音辨識模型,在有許多聲音的複雜環境下,也能夠將特定人聲分離,單獨辨識每個人的聲音

2018-04-14

| AI | google | 機器學習 | 長短期記憶神經網路 | 語音辨識 | 語音轉文字

Google為影片、電話和虛擬助理量身打造語音辨識模型,提高語音轉文字準確性

Google最近更新了語音轉文字的服務,為影片、電話和虛擬助理的語音互動模式,打造專屬的語音辨識模型,要讓語音轉文字服務更加準確,此外,還加入了自動下標點符號的功能

2018-04-10

| AI | 語音辨識 | 微軟 | 語音轉文字 | 輔助學習

微軟用語音辨識將講課內容即時轉成文字,讓聽力受損學生學習無障礙

聽力受損的學生現在上課也有新的輔助工具了,微軟透過自動語音辨識技術,將教授於課堂上講述的內容,即時轉為文字,幫助學生更有效率學習

2018-04-09

| 機器學習 | 圖像辨識 | 語音辨識 | 深度學習框架 | 資料科學家

大幅擴充機器學習平臺,AWS推出建模、影片辨識、多國語言翻譯、語意理解等多項服務

AWS在今年的全球用戶大會,擴增多種機器學習的平臺與應用服務,透過提供開發者更容易使用的環境,以及支援多種深度學習框架與介面,瞄準實際應用需求已然起飛的AI領域

2017-11-30

| AI | 微軟 | 語音辨識 | CNN | RNN | Cortana

微軟語音辨識技術再突破!辨識能力超越專業聽打記錄員

去年10月微軟才宣布,語音辨識技術運用業界常用的電話對話錄音測試集Switchboard,錯誤率成功降至5.9%,與人類的辨識水準相當,近日又再突破,錯誤率已經降至5.1%,並且正式超越專業的聽打紀錄人員

 

2017-08-22

| google | 機器學習 | 自然語言 | 語音辨識 | API

Google 公開測試2項雲端機器學習API

開放測試的自然語言API可對不同語言的文本結構及意義進行分析,目前支援英語、日語、西班牙語三種語言,而同樣開放測試的語音辨識API,使用與Google Now及Google搜尋相同的語音辨識技術,支援80多種語言,可用於App或物聯網裝置上。

2016-07-21