| google | AI | Conformer | 語音轉文字

Google雲端語音轉文字服務採用Conformer新模型,將大幅提升辨識品質

Google雲端語音轉文字API,現使用融合CNN與Transformer的Conformer新模型,能夠明顯提升語音轉錄的精確度

2022-04-22

| google | API | 語音轉文字

Google雲端語音轉文字API加入視覺化介面,降低AI模型使用障礙

Google自動語音轉文字API現在提供用戶視覺化操作介面,以簡化使用API建置應用程式和服務的過程

2022-02-09

| Line臺灣 | CLOVA AI | OCR | 語音轉文字 | Chatbot

Line CLOVA AI產品中文化落地臺灣,今年新推CLOVA Note,CLOVA Chatbot更推出三種部署版本

Line臺灣發布CLOVA AI產品三大更新,除了陸續將產品中文化落地臺灣,CLOVA OCR新增了Table Extractor與角度自動校正功能,CLOVA Chatbot也推出三種部署方式,包括針對臺灣用戶客製化的混合雲版本,今年稍晚更要推出中文CLOVA Note語音轉文字服務

2022-01-27

| Meta | BERT | 語音轉文字 | 語音辨識 | AV-HuBERT

Meta開發能邊聽邊看的語音辨識模型,語音轉文字錯誤率大幅下降

Meta新的語言模型AV-HuBERT,能夠連結語音和影像中說話者的嘴唇動作,提升語音辨識抗噪效果,使單字錯誤率大幅下降

2022-01-11

| 語言障礙者 | Relate | App | 語音辨識 | 語音轉文字 | 語音合成 | Google語音助理

讓語言障礙的帕金森氏症、腦麻病患出門更容易與人溝通!Google新App能幫忙轉譯文字再合成語音唸出聲

為了讓語言障礙者說的話更容易被他人理解,Google發布一款Android應用程式Relate,目前在Beta版測試。這款App涵蓋三大功能,除了能將語言障礙者說的話正確轉譯為文字,還能以合成語音唸出,並串接Google語音助理來啟動相關操作

2021-11-13

| adobe | Creative Cloud | Photoshop | iPad | Illustrator | 神經網路濾鏡 | 語音轉文字

Adobe發布多項應用程式更新,不只將AI融入影像設計,更在Premiere Pro內建語音轉文字來自動上字幕

Adobe在今年Max大會中揭露多項由AI驅動的新功能,相較於去年來看,AI應用更進階深化,比如在Premiere Pro中首度亮相的語音轉文字字幕功能,以及Photoshop中的神經網路濾鏡,能用來調整人物眼睛與頭部轉向

2020-10-22

| google | 語音轉文字 | 方言 | 語音辨識 | AI

Google擴展雲端語音轉文字服務新增支援7種語言

雲端語音轉文字API現在支援機器學習模型訓練資料較缺乏的7種語言,包括愛沙尼亞語、烏茲別克語以及旁遮普語

2020-03-07

| 臉書 | BERT | 電腦視覺 | 自然語言 | 國發會 | 景氣 | AI科技基金 | 面試 | google | 語音轉文字 | 中原大學 | 智慧農業 | AI | IT周報

AI趨勢周報第115期:12合一!臉書AI研究院用一套ViLBERT模型,搞定不同類型資料集的ML訓練任務

臉書AI研究院日前聯手喬治亞理工學院、奧勒岡州立大學,用12個資料集訓練一套ViLBERT模型,不只可用來解決不同類型的電腦視覺與自然語言任務,參數還從30億個減少至2.7億個,準確度平均提升2分。另一方面,為更精準掌握景氣循環,國發會研擬開發一套景氣循環AI預警系統。此外,由國發會成率領民間團體成立的國家級投資公司台杉投資,明年計畫成立AI科技基金,同時要吸引國外AI技術團隊在臺成立研發中心。

2019-12-27

| 微軟 | 語音轉文字 | Transformer | 三星 | 對抗生成網路 | 臉書 | Pythia | 倫敦國王學院 | Nvidia | 智慧醫療 | JINS | MIT | 對話機器人 | 耐能 | AI晶片 | AI | IT周報

AI趨勢周報第86期:微軟發表文字轉語音新成果,只要少數樣本就能訓練出準確度99.84%的模型

微軟發表一款文字轉語音AI,只用共20分鐘長的200個音頻樣本及其文字檔,就開發出準確度達99.84%的模型。另一方面,三星近日發表一項AI研究,只需幾張臉部表情的影像,就能讓靜態的人物肖像開口說話。此外,日本平價眼鏡連鎖品牌JINS宣布引進JINS Brain AI智慧判讀服務至臺灣分店,來幫臺灣消費者「挑眼鏡」。

2019-05-29

| google | 語音轉文字 | 文字轉語音

Google AI語音服務大更新,不僅降價還新增7種語言和31種聲音

為了擴展AI語音服務的市場,Google除了加強語音辨識模型、語言支援數量和聲音種類之外,也調整了語音服務的價格

2019-02-22

| AWS | 語音轉文字 | 即時辨識 | Streaming Transcription

AWS自動語音辨識服務Transcribe推出即時語音轉文字功能

最近AWS公布自動語音辨識服務Transcribe,推出即時語音轉文字功能Streaming Transcription,讓使用者上傳一段語音到服務中,就能回傳即時辨識的文字稿

2018-11-21

| AI | google | 機器學習 | 長短期記憶神經網路 | 語音辨識 | 語音轉文字

Google為影片、電話和虛擬助理量身打造語音辨識模型,提高語音轉文字準確性

Google最近更新了語音轉文字的服務,為影片、電話和虛擬助理的語音互動模式,打造專屬的語音辨識模型,要讓語音轉文字服務更加準確,此外,還加入了自動下標點符號的功能

2018-04-10