Amazon通用人工智慧研究團隊公布具備10億參數的語音合成模型BASE TTS,強調BASE TTS在語音自然度、文字錯誤以及英語人士說話相似度的表現上,優於YourTTS、Bark、TortoiseTTS等開源語音合成系統
2024-02-16
| IT周報 | 微軟 | 語音合成 | 程式開發 | Code Llama | 大型主機 | 公務員 | 生成式AI
AI趨勢周報第226期:微軟開源超強語音合成模型VALL-E X了
繼年初發表論文後,微軟終於開源語音合成模型VALL-E X了;Meta釋出程式開發語言模型Code Llama;IBM新生成式AI工具可將COBOL程式轉為Java;Google Workspace生成式AI助理Duet AI正式上線;公務人員使用生成式AI有法可循,國科會提參考指引
2023-09-03
| 語言障礙者 | Relate | App | 語音辨識 | 語音轉文字 | 語音合成 | Google語音助理
讓語言障礙的帕金森氏症、腦麻病患出門更容易與人溝通!Google新App能幫忙轉譯文字再合成語音唸出聲
為了讓語言障礙者說的話更容易被他人理解,Google發布一款Android應用程式Relate,目前在Beta版測試。這款App涵蓋三大功能,除了能將語言障礙者說的話正確轉譯為文字,還能以合成語音唸出,並串接Google語音助理來啟動相關操作
2021-11-13
| AI | 微軟 | 語音合成 | google | AutoML | 自然語言 | PDF | Nvidia | TensorRT | 推論 | 萊迪思 | 28奈米 | FPGA | IT周報
AI趨勢周報第114期:快又不漏字!微軟發表FastSpeech能更快產生逼真自然的語音
微軟發表FastSpeech仿真語音生成模型,可快速產生逼真的人類語音,解決語音合成速度緩慢的痛點。Google正式推出AutoML Natural Language,新增了PDF語意理解功能,還可支援5,000個分類標籤,訓練資料量最多可支援1百萬筆文件。Nvidia發表新一代深度學習加速的SDK TensorRT 7,透過優化的編譯器,來加速迴歸和Transformer模型的推論,比傳統CPU快10倍以上。
2019-12-19
| AI | 語音辨識 | 語音合成 | 臉部辨識 | LINE Brain | 商用AI產品
【語音辨識、語音合成和臉部辨識先推】LINE Brain商用AI產品明年要落地臺灣
明年初期先用於LINE臺灣內部服務,來蒐集更多用來優化機器學習模型的訓練資料,明年下半年再進一步開放給合作企業,將以食、衣、住、行類生活應用優先試用
2019-12-12
國產全球第一套針對中後期漸凍患者研發的智慧溝通系統,能用AI辨識腦波來判斷患者意圖
科技部科技突圍實驗專案中的「漸凍症病友智慧溝通系統」,目的要讓中後期漸凍症病患,在肌肉運動能力完全喪失的情況下,能透過科技來對外簡單溝通。
2019-08-16