| BASE TTS | Amazon | 語音合成

Amazon訓練歷來最大的語音合成AI模型BASE TTS

Amazon通用人工智慧研究團隊公布具備10億參數的語音合成模型BASE TTS,強調BASE TTS在語音自然度、文字錯誤以及英語人士說話相似度的表現上,優於YourTTS、Bark、TortoiseTTS等開源語音合成系統

2024-02-16

| IT周報 | 微軟 | 語音合成 | 程式開發 | Code Llama | 大型主機 | 公務員 | 生成式AI

AI趨勢周報第226期:微軟開源超強語音合成模型VALL-E X了

繼年初發表論文後,微軟終於開源語音合成模型VALL-E X了;Meta釋出程式開發語言模型Code Llama;IBM新生成式AI工具可將COBOL程式轉為Java;Google Workspace生成式AI助理Duet AI正式上線;公務人員使用生成式AI有法可循,國科會提參考指引

2023-09-03

| 語言障礙者 | Relate | App | 語音辨識 | 語音轉文字 | 語音合成 | Google語音助理

讓語言障礙的帕金森氏症、腦麻病患出門更容易與人溝通!Google新App能幫忙轉譯文字再合成語音唸出聲

為了讓語言障礙者說的話更容易被他人理解,Google發布一款Android應用程式Relate,目前在Beta版測試。這款App涵蓋三大功能,除了能將語言障礙者說的話正確轉譯為文字,還能以合成語音唸出,並串接Google語音助理來啟動相關操作

2021-11-13

| IT周報 | AI國力 | 語音合成 | 程式碼生成 | 通用影像辨識 | EdTech | 華碩

AI趨勢周報第177期:深化AI國力,美跨司法、國防、商務部組隊給總統與聯邦機構建議

美國商務部近日跨司法、國防、商務部門等單位籌組國家AI諮詢委員會,要針對美國AI競爭力現狀等議題來給建議;臉書新語音合成模型完全不需文字訓練資料!Salesforce開源程式碼生成器;Uber詳解開源大數據分析平臺省錢關鍵;語言學習App打造模型預測使用者答對機率,要動態調整題目難度。

 
 
 
 

2021-09-15

| Nvidia | 語音合成 | 對話式AI | 預訓練模型

虛擬黃總還不夠,Nvidia新技術連語音都合成得唯妙唯肖

Nvidia前陣子才揭露,今年GTC大會上的創辦人黃仁勳演講有14秒是「虛擬」登場。最近,Nvidia應用深度學習研究部門副總裁Bryan Catanzaro親自上線說明,GTC大會中穿插的旁白,也是虛擬合成的聲音。這是Nvidia首次對外說明對話式AI研究進展。

2021-09-01

| AI | 微軟 | 語音合成 | google | AutoML | 自然語言 | PDF | Nvidia | TensorRT | 推論 | 萊迪思 | 28奈米 | FPGA | IT周報

AI趨勢周報第114期:快又不漏字!微軟發表FastSpeech能更快產生逼真自然的語音

微軟發表FastSpeech仿真語音生成模型,可快速產生逼真的人類語音,解決語音合成速度緩慢的痛點。Google正式推出AutoML Natural Language,新增了PDF語意理解功能,還可支援5,000個分類標籤,訓練資料量最多可支援1百萬筆文件。Nvidia發表新一代深度學習加速的SDK TensorRT 7,透過優化的編譯器,來加速迴歸和Transformer模型的推論,比傳統CPU快10倍以上。

 

2019-12-19

| AI | 語音辨識 | 語音合成 | 臉部辨識 | LINE Brain | 商用AI產品

【語音辨識、語音合成和臉部辨識先推】LINE Brain商用AI產品明年要落地臺灣

明年初期先用於LINE臺灣內部服務,來蒐集更多用來優化機器學習模型的訓練資料,明年下半年再進一步開放給合作企業,將以食、衣、住、行類生活應用優先試用

2019-12-12

| AI | 漸凍症 | 腦波 | 語音合成

國產全球第一套針對中後期漸凍患者研發的智慧溝通系統,能用AI辨識腦波來判斷患者意圖

科技部科技突圍實驗專案中的「漸凍症病友智慧溝通系統」,目的要讓中後期漸凍症病患,在肌肉運動能力完全喪失的情況下,能透過科技來對外簡單溝通。

2019-08-16