語音合成 | iThome

MedTech醫療科技雙周報第41期：用想的就能說話，最新技術可即時合成更自然的語音

美國研究團隊突破語音腦機介面延遲瓶頸，開發出可即時將大腦訊號轉為語音的技術；衛福部揭健康臺灣深耕計畫，鎖定智慧科技醫療等4領域；Google DeepMind揭露3項蛋白質結構預測應用；FBI警告醫療健康等產業業者小心Medusa勒索軟體

2025-04-07

| 聯發科 | AI | LLM | 語音合成 | 函式呼叫 | G2PW | Decision Token | 繁中

聯發創新基地一口氣釋出2款繁中多模態語言模型、1款臺灣語音合成模型，他們揭露幾個技術關鍵，像是採用LLaVA架構增添多模態能力、使用低學習率以保留基礎模型優點、建置大量繁中資料集，以及透過Decision Token來增強模型呼叫函式的判斷力、用G2PW來準確判斷讀音等。

2025-02-19

| AI | 聯發科 | 繁中 | 語言模型 | LLM | 語音合成 | App

聯發科一口氣開源2款繁中多模態小模型、符合臺灣口音的語音合成模型

聯發創新基地（MediaTek Research）開源2款繁中多模態模型Llama-Breeze2-3B和Llama-Breeze2-8B，分別能在手機和個人電腦上執行，還具備呼叫函式能力，可調用外部工具。他們還開源以3B為基礎的Android App，以及能生成臺灣口音的語音合成模型BreezyVoice。

2025-02-17

| BASE TTS | Amazon | 語音合成

Amazon訓練歷來最大的語音合成AI模型BASE TTS

Amazon通用人工智慧研究團隊公布具備10億參數的語音合成模型BASE TTS，強調BASE TTS在語音自然度、文字錯誤以及英語人士說話相似度的表現上，優於YourTTS、Bark、TortoiseTTS等開源語音合成系統

2024-02-16

AI趨勢周報第226期：微軟開源超強語音合成模型VALL-E X了

繼年初發表論文後，微軟終於開源語音合成模型VALL-E X了；Meta釋出程式開發語言模型Code Llama；IBM新生成式AI工具可將COBOL程式轉為Java；Google Workspace生成式AI助理Duet AI正式上線；公務人員使用生成式AI有法可循，國科會提參考指引

2023-09-03

讓語言障礙的帕金森氏症、腦麻病患出門更容易與人溝通！Google新App能幫忙轉譯文字再合成語音唸出聲

為了讓語言障礙者說的話更容易被他人理解，Google發布一款Android應用程式Relate，目前在Beta版測試。這款App涵蓋三大功能，除了能將語言障礙者說的話正確轉譯為文字，還能以合成語音唸出，並串接Google語音助理來啟動相關操作

2021-11-13

AI趨勢周報第177期：深化AI國力，美跨司法、國防、商務部組隊給總統與聯邦機構建議

美國商務部近日跨司法、國防、商務部門等單位籌組國家AI諮詢委員會，要針對美國AI競爭力現狀等議題來給建議；臉書新語音合成模型完全不需文字訓練資料！Salesforce開源程式碼生成器；Uber詳解開源大數據分析平臺省錢關鍵；語言學習App打造模型預測使用者答對機率，要動態調整題目難度。

2021-09-15

| Nvidia | 語音合成 | 對話式AI | 預訓練模型

虛擬黃總還不夠，Nvidia新技術連語音都合成得唯妙唯肖

Nvidia前陣子才揭露，今年GTC大會上的創辦人黃仁勳演講有14秒是「虛擬」登場。最近，Nvidia應用深度學習研究部門副總裁Bryan Catanzaro親自上線說明，GTC大會中穿插的旁白，也是虛擬合成的聲音。這是Nvidia首次對外說明對話式AI研究進展。

2021-09-01

| AI | 微軟 | 語音合成 | google | AutoML | 自然語言 | PDF | Nvidia | TensorRT | 推論 | 萊迪思 | 28奈米 | FPGA | IT周報

AI趨勢周報第114期：快又不漏字！微軟發表FastSpeech能更快產生逼真自然的語音

微軟發表FastSpeech仿真語音生成模型，可快速產生逼真的人類語音，解決語音合成速度緩慢的痛點。Google正式推出AutoML Natural Language，新增了PDF語意理解功能，還可支援5,000個分類標籤，訓練資料量最多可支援1百萬筆文件。Nvidia發表新一代深度學習加速的SDK TensorRT 7，透過優化的編譯器，來加速迴歸和Transformer模型的推論，比傳統CPU快10倍以上。

2019-12-19

【語音辨識、語音合成和臉部辨識先推】LINE Brain商用AI產品明年要落地臺灣

明年初期先用於LINE臺灣內部服務，來蒐集更多用來優化機器學習模型的訓練資料，明年下半年再進一步開放給合作企業，將以食、衣、住、行類生活應用優先試用

2019-12-12

| AI | 漸凍症 | 腦波 | 語音合成

國產全球第一套針對中後期漸凍患者研發的智慧溝通系統，能用AI辨識腦波來判斷患者意圖

科技部科技突圍實驗專案中的「漸凍症病友智慧溝通系統」，目的要讓中後期漸凍症病患，在肌肉運動能力完全喪失的情況下，能透過科技來對外簡單溝通。

2019-08-16

iThome 研討會

數位轉型攻略 VII : GenAI 加速企業創新落地，更需要全新 IT 戰略

善用 GenAI 技術和工具，快速打造出更多高性價比的應用，不只是考驗企業的 AI 技術能力，更是基礎架構管理、雲原生開發能力、全方位資安與 IT 永續發展的挑戰。

日期: 即日起~05/20

DevOpsDays Taipei 2025 預售優惠熱賣中！【立即報名】搶先掌握議程亮點，探索技術趨勢、提升實戰技能！

DevOpsDays Taipei 2025是臺灣規模最大的DevOps盛會，將於6月5-6日在臺北文創大樓隆重舉行。活動聚焦DevOps開發與維運的最新趨勢，這是您與來自各地的DevOps實踐者、技術專家和開發者交流互動，並與技術社群和業界專業人士建立連結的絕佳機會！

日期: 6/5 (四) ~ 6/6(五)