語音辨識 | iThome

OpenAI推出新語音模型，增強語音辨識準確度與語氣控制能力

OpenAI新一代語音轉文字與文字轉語音模型，透過強化學習與語音資料預訓練提升辨識準確度，並支援語氣控制功能。新模型在多語言環境中表現優異，有助於開發更自然且個人化的語音應用

2025-03-21

| 微軟 | Phi-4 多模態 | 語音辨識 | 邊緣運算

微軟發展自家多模態模型Phi-4-multimodal，56億參數支援裝置端運作

微軟推出Phi-4-multimodal多模態模型，整合語音、圖像與文字處理，提升語音辨識與推理能力，並最佳化裝置端執行，適用於邊緣人工智慧應用

2025-02-27

女媧創造推出可以分眾行銷和會員經營的服務機器人，企業用戶還能用No-code開發工具設計專屬服務內容

這款服務機器人，不只能用於送餐收餐、行銷內容播放，還搭載AI語音及影像辨識功能，結合No-code開發工具，可以開發多種進階機器人應用，包括AI語音客服、實體消費數據蒐集、自動化分眾行銷、會員再行銷等，使機器人可以支援更多種形態的服務。

2023-10-25

| Meta | 語音辨識 | TTS

Meta運用聖經譯本與錄音改進語音模型，現可支援超過千種語言

Meta新的多語言語音辨識模型MMS能夠處理1,107種語言，在語音和文字間轉換，同時還能辨識超過4,000種的口說語言

2023-05-23

| 國民法官法庭 | 語音辨識 | 司法院 | AI

法庭語音辨識應用大圖解

司法院在國民法官法庭首次引進AI語音辨識技術，打造出專用於支援法律專業詞彙的語辨引擎

2023-05-05

| 德州 | google | 隱私 | 人臉 | 語音辨識 | 生物特徵

Google擅自蒐集人臉及語音辨識資料，遭德州控告

德州檢察長認為Google Photos、Google Assistant與Nest Hub Max等服務或裝置，因濫用使用者的生物特徵資料而違反《取得或使用生物識別法令》

2022-10-21

Google及微軟等五大科技業者加入語音無障礙專案

Amazon、蘋果、Google、Meta與微軟承諾支援美國伊利諾大學香檳分校的語音無障礙專案（Speech Accessibility Project），該專案目的是提高語音辨識技術對各種身心障礙族群的支援度

2022-10-04

| Whisper | Open AI | 語音辨識 | ASR | 翻譯 | 開源 | 神經網路

Open AI開源自動語音辨識系統Whisper

Open AI強調Whisper神經網路的英文語音辨識能力，已達到人類水準

2022-09-22

零售IT雙周報第7期：統一超商開始測試短程機器人外送及偏鄉無人機外送服務

本周零售IT雙周報重點：統一超商將測試兩種型態的無人外送服務；美國連鎖餐廳在店內設置無人收銀商品區；印度連鎖超市將完整購物旅程整合進通訊軟體Whatsapp；美國零售巨頭Walmart推出外送進顧客車庫內的新型服務

2022-09-02

| AI | 語音辨識 | 圖文生成 | Transformer | 自監督 | 抓臭蟲 | 微軟 | IT周報

AI趨勢周報第184期：會聽也會讀唇語！Meta AI研究院開源新模型讓語音辨識更精準

Meta AI研究院用Transformer打造出能聽又能讀唇語的語音辨識模型；百度推出中文界最大跨模態圖文生成預訓練模型「文心ERNIE-ViLG」；微軟用自監督AI抓程式碼臭蟲，效能提高3成；蘋果打造最大的室內3D場景AR資料集。

2022-01-13

Meta開發能邊聽邊看的語音辨識模型，語音轉文字錯誤率大幅下降

Meta新的語言模型AV-HuBERT，能夠連結語音和影像中說話者的嘴唇動作，提升語音辨識抗噪效果，使單字錯誤率大幅下降

2022-01-11

| MLCommons | 關鍵字 | 資料集 | 語音辨識 | Multilingual Spoken Words Corpus | 開源 | 語音助理

MLCommons釋出多語言口語大型語音辨識資料集

這個以CC-BY 4.0授權釋出的MSWC資料庫，包含50種語言的音訊資料，而MSWC是其中46種語言第一個開源口語資料集。

2021-12-17

iThome 研討會

數位轉型攻略 VII : GenAI 加速企業創新落地，更需要全新 IT 戰略

善用 GenAI 技術和工具，快速打造出更多高性價比的應用，不只是考驗企業的 AI 技術能力，更是基礎架構管理、雲原生開發能力、全方位資安與 IT 永續發展的挑戰。

日期: 即日起~05/20

DevOpsDays Taipei 2025 預售優惠熱賣中！【立即報名】搶先掌握議程亮點，探索技術趨勢、提升實戰技能！

DevOpsDays Taipei 2025是臺灣規模最大的DevOps盛會，將於6月5-6日在臺北文創大樓隆重舉行。活動聚焦DevOps開發與維運的最新趨勢，這是您與來自各地的DevOps實踐者、技術專家和開發者交流互動，並與技術社群和業界專業人士建立連結的絕佳機會！

日期: 6/5 (四) ~ 6/6(五)