| 服務機器人 | 生成式AI | 會員經營 | 分眾行銷 | 視覺辨識 | 語音辨識 | No-Code

女媧創造推出可以分眾行銷和會員經營的服務機器人,企業用戶還能用No-code開發工具設計專屬服務內容

這款服務機器人,不只能用於送餐收餐、行銷內容播放,還搭載AI語音及影像辨識功能,結合No-code開發工具,可以開發多種進階機器人應用,包括AI語音客服、實體消費數據蒐集、自動化分眾行銷、會員再行銷等,使機器人可以支援更多種形態的服務。

2023-10-25

| Meta | 語音辨識 | TTS

Meta運用聖經譯本與錄音改進語音模型,現可支援超過千種語言

Meta新的多語言語音辨識模型MMS能夠處理1,107種語言,在語音和文字間轉換,同時還能辨識超過4,000種的口說語言

2023-05-23

| 國民法官法庭 | 語音辨識 | 司法院 | AI

法庭語音辨識應用大圖解

司法院在國民法官法庭首次引進AI語音辨識技術,打造出專用於支援法律專業詞彙的語辨引擎

2023-05-05

| 德州 | google | 隱私 | 人臉 | 語音辨識 | 生物特徵

Google擅自蒐集人臉及語音辨識資料,遭德州控告

德州檢察長認為Google Photos、Google Assistant與Nest Hub Max等服務或裝置,因濫用使用者的生物特徵資料而違反《取得或使用生物識別法令》

2022-10-21

| 無障礙 | 語音辨識 | 身心障礙 | Speech Accessibility Project | Amazon | 蘋果 | google | Meta | 微軟

Google及微軟等五大科技業者加入語音無障礙專案

Amazon、蘋果、Google、Meta與微軟承諾支援美國伊利諾大學香檳分校的語音無障礙專案(Speech Accessibility Project),該專案目的是提高語音辨識技術對各種身心障礙族群的支援度

2022-10-04

| Whisper | Open AI | 語音辨識 | ASR | 翻譯 | 開源 | 神經網路

Open AI開源自動語音辨識系統Whisper

Open AI強調Whisper神經網路的英文語音辨識能力,已達到人類水準

2022-09-22

| 無人機 | 智慧物流 | 智慧車庫 | 外送機器人 | 外送服務 | 無人收銀 | 智慧倉儲 | 進銷存管理 | 創作者行銷 | 語音辨識 | IT周報

零售IT雙周報第7期:統一超商開始測試短程機器人外送及偏鄉無人機外送服務

本周零售IT雙周報重點:統一超商將測試兩種型態的無人外送服務;美國連鎖餐廳在店內設置無人收銀商品區;印度連鎖超市將完整購物旅程整合進通訊軟體Whatsapp;美國零售巨頭Walmart推出外送進顧客車庫內的新型服務

2022-09-02

| AI | 語音辨識 | 圖文生成 | Transformer | 自監督 | 抓臭蟲 | 微軟 | IT周報

AI趨勢周報第184期:會聽也會讀唇語!Meta AI研究院開源新模型讓語音辨識更精準

Meta AI研究院用Transformer打造出能聽又能讀唇語的語音辨識模型;百度推出中文界最大跨模態圖文生成預訓練模型「文心ERNIE-ViLG」;微軟用自監督AI抓程式碼臭蟲,效能提高3成;蘋果打造最大的室內3D場景AR資料集。

2022-01-13

| Meta | BERT | 語音轉文字 | 語音辨識 | AV-HuBERT

Meta開發能邊聽邊看的語音辨識模型,語音轉文字錯誤率大幅下降

Meta新的語言模型AV-HuBERT,能夠連結語音和影像中說話者的嘴唇動作,提升語音辨識抗噪效果,使單字錯誤率大幅下降

2022-01-11

| MLCommons | 關鍵字 | 資料集 | 語音辨識 | Multilingual Spoken Words Corpus | 開源 | 語音助理

MLCommons釋出多語言口語大型語音辨識資料集

這個以CC-BY 4.0授權釋出的MSWC資料庫,包含50種語言的音訊資料,而MSWC是其中46種語言第一個開源口語資料集。

2021-12-17

| IT週報 | AWS | Meta | 語音辨識 | 機器人 | Nvidia

AI趨勢周報第181期:Meta開源懂128種語言的語音辨識預訓練模型

Meta旗下臉書AI研究院開源XLS-R,是一套具20億參數、跨128種語言的語音辨識預訓練模型;AWS在re:Invent年會上發表機器人管理服務IoT RoboRunner;GCP新增AI對話新功能,中小企業不必寫程式也能打造好用的Chatbot;字節跳動以BERT架構打造SOTA等級影像辨識新模型。

2021-12-02

| 語言障礙者 | Relate | App | 語音辨識 | 語音轉文字 | 語音合成 | Google語音助理

讓語言障礙的帕金森氏症、腦麻病患出門更容易與人溝通!Google新App能幫忙轉譯文字再合成語音唸出聲

為了讓語言障礙者說的話更容易被他人理解,Google發布一款Android應用程式Relate,目前在Beta版測試。這款App涵蓋三大功能,除了能將語言障礙者說的話正確轉譯為文字,還能以合成語音唸出,並串接Google語音助理來啟動相關操作

2021-11-13