微軟開發一套AI系統PeopleLens,透過視線追蹤和物件辨識演算法,將周遭人物資訊以環繞音效方式傳達給盲胞使用者,來助盲胞與周圍人物互動。

圖片來源: 

微軟

重點新聞(0311~0317)

微軟     電腦視覺     盲胞  

盲胞新選擇!微軟釋出PeopleLens結合3D環繞音效和電腦視覺助盲胞與人互動

微軟近日發表一項AI原型系統PeopleLens,結合聲音和影像辨識來幫助全盲和弱視的青少年認識環境,與同儕互動。進一步來說,這個PeopleLens是一款頭戴式裝置,當使用者看向認識的人時,裝置會發出該人的姓名,並利用3D環繞音響,讓聲音從那人的方向傳向使用者,建立使用者對周遭人物的相對位置和距離。同時,PeopleLens還能幫助使用者建立人脈圖People Map,讓使用者知道周遭哪些人需要立即溝通,PeopleLens也會同步向該人釋出可以互動的訊號,來替代眼神交流。

微軟指出,PeopleLens是款AR頭戴式裝置,採用了4種先進的電腦視覺演算法,來不間斷地定位、辨識和追蹤附近人物的視線方向。接著,系統會將這些資訊,透過環繞音效傳送給配戴者,讓他們知道周遭環境的人物位置。微軟也強調,這套系統也顧及隱私。雖然其中用來辨識人臉的演算法會搭配PeopleLens所拍攝的人臉照片,這些照片並不會保存,也不會用於其他人臉辨識系統。(詳全文)

  Google      文字轉語音     API  

自己的錄音也能用!Google文字轉語音API支援自定義語音

Google在文字轉人聲(TTS)API推出自定義語音功能,使用者可用自己的錄音來訓練語音模型,打造出獨特的語音體驗。想建立品牌形象的企業,也可在互動式語音應用中使用獨特聲音,建立差異化的用戶體驗。

自定義語音讓使用者只需要提交錄音,就可直接在TTS API中存取新語音。不過,Google也評估自定義語音TTS和合成媒體的道德疑慮,為降低潛在危害,使用者採用自定義TTS之前,需要經過一個審查流程,確保每個用例皆符合Google的AI原則,並且要求驗證配音員,提供Google雲端指定語句的音訊檔案,作為取得配音員的同意。目前TTS自定義語音功能正式支援英語、西班牙語、法語、義大利語、德語、葡萄牙語和日語,其他語言則還需要再等等。(詳全文)

  玉山銀行     模型維運     中央儲存庫  

玉山銀揭露自動化監控上百個模型秘訣

玉山銀行自2018年成立智金處以來,就專門打造AI模型來解決全行商務問題。至今,智金處已有上百個模型在運行,但如何即時監控、管理模型品質,就是一大課題。去年,玉山採用商用產品SAS Viya平臺模型效能管理應用程式,透過內建的模型量測評估指標,像是準確率、F1分數、靈敏性、特異性等多種指標,來追蹤模型是否偏移。蒐集到模型效能數據後,玉山智金處再客製出視覺化儀表板,來追蹤上線模型的異常狀態,當模型表現偏移、超出設定的閾值,系統就會自動發送Email通知管理者。監控報表的產製時間也從原本的3天,縮短到數分鐘。

另一方面,玉山也導入中央儲存庫,來集中管理原本散落各處的詮釋資料,比如模型相關的詮釋資料包含開發者、開發時間、採用的演算法類型等20多種資料,甚至是模型版本、模型檔案、模型屬性和變數,都能在中央儲存庫中找到。該儲存庫,能根據不同模型設定權限,再讓相關人員參與、協作,查看模型狀態或簽核把關模型品質。這個儲存庫平臺,也能記錄管理和稽核軌跡,滿足法遵需求。(詳全文)

  敦謙國際    RPA       帳務作業  

知名飯店用RPA加速帳務處理作業,節省近8成人力成本

主打智能管理的飯店業者敦謙國際日前導入RPA,來設定排程自動化處理帳務作業,省下77%人力。進一步來說,對飯店業者而言,處理訂單和金流作業,是飯店財務人員每日最耗時的例行工作,再加上敦謙旗下有眾多品牌旅店,收款金流更是多樣。

因此,他們每天需到5家網銀抓取28家飯店的訂房匯款資訊,再根據飯店來整理入帳報表。但不論是抓帳、對帳流程還是退款處理,都耗費大量人力。後來,他們找來昕力資訊,導入RPA軟體來自動化帳務作業,不管切換多少家飯店帳戶登入抓帳、串接內部ERP與訂單系統,節省了至少77%的人力成本、降低85%作業時間。他們也應用廠商自行訓練的驗證碼辨識模組,並串接驗證碼通關服務,來解決機器人驗證碼自動通關的瓶頸,減少流程斷點。(詳全文)

  AutoML     SAS     法遵科技  

SAS臺灣:今年產品策略聚焦法遵科技和AutoML維運

數據分析大廠SAS回顧臺灣2021年表現,去年雲端、軟體營收成長4成,與前年營收相比是雙位數成長。SAS臺灣總經理陳愷新進一步分析,去年主要營收領域為風險管理(IFRS17)和詐欺偵測、AI運算和管理平臺(Viya)、智慧醫療等三大部分,顯示企業對這三領域的深度需求。

而今年,SAS臺灣產品策略也將聚焦2大層面,包括法遵科技、AI運算及管理平臺,就前者來說,可細分為數位詐欺與內部詐欺、ESG氣候風險管理,以及國際保險資本標準(ICS)2.0,他解釋,這個ICS 2.0也是臺灣將於2026年1月1日推行的政策,因此先來練兵試行。就AI運算及管理平臺來說,則可細分為自動化機器學習(AutoML)和AI模型生命周期管理,來鎖定企業自動化維運模型的需求。(詳全文)

  DeepMind     古希臘文     NLP  

連古希臘銘文都能修復!DeepMind開源古希臘文辨識AI

Google旗下AI研究機構DeepMind,開發出能辨識古希臘文字的AI模型Ithaca,它不只能辨識古希臘文字,還能恢復損壞銘文上的文字、辨識來源位置,甚至能估算銘文出現的年代。

Ithaca建立在DeepMind文字恢復系統Pythia之上,它恢復文字的準確率達62%,並能以71%準確率辨識來源位置,而且能精確估算銘文年代,範圍限縮到30年間。DeepMind也提供多種視覺輔助工具,讓歷史學家更容易解讀Ithaca的輸出,比如,Ithaca會輸出多個文字恢復假設,供歷史學家選擇,在地理位置歸因上,Ithaca會在地圖上顯示可能的分布機率,來顯示不確定性。

DeepMind與Google雲端和Google Arts & Culture合作,推出Ithaca免費互動版本,並且進一步開源程式碼、預訓練模型,以及互動式Colaboratory筆記本,與研究人員、教育者和博物館工作人員,共享這些研究成果。(詳全文)

  DevOps     AI測試     CI/CD  

DevOps平臺CircleCI併購Ponicode,要在CI/CD中整合AI測試

DevOps平臺CircleCI宣布收購AI測試平臺Ponicode,目標是要將Ponicode的程式碼分析AI引擎,整合到CircleCI現有的持續整合和交付(CI/CD)服務中,以減少開發人員的開發錯誤,提高程式碼品質。

CircleCI是一個持續整合和交付平臺,可供企業用於實踐DevOps,而Ponicode的AI引擎則提供編寫測試、程式碼註解和分析程式碼品質等服務,透過結合Ponicode和CircleCI,可使開發人員程式碼更快投入生產,加速企業創新。CircleCI表示,用戶可先下載適用於VS Code的Ponicode擴充套件來熟悉Ponicode服務,也能試用Ponicode單元測試遊樂場沙盒應用程式,來嚐鮮Ponicode的單元測試功能。(詳全文)

圖片來源/微軟、玉山銀行、DeepMind

  AI近期新聞 

1. Google與漢莎航空合作,藉最佳化機隊調度降低碳排

2. 英國健保署NHS採用新演算法,20秒就能偵測心臟病且準確率高40%

3. 北榮用AutoML加速開發洗腎風險預測模型,下一步要取TFDA認證推廣全臺

資料來源:iThome整理,2022年3月

熱門新聞

Advertisement