重點新聞(0531~0606)

蘋果    Core ML 3    機器學習 

蘋果發表Core ML 3,可在裝置上執行機器學習運算

蘋果於今年度WWDC大會上發表最新版iOS機器學習框架Core ML 3,不僅支援更多種即時機器學習模型的加速,也支援超過100層的類神經網路模型,更可以於裝置上執行機器學習運算。Core ML是蘋果2年前推出的機器學習框架,iOS開發者可藉此打造智慧手機App。蘋果指出,這次發表的第3版,可讓手機App使用先進的模型,來呈現更好的視覺理解、自然語言和語音體驗。更重要的是,開發者能透過「模型個人化」功能,在裝置上更新機器學習模型。

同時,蘋果也推出Create ML,這是一款新的機器學習模型開發、訓練、部署App,使用者不需具備任何機器學習技能、也不需要寫任何程式,就能透過這款App來開發ML模型。此外,Create ML可以同時利用不同資料集來訓練多種模型。(詳全文)

  蘋果    SwiftUI    開發框架 

蘋果推出SwiftUI開發框架和ARKit 3,提供新一代開發體驗

蘋果於今年WWDC大會上推出SwiftUI開發框架,是一款直覺式UI框架,使用了簡單易懂的宣告式程式碼,可讓開發者打造複雜的UI應用程式。蘋果表示,SwiftUI提供許多自動化功能,包括版面配置、黑暗模式、可用性、由右至左的語言支援等。此外,藉由SwiftUI API,開發者可在蘋果的各種平臺上建置App,像是iOS iPadOS、macOS、watchOS和tvOS等平臺。

ARKit 3是一套AR應用程式開發工具,透過動作捕捉(Motion Caputre)功能,開發者可將人物的動作整合至自己的App中;人物遮擋(People Occlusion)功能則能更自然地將AR場景至於人物身前或背後。此外,ARKit 3還可讓前鏡頭追蹤最多3個臉部,也支援多人協作開發。(詳全文)

  Google     深度學習    影像深度 

Google以深度學習重建動態人物影片的深度資訊

Google發表了最新的電腦視覺研究,能透過深度學習來預測影片中人物與場景的深度資訊。Google表示,該研究是第一個能處理攝影機和物體同時移動的影片。研究員使用了2千支YouTube影片,皆為以手持攝影機拍攝人類各種靜止姿勢的影片,並以監督式學習來訓練模型,讓模型學習人類靜止的自然姿勢。由於整個場景都是靜止的,只有攝影機在移動,因此Google可取得整個場景精確的深度資訊。

接著,Google將影片畫面中的人物遮罩、RGB圖像、省略人物影像的初始影片等三者,作為深度學習神經網路的輸入值,來產生深度圖(Depth Map),進一步預測人體型態和姿勢。該成果除了可處理相機與人物隨意運動的影片,找出人物和場景的深度值,也可為影片加入3D感知特效,也能進一步重置為立體的影片,或是做出搖擺攝影機的功能。(詳全文)

  AWS    文件內容萃取     Textract  

AWS正式推出自動萃取文件內容服務Textract

AWS推出自動萃取文件內容服務Textract,利用機器學習技術和光學字元辨識(OCR)技術,能自動萃取表格和表單等文件中的文字與數據,比如名稱、稅單上的身分證字號或是庫存報告中的產品SKU,這個過程不需要人工審核,也不需要制定特定的資料格式。

進一步來說,Textract服務以API方式提供,使企業不需要具ML技術背景,就能使用。Textract API支援多種圖像格式,比如掃描檔、PDF、照片,企業還可以在資料庫和分析服務中使用該API,包含AWS的Elasticsearch服務、DynamoDB、Athena,還有其他機器學習服務,像是理解服務Comprehend、醫療資訊理解服務Comprehend Medical、翻譯服務Translate、ML自動建置和部署工具SageMaker。Textract服務目前在美國東部和西部地區、歐洲已推出,預計近期擴展到其他地區。(詳全文)

 

 

  大阪大學   自然語言處理    牙齒矯正 

大阪大學發表自然語言處理AI,來編寫病人牙齒矯正建議

大阪大學研究員日前發表一項研究,以自然語言處理(NLP)技術設計一套可以設計牙齒矯正建議的AI系統。研究員指出,牙科醫生通常花太多時間在書寫牙齒治療報告工作上,而大阪大學希望藉AI來改善這個問題,首先從牙尺矯正開始。

為了訓練AI,研究員首先建立含有990個牙齒治療文件的資料集,根據每種牙齒矯正條件和問題,分為423類,並將文件中所有句子分割為單字,來作為訓練用的語料庫。而訓練好的AI系統,可從患者的就醫紀錄中萃取X光影像、牙齒3D模型以及診斷結果(按優先順序排列),並重新組織醫療紀錄中的每個條件,再交叉比對系統內建的400多種標籤。之後,系統會針對每個問題產生相關句子,以及優先治療的建議。(詳全文)

三總   醫療AI     物聯網 

三總成立人工智慧暨物聯網發展中心,瞄準精準醫療

為轉型為AI醫院,三軍總醫院(簡稱三總)近日成立人工智慧暨物聯網發展中心,要利用物聯網裝置和資訊部門的AI技術,來發展各種醫療影像AI和醫療病歷判讀系統。

目前,三總已自行研發出一套心電圖AI判讀系統,其中的AI模型是以院內數萬張心電圖來訓練而成,準確率達9成以上,可從患者心電圖波形來判別是否患有特定疾病。此外,三總也進行其他醫療影像AI研究,比如胸部X光AI判讀、眼底鏡AI判讀等。三總AI中心的另一個目標,則是要建置醫療病歷判讀AI,透過自然語言處理技術,來協助判讀如出院病歷摘要等文件。三總也表示,未來計畫於2021年成立國軍影像及分析中心,來整合全國軍醫院醫療影像,發展更多醫療AI應用。(詳全文)

DeepMind    強化學習    策略遊戲 

不同AI代理人也能互相合作!DeepMind成功訓練一支AI玩家隊伍來玩奪旗策略遊戲,表現與人相當

DeepMind最近發表強化學習應用新進展,訓練出一支能互相合作的AI玩家隊伍,能在複雜多人連線3D遊戲《雷神之鎚III競技場》中的奪旗競賽場景與人類玩家對戰,表現還不相上下。

進一步來說,DeepMind首先利用45萬回合的奪旗場景來訓練一群AI玩家,雖然AI玩家一開始只是隨機行動,但經過一次次嘗試後,AI玩家學會互相合作、找出最佳策略,DeepMind研究員Wojciech Czarnecki甚至表示,這些AI玩家能適應擁有任意技能的隊友。而DeepMind所採用的強化學習,讓每個AI玩家都會學習自己的內部獎勵訊號,使AI產生各自的內部目標,此外,DeepMind也將AI玩家執行遊戲的時間區段,分為快、慢兩種,來改善AI使用記憶體和產生一致行動序列的能力,最終能組隊與人類玩家對戰。這項研究,顯示了多代理人(multi-agent)訓練在AI領域開發上的潛力。(詳全文)

Google地圖    ML      餐點 

Google地圖融入ML,使用者要找熱門餐點更容易

Google日前在地圖服務中,新增了熱門餐點的資訊,提供用戶點餐時的參考。該熱門餐點的功能利用了機器學習技術,將地圖服務中用戶提供的餐點名稱,與相關的圖片和評論配對,找出該餐廳最受歡迎的餐點。

用戶查詢一家餐廳後,在餐廳的總覽頁面就能瀏覽熱門的菜單,點擊查看「更多」之後,還能針對每個推薦的餐點查看圖片和評論,若評論不是用預設的語言書寫,Google地圖也能翻譯評論,若用戶想為下一個來餐廳的人提供意見,只要拍下餐點照片,並寫上餐點名稱,就能夠讓其他用戶更了解該餐廳的餐點資訊。該功能目前已推出Android版本,iOS版本將於未來數個月推出。(詳全文)

圖片來源/蘋果、Google、AWS、DeepMind

 AI趨勢近期新聞 

1. Google用新方法縮放網路模型,提高準確率卻不會犧牲效能

2. WWDC:具備暗黑模式的iOS 13預覽版出爐,加強相機、照片與地圖程式功能

3. Nvidia計畫於Clara AI平臺推出醫療AI模型市集

資料來源:iThome整理,2019年6月


Advertisement

更多 iThome相關內容