今年度Alexa Prize社交機器人挑戰賽落幕,所有決賽隊伍的平均對話時間為12分42秒,是2020年決賽團隊的2倍之多。

圖片來源: 

Amazon

重點新聞(0820~0826)

對話式AI     Alexa Prize     SocialBot  

AI和真人天南地北暢聊20分鐘破紀錄,Amazon年度社交機器人挑戰賽最大突破

Amazon連年舉辦的Alexa Prize社交機器人(SocialBot)挑戰賽最近落幕,前三名由捷克科技大學、史丹佛大學、紐約州立大學水牛城分校等三組團隊拿下,更重要的是,他們的社交機器人與真人的對話,從體育、政治、科技到流行無所不聊,甚至最長可持續20分鐘之久,沒有冷場,打破了過往社交Chatbot競賽的紀錄。

Chabot一直是企業關注的領域,從早期文字QA、多輪對話再到近來的對話式AI,都是要藉自然語言處理(NLP)技術,來提供更接近真人的溝通服務。

Amazon舉辦挑戰賽的初衷也是如此。今年的挑戰賽目標,不只要Chatbot達到連貫性、上下文理解、流暢回應,還包括對話時間。今年,所有決賽團隊的平均對話時間為12分42秒,是2020年決賽團隊的2倍以上,更有一組團隊展現良好的對話品質,得到滿分5分肯定。

Alexa AI自然語言理解副總Prem Natarajan指出,平均對話時間是一個重要指標,能用來判斷參賽機器人的互動連貫性和流暢度。對話時間能拉長,就表示細部技術大有進展,比如神經回應生成模型(Neural response generation)、常識知識表徵(Common sense knowledge representations)、對話建模、對話策略,以及用大規模Transformer模型強化的自然語言理解系統。這次挑戰賽的成績,顯示了NLP領域研究再次躍進。(詳全文)

 

 

  Uber      模型調校    機器學習  

兼顧品質又能減少專家勞力,Uber ML開發平臺靠3大心法高度自動化

對Uber來說,機器學習(ML)模型是執行核心業務決策的重要工具。但模型進入生產環境前,得經過實驗階段,仰賴專家探索特徵、調校參數,或執行離線分析、背景測試等等。不過,隨著模型開發工作越多,AI專家人力的需求也越大。如何兼顧模型品質,又能減少對專家勞力的依賴,Uber日前在自家部落格上,接露了自家ML開發平臺米開朗基羅的三大關鍵,透過超參數優化、及早停止、特徵轉換等方法,來提高模型開發的自動化程度。

首先,在超參數優化部分,他們用樹狀模型找出已知問題類別的參數,比如針對二元分類問題進行AUC優化、對回歸問題就用MSE優化,也採用目標函數,讓專家針對特定問題,選擇合適的優化目標。為避免過度擬合,Uber在優化函數中加入「懲罰條件」,來捕捉訓練合測試間的表現差異。

接著,為加速龐大資料集的超參數搜尋,Uber設計了一項「及早停止」機制,來制止無效的超參數優化。這個機制,能搭配用來評估ML模型表現的學習曲線,來節省無意義的試驗,降低時間和運算成本。

最後一項作法,Uber轉換了他們訓練ML模型時常用的地理空間特徵,將經度和緯度轉換為不同的嵌入向量,從中抽取出地理空間訊號。Uber也設計一個自動機制,將主要複合特徵自動併入樹狀模型的訓練,並自動移除重要性較低的複合特徵。

不只是這三大機制,Uber米開朗基羅平臺還提供一些輔助工具,來執行重複性高的調校工作,如模型架構搜尋、決定特徵綜效等。整體來說,這些強化機制讓Uber可用單一框架,來一般迭代性的調校工作,也能對已部署的ML模型,進行一次性的全面調校。(詳全文)

  IIBM     數位分身     市集  

IBM布局數位分身服務,打造專屬市集銷售各種實體設備的數位分身

IBM不只布局IT、雲端和AI市場,近來也看好數位分身,大推數位分身交換(IBM Digital Exchange)服務,提供了一個線上市集來銷售實體設備的數位分身。

主導IBM數位分身研究的IBM傑出工程師Lisa Seacat DeLuca近日在媒體上透露,IBM數位分身不只限於一般熟知的工業設備,「只要是能產生數位表徵的物體,都可以建立分身。」她強調,數位分身和AI一體兩面,數位分身能更有效地監控、分享資料,並用這些資料來改善AI模型,同時幫助企業更了解他們的資產。

IBM早在去年推出數位分身交換市集,供企業買方和IBM合作夥伴生態系成員交易,IBM合作夥伴可出售故障診斷碼、維護計畫、3D模型及其他與實體物件相關的資料,來讓企業購買。

DeLuca指出,這只是數位分身的初步應用,IBM還推出Maximo企業資產管理服務,可進一步搭配數位分身,來預測資產效能、預先維護。(詳全文)

  大型主機    AI推論       Telum處理器  

高頻交易風險運算能更快!IBM發布首款大型主機的AI加速處理器,率先用於金融業

還在用大型主機的金融業者有好消息了!IBM日前展示一款自行研發的7奈米處理器Telum,具AI加速運算處理能力,將用於下一代IBM Z大型主機上,來解決銀行詐騙、高頻交易等金融難題。IBM透露,首款採用Telum處理器的IBM系統,將於2022年上半年上市。

IBM花了三年時間打造這顆新處理器,未來將由三星生產。IBM指出,金融業者可將訓練好的AI模型打包,部署到採用Telum處理器的IBM系統上,來執行模型推論。如此,就能加速金融AI應用,比如用AI進行金融詐騙偵測、用機器學習加速銀行貸款審核,或是處理高吞吐量的金融交易、反洗錢和風險分析等。

目前,臺灣仍有不少大型金融業者的核心系統硬體,採用大型主機,這也將成為Telum處理器搶攻的市場。(詳全文)

  VS Code 1.59     程式語言     機器學習 

VS Code新版能自動判斷不明檔案中的程式語言!

微軟程式碼編輯器VS Code釋出最新1.59版,不只更新圖形介面區域和編輯器,還加入一項預覽功能,能用機器學習技術自動判斷未命名檔案使用的程式語言。

這個功能以開源機器學習函式庫Tensorflow.js和社群所貢獻的機器學習模型打造而成。開發者手動啟用該功能後,VS Code就會在撰寫程式的同時偵測語言,並推薦安裝相對應的擴充套件。用戶也可設定對特定語言不啟用自動偵測功能,比如停止自動偵測Markdown無標題檔案等。(詳全文)

  高通     無人機平臺     AI引擎  

高通發表新一代5G AI無人機平臺

高通推出全球第一個5G AI無人機平臺Flight RB5 5G,可用來加速各種無人機應用的開發。該平臺具備第5代高通AI引擎,可處理複雜的電腦視覺、感知和自主性功能等任務,比如多目標偵測和追蹤、數位雲臺和立體視野深度,以及路徑規畫、障礙物迴避等功能。

另一方面,平臺還具8個QRB5165中央處理器、1個GPU和1個神經處理引擎,還有能捕捉4K和8K解析度影片的攝影鏡頭,可提供電子影像穩定器、水平功能和數位變焦等功能,拍攝出電影品質的影像。而5G和Wi-Fi 6連接能力,能實現長達8公里的可視距離飛行。高通Flight RB5 5G無人機參照設計現在於無人機製造商ModalAI上預售,而開發套件則預計在今年第4季上市。(詳全文)

圖片來源/Amazon、Uber、IBM、微軟、高通

 AI趨勢近期新聞 

1. 馬斯克描繪特斯拉人形機器人Tesla Bot,預計明年推出原型機

2. SAP併購AI人力資源平臺SwoopTalent

3. 史丹佛大學200頁報告詳解超大預訓練模型的優劣和風險

資料來源:iThome整理,2021年8月

 

熱門新聞

Advertisement