| google | 增強學習 | 機器人

Google訓練機器人在自家辦公室分類垃圾

Google應用增強學習技術訓練機器人分類垃圾,實際部署後可成功減少垃圾桶40%至50%的垃圾重量

2023-04-14

| google | 增強學習 | 資料集

Google打造增強學習資料集生態系RLDS,促進資料收集和交流

增強學習資料集(RLDS)是一個資料集生態系,能夠完整收集增強學習需要的訓練資料,也能方便地與其他研究人員共享

2021-12-07

| google | 增強學習 | 機器人

狗成為機器人動作導師,Google讓四足機器人跟狗學習靈活的移動

研究人員利用狗的動作影片,在模擬環境訓練控制政策,並運用到真實世界四足機器人上,使其能作出靈活的動作

2020-04-07

| AI | google | 增強學習 | GPU | 健保署 | 廣達 | IBM | 武漢肺炎 | 超級電腦 | cGAN | 壓縮 | Uber

AI周報第125期:Google釋出超強RL代理,1秒訓練百萬幀影像還省下80%訓練成本

為打破傳統RL訓練的資源瓶頸,Google開發超強RL代理SEED RL,可將訓練規模擴展至數千臺機器、1秒可訓練百萬幀影像,透過集中式推論來有效利用運算資源,最多可省下8成訓練成本;另一方面,MIT發表新壓縮方法,最多可將cGAN縮小33倍,讓它能在行動裝置上執行;健保署日前聯手廣達,要以獨家AI平臺來協助研究員分析上億筆醫療大數據。

 

2020-03-26

| google | Deepmind | 增強學習

Google與DeepMind聯手釋出增強學習代理Dreamer,能透過想像力學習行為

增強學習代理Dreamer可透過世界模型,獲得對未來的預測以幫助學習長期行為

2020-03-20

| AI | 臉書 | 增強學習

AI也會讀空氣!臉書發展可理解遊戲隊友意圖的AI

臉書最新發展的人工智慧,可利用有限的資訊了解隊友意圖,並進行合作

2019-12-09

| AWS | DeepRacer | 增強學習

AWS DeepRacer釋出新版本搭載立體視覺攝影機與光達

新版DeepRacer搭載更先進的感測器,將能良好地偵測DeepRacer周圍的障礙物

2019-11-28

| google | RecSim | 推薦系統 | 增強學習

Google開源推薦系統模擬平臺RecSim

RecSim可用來模擬各種用戶偏好以及潛在狀態等特徵,幫助開發者開發與評估推薦器模型

2019-11-25

| OpenAI | 增強學習 | AI

Openai釋出增強學習的安全限制量測工具,研究如何讓AI不做「傻事」

研究人員可利用Safety Gym設置各種複雜度與難度的增強學習測試環境,試驗增強學習演算法在安全性以及效能表現。

2019-11-22

| Deepmind | AlphaStar | 增強學習 | 星海爭霸 | AI | 人工智慧

DeepMind以多重代理增強學習策略,讓AI在星海爭霸 2天梯爬上大師等級

AlphaStar擴展自我對戰策略,轉而以一群代理戰隊互相學習成長,透過發現代理遊玩缺點來提升技術

2019-11-02

| 臉書 | 決策AI | 增強學習 | 一之軒 | 辨識 | 臺灣杉二號 | 嘉義大學 | 植保機器人 | 中正大學 | 無人餐廳 | google | AI | IT周報

AI趨勢周報第105期:每日數百億個人化推播就靠它!臉書釋出決策AI工具包ReAgent

臉書AI研究院釋出一款增強式學習AI工具包ReAgent,可用來打造決策型AI,目前已於GitHub上開放下載。這個工具包是一個小型C++函式庫,有3大部分,首先是能產生決策並接收回饋的模型,再來是離線的評估模組,以及用來大量部署模型的部署平臺。

2019-10-18

| OpenAI | 神經網路 | 增強學習 | 域隨機化

Openai訓練神經網路可操作單個機器手掌解決魔術方塊

Openai應用了自動域隨機化,能夠逐漸提高神經網路的訓練難度,使得神經網路足夠強健應付現實環境

2019-10-16