人類只要示範遊戲一次,OpenAI靠增強學習讓AI青出於藍勝於藍
OpenAI使用與OpenAI Five相同的增強學習技術,教人工智慧遊玩複雜的遊戲蒙特祖馬的復仇,除了參考人類示範的遊戲技巧外,還能考慮人類示範者沒有想過的解決方案。
2018-07-09
Google讓機器人抓握技巧更像人,在雜亂中抓取目標前還會先撈一撈
Google要讓機器人模仿人類的抓握策略,不只使用深度學習,賦予機器人處理非結構化現實場景的能力,再結合增強學習,讓機器人擁有進行長期推理與強大的順序決策技巧。
2018-07-02