| AI | RL | 獎勵機制 | 通用AI | DeBERTa | 自然語言 | AI監管 | 臉書 | IT周報
AI趨勢周報第155期:不求獎勵的RL代理就更像人類嗎?Google Brain告訴你
Google Brain聯手多倫多大學和Vector研究院,用3種常見的人類學習機制,來探討AI是否不需任務獎勵,只靠Intrinsic objective就能探索環境、找出最佳解法;微軟NLU模型DeBERTa超越人類表現,「離通用AI更近了」;臉書發起Open Loop計畫,號召全球政策制定者和科技公司加入,來研擬恰當的AI法規。
2021-01-14
| AI | 微軟 | PLM | SuperGLUE | DeBERTa
微軟AI模型在SuperGLUE基準超越人類位居排行榜第一
微軟最新擁有15億個參數的DeBERTa模型,在SuperGLUE基準超越人類基準線,獲得90.3分成為第一名,Google大腦的模型則以0.1分差距緊追在後
2021-01-08