中國DeepSeek開源其R1推論模型,數學、程式開發表現緊追OpenAI o1
中國DeepSeek釋出推論模型DeepSeek-R1,採用強化學習技術,突破傳統監督微調對大規模標註資料的依賴,在數學與程式開發測試中表現出色,部分領域已接近或超越OpenAI o1模型
2025-01-22
中研院資訊科學研究所研究員古倫維分享中研院假新聞研究成果,團隊以自然語言處理(NLP)、強化學習等技術,來辨識新聞內容、規畫最佳投放正確資訊的時機點,要給接觸假新聞的讀者正確資訊,打造為一套實驗平臺來打擊假新聞,最快今年上線。
2022-11-20
| Everyday Robot | Alphabet | 機器人 | AI | 機器學習 | 強化學習 | 協同學習
Alphabet的Everyday Robot開始在自家辦公室執行打掃任務
透過強化學習、協同學習的機器學習演算法,Alphabet X實驗室強調其通用型學習機器人Everyday Robot執行特定任務能力更成熟,能拿抹布擦桌子、開門、將椅子歸位
2021-11-22
DeepMind釋出可改進機器人堆疊物體能力的基準測試RGB-Stacking
DeepMind所發布的RGB-Stacking基準測試,提供技能掌握以及技能泛化兩種難度的堆疊任務,而DeepMind的機器人已經可以在真實世界的技能掌握任務,達到82%的成功率
2021-10-13
| AI | 自然語言 | CodeBERT | 微軟 | Deepmind | 強化學習 | AI2 | 電腦視覺 | 口罩辨識 | google | 虛擬客服 | CapsNet | 極端天氣 | 甲骨文
AI趨勢周報第121期:通吃自然語言和程式語言!微軟發表CodeBERT模型讓程式碼搜尋更便利
微軟亞洲研究院發表CodeBERT模型,可理解自然語言和6種程式語言,包括Ruby、Java、JavaScript、Python、Go、PHP等,能用自然語言來查詢程式碼,也可以建立程式碼文檔;另一方面,DeepMind釋出兩款JAX函式庫Haiku和RLax,要來提升強化學習的實作;而由微軟共同創辦人成立的艾倫AI研究院AI2,發表了電腦視覺模型評比工具
2020-02-27
臉書以DD-PPO演算法訓練代理人走25億步後,代理人不會轉錯彎或是走進死路,能以接近100%成功率到達目的地
2020-01-23