| Nvidia | GPT-4 | Eureka | 機器人 | 強化學習

Nvidia新AI系統能訓練機器手轉筆、開抽屜等動作

Nvidia新AI系統Eureka以Open AI GPT-4為基礎,生成出的獎賞程式可從事機器人的嘗試錯誤學習,訓練實體機器人執行開抽屜或拿剪刀等近30種複雜動作

2023-10-23

| IT周報 | AI | 強化學習 | RLHF | LLM | 生成式AI | Python | 微軟 | Excel | 程式開發

AI趨勢周報第225期:DeepMind發表新演算法ReST,不需人為介入強化學習

人類回饋強化學習(RLHF)是當今LLM的重要訓練方法,但DeepMind新演算法ReST可免去人為介入;Hugging Face發布圖文通吃的多模態模型;文字、語音都能懂!Meta開源多語言翻譯模型;微軟在Excel加入Python支援;資料不外洩!Hugging Face推出企業級自託管程式開發助手

2023-08-24

| 假新聞 | 中研院 | 強化學習 | 反事實解釋

中研院用強化學習開發實驗平臺來打擊假新聞,最快今年上線

中研院資訊科學研究所研究員古倫維分享中研院假新聞研究成果,團隊以自然語言處理(NLP)、強化學習等技術,來辨識新聞內容、規畫最佳投放正確資訊的時機點,要給接觸假新聞的讀者正確資訊,打造為一套實驗平臺來打擊假新聞,最快今年上線。

2022-11-20

| Everyday Robot | Alphabet | 機器人 | AI | 機器學習 | 強化學習 | 協同學習

Alphabet的Everyday Robot開始在自家辦公室執行打掃任務

透過強化學習、協同學習的機器學習演算法,Alphabet X實驗室強調其通用型學習機器人Everyday Robot執行特定任務能力更成熟,能拿抹布擦桌子、開門、將椅子歸位

2021-11-22

| 強化學習 | Deepmind | 機器人

DeepMind釋出可改進機器人堆疊物體能力的基準測試RGB-Stacking

DeepMind所發布的RGB-Stacking基準測試,提供技能掌握以及技能泛化兩種難度的堆疊任務,而DeepMind的機器人已經可以在真實世界的技能掌握任務,達到82%的成功率

2021-10-13

| TPU | 強化學習 | google | 晶片設計 | 製造業 | AI | 雲端 | AI不確定性

AI趨勢周報第171期:TPU v4已比超級電腦快,Google如何用AI自動設計下一代TPU?

Google用強化學習來自動進行晶片佈局規畫,產生晶片平面圖,6小時內就能完成、比人類數個月還要快,Google也用這個方法研發下一代TPU v5;Google雲端調查發現,全球製造業將三分之一IT支出花在AI上;ML推理引擎ONNX Runtime 1.8支援網頁AI推理了!

2021-06-12

| 微軟 | AI | CyberBattleSim | 強化學習 | 資安 | 攻防演練 | 網路攻擊模擬

微軟釋出AI網路攻防模擬工具

微軟釋出內部AI模擬研究工具的Python原始碼,讓安全研究人員模擬建構網路防禦環境,以阻擋AI控制的攻擊

2021-04-09

| Deepmind | 強化學習 | 元學習 | 微軟 | 防詐欺 | GAN | 超高解析度 | AI | IT周報

AI趨勢周報第138期:DeepMind新方法可自動產生強化學習演算法

DeepMind最新研究論文描述新設計的後設學習(Meta learning)架構,透過與環境互動來產生強化學習演算法,團隊也將生成的演算法用於Atari遊戲,達到非平凡等級;知名動畫公司皮克斯用GAN來產生超高解析度電影畫面,降低算圖農場的運算負荷;微軟鎖定零售業,推出Dynamics 365防詐欺新功能。

2020-07-23

| AI | 自然語言 | CodeBERT | 微軟 | Deepmind | 強化學習 | AI2 | 電腦視覺 | 口罩辨識 | google | 虛擬客服 | CapsNet | 極端天氣 | 甲骨文

AI趨勢周報第121期:通吃自然語言和程式語言!微軟發表CodeBERT模型讓程式碼搜尋更便利

微軟亞洲研究院發表CodeBERT模型,可理解自然語言和6種程式語言,包括Ruby、Java、JavaScript、Python、Go、PHP等,能用自然語言來查詢程式碼,也可以建立程式碼文檔;另一方面,DeepMind釋出兩款JAX函式庫Haiku和RLax,要來提升強化學習的實作;而由微軟共同創辦人成立的艾倫AI研究院AI2,發表了電腦視覺模型評比工具

2020-02-27

| 臉書 | 強化學習 | AI | 導航

不用地圖,臉書最新AI代理人室內自動導航成功率達99.9%

臉書以DD-PPO演算法訓練代理人走25億步後,代理人不會轉錯彎或是走進死路,能以接近100%成功率到達目的地

2020-01-23

| MuZero | AlphaGo | AlphaZero | AlphaStar | 強化學習 | Deepmind | 黃士傑 | google

AlphaGo之父黃士傑揭露DeepMind通用AI布局,最終目標要協助人類解決全球暖化難題

黃士傑上月底來臺分享經驗,指出DeepMind的最終目標,是要開發一套通用AI,來協助人類解決世界上的難題,比如全球暖化。另外,他也表示,AI是團隊合作的時代,就算是圖靈獎得主,也是帶著團隊做專案。因此,他認為,除了專業技能,還要抱持一顆敞開的心,讓自己成為團隊中容易相處的人(Easy to work with)。

2020-01-20

| AI | 強化學習 | AWS Sagemaker | DeepRacer | 自駕車 | 交大

交大學生如何在AWS迷你自駕車賽奪下世界第三?讓RL模型克服真實環境變化是關鍵

日前在AWS DeepRacer League世界盃中獲得第三名的交大學生朱詠嘉(Roger),在昨天一場活動中與同為CGI實驗室的團隊成員,一同分享半年來參加迷你自駕車賽的經驗秘訣,不僅設計出能克服現實環境條件的RL模型,還開發了多種模型監測小工具,藉此挑選出表現最佳的模型來參賽。

2020-01-10