RLHF | iThome

AI趨勢周報第225期：DeepMind發表新演算法ReST，不需人為介入強化學習

人類回饋強化學習（RLHF）是當今LLM的重要訓練方法，但DeepMind新演算法ReST可免去人為介入；Hugging Face發布圖文通吃的多模態模型；文字、語音都能懂！Meta開源多語言翻譯模型；微軟在Excel加入Python支援；資料不外洩！Hugging Face推出企業級自託管程式開發助手

2023-08-24

iThome 研討會

IT EXPLAINED 數位轉型攻略 VIII

GenAI 加速企業創新落地，更需要全新 IT 戰略

日期: 即日起~03/04

CYBERSEC 2026 臺灣資安大會

CYBERSEC 2026 臺灣資安大會以「RESILIENT FUTURE」為主軸，回應風險成為日常的現實，探討如何培養能在衝擊後迅速回復，並在持續變動中不斷強化的韌性能力，作為面對資安威脅的關鍵基礎，共同打造穩定可信的數位環境。

日期: 5/5 (二) ~ 5/7(四)

DevOpsDays Taipei 2026 即刻開放徵求講者

DevOpsDays 不只是一場技術研討會，更是一個讓技術知識流動、社群共好的平臺。在技術百鍊成鋼的路上，你的實踐經驗就是最珍貴的寶藏！立即報名成為講者，讓我們一起推動臺灣 DevOps 走得更遠！

日期: 投稿截止：2026 / 3 / 10 (二)

AI Enterprise Summit 2026 講者徵稿

AI Enterprise Summit 誠摯邀請來自企業第一線與 AI 研究領域的專業人士踴躍投稿，分享您讓企業級 AI「真的上線、真的被用、真的創造價值」的獨到經驗。

日期: 投稿截止 2026/2/26（四）