| IT周報 | Nvidia | 擴展法則 | 測試階段擴展 | 推理模型 | OpenAI | DeepSeek R1 | Deepmind | 微軟
AI趨勢周報第268期:影響AI表現的3種擴展法則
Nvidia盤點3種影響AI效能的擴展法則,包括預訓練擴展、訓練後擴展和測試階段擴展;DeepMind模型幾何解題能力超越IMO金牌選手;臺灣AI專家發起DeepSeek R1改造計畫;OpenAI揭露未來藍圖;微軟加碼AI機器人Copilot的漏洞懸賞專案
2025-02-15
| IT周報 | LLM | 擴展法則 | MosaicML | 摩根大通 | 多模態 | 金管會 | TinyGPT-V | 蘋果
AI趨勢周報第238期: 突破LLM擴展法則?MosaicML揭新研究成果
MosaicML研究發現,用更長的時間和更多資料訓練小參數模型,可突破LLM擴展法則;摩根大通發表懂圖文的輕量級多模態模型DocLLM;研究員開源28億參數多模態小模型TinyGPT-V;金管會發布金融業運用AI指引草案;蘋果公布多模態AI模型Ferret
2024-01-07