Meta開源Llama 3.1 405B,強調開源才是AI的未來
Meta強調相較於GPT-4o與Claude Sonnet等封閉性模型,規模涵括80億到4千億個參數的Llama 3.1家族除了具備更好的成本與性能,模型的開放性也成為外界微調出小模型的最好選擇
2024-07-24
| Nemotron-4 340B | Nvidia | 開源模型 | 指令模型 | 獎勵模型 | 合成資料
Nvidia開源Nemotron-4 340B家族,以供開發者建置大型語言模型
Nemotron-4 340B家族包含了基礎模型、指令模型及獎勵模型,其中指令模型可用來生成大型語言模型的訓練資料
2024-06-17
| 開源模型 | Mixtral 8x22B | Mistral AI | Mixtral
Mistral AI以Apache 2.0授權釋出Mixtral 8x22B模型,Mixtral 8x22B支援1,760億個參數,以及6.5萬個Token的脈絡長度,成為目前最大的開源模型之一
2024-04-11
Google公布開源AI模型Gemma,支援多種框架、可跑在筆電上
根據Google公布的測試數據,Gemma 7B在推論、數學、撰寫程式上,超越Llama 2 7B以及Mistral 7B
2024-02-22