| Llama 3.1 | Meta | 開源模型

Meta開源Llama 3.1 405B,強調開源才是AI的未來

Meta強調相較於GPT-4o與Claude Sonnet等封閉性模型,規模涵括80億到4千億個參數的Llama 3.1家族除了具備更好的成本與性能,模型的開放性也成為外界微調出小模型的最好選擇

2024-07-24

| Nemotron-4 340B | Nvidia | 開源模型 | 指令模型 | 獎勵模型 | 合成資料

Nvidia開源Nemotron-4 340B家族,以供開發者建置大型語言模型

Nemotron-4 340B家族包含了基礎模型、指令模型及獎勵模型,其中指令模型可用來生成大型語言模型的訓練資料

2024-06-17

| 開源模型 | Mixtral 8x22B | Mistral AI | Mixtral

Mistral AI釋出開源模型Mixtral 8x22B

Mistral AI以Apache 2.0授權釋出Mixtral 8x22B模型,Mixtral 8x22B支援1,760億個參數,以及6.5萬個Token的脈絡長度,成為目前最大的開源模型之一

2024-04-11

| Gemma | google | 開源模型 | LLM

Google公布開源AI模型Gemma,支援多種框架、可跑在筆電上

根據Google公布的測試數據,Gemma 7B在推論、數學、撰寫程式上,超越Llama 2 7B以及Mistral 7B

2024-02-22