蘋果發表規模分別為14億及70億參數的DCLM模型家族,號稱效能與Llama 3、Gemma或Mistral不相上下,同時更節省訓練運算資源
2024-07-22
| GPT-4o mini | 小語言模型 | OpenAI
OpenAI公布小語言模型GPT-4o mini,理解能力超越Claude Haiku、Gemini Flash
OpenAI強調GPT-4o mini具備低成本及低延遲性等優點,是該公司最具成本效益的小模型,可擴大AI應用廣度和使用普及
2024-07-19
| SmolLM-Corpus | 資料集 | 小語言模型 | SmolLM | Hugging Face
Hugging Face公布可在手機上執行的語言模型SmolLM家族
Hugging Face研究人員公布小語言模型家族SmolLM,強調是以謹慎策畫的高品質資料集訓練而成,同時釋出該資料集並說明其內容及規畫方法
2024-07-18