| DCLM | 蘋果 | 小語言模型

蘋果再公布二款小模型DCLM

蘋果發表規模分別為14億及70億參數的DCLM模型家族,號稱效能與Llama 3、Gemma或Mistral不相上下,同時更節省訓練運算資源

2024-07-22

| GPT-4o mini | 小語言模型 | OpenAI

OpenAI公布小語言模型GPT-4o mini,理解能力超越Claude Haiku、Gemini Flash

OpenAI強調GPT-4o mini具備低成本及低延遲性等優點,是該公司最具成本效益的小模型,可擴大AI應用廣度和使用普及

2024-07-19

| SmolLM-Corpus | 資料集 | 小語言模型 | SmolLM | Hugging Face

Hugging Face公布可在手機上執行的語言模型SmolLM家族

Hugging Face研究人員公布小語言模型家族SmolLM,強調是以謹慎策畫的高品質資料集訓練而成,同時釋出該資料集並說明其內容及規畫方法

2024-07-18