開源模型 | iThome

柏克萊大學Sky Computing實驗室的NovaSky團隊，以450美元訓練成本打造Sky-T1-32B-Preview開源模型，宣稱效能媲美OpenAI的o1-preview

2025-01-14

阿里巴巴的Qwen Team釋出QwQ-32B-Preview，這個強調推論能力的實驗性研究模型，在AIME及MATH-500基準測試上的表現，勝過了OpenAI的o1-preview

2024-11-29

6月發布開源版圖像生成模型Stable Diffusion 3 Medium慘收負評後，Stability AI企圖以重新打造的Stable Diffusion 3.5模型挽回聲譽

2024-10-23

NVLM 1.0在光學字元辨識以及自然圖像理解的基準測試上，表現優於Llama 3-V、GPT-4o、Claude 3.5 Sonnet及Gemini 1.5 Pro

2024-10-02

Meta強調相較於GPT-4o與Claude Sonnet等封閉性模型，規模涵括80億到4千億個參數的Llama 3.1家族除了具備更好的成本與性能，模型的開放性也成為外界微調出小模型的最好選擇

2024-07-24

Nemotron-4 340B家族包含了基礎模型、指令模型及獎勵模型，其中指令模型可用來生成大型語言模型的訓練資料

2024-06-17

Mistral AI以Apache 2.0授權釋出Mixtral 8x22B模型，Mixtral 8x22B支援1,760億個參數，以及6.5萬個Token的脈絡長度，成為目前最大的開源模型之一

2024-04-11

根據Google公布的測試數據，Gemma 7B在推論、數學、撰寫程式上，超越Llama 2 7B以及Mistral 7B

2024-02-22

iThome 研討會

善用 GenAI 技術和工具，快速打造出更多高性價比的應用，不只是考驗企業的 AI 技術能力，更是基礎架構管理、雲原生開發能力、全方位資安與 IT 永續發展的挑戰。

日期: 即日起~06/25

不論您是技術專家、企業決策者，還是關注 AI 與雲端技術的從業者，iThome Cloud Summit Taiwan 2025 都將為您帶來最前沿的技術洞察與實戰經驗！

日期: 7/2 (三) 08:30 ~ 17:00

Kubernetes Summit 2025 議程徵稿現正開放，誠邀技術專家、架構師、SRE、DevOps 工程師及開發者踴躍投稿，分享您的技術實踐與實戰經驗。

日期: 即日起至 6 月 13 日