DeepSeek V3多項測試指標領先Llama,中國語言模型引發言論自由與話語權討論
中國人工智慧公司DeepSeek推出具6,710億參數的語言模型DeepSeek V3,技術與效能暫時超越Llama等開放模型。不過,來自中國的語言模型因其審查機制,對全球華語世界的言論多樣性與話語權帶來潛在影響引發關注
2024-12-27
微軟Phi-4語言模型發布,以140億參數挑戰Llama 700億大模型效能
微軟推出140億參數的小型語言模型Phi-4,具備良好的數學推理與語言處理能力,效能媲美700億參數的Llama,目前已在Azure平臺提供,計畫登陸Hugging Face
2024-12-16
| Nous Chat | Nous Research | 聊天機器人 | LLaMA | Hermes 3-70B
AI新創Nous Research發表聊天機器人Nous Chat,其底層模型是以Llama 3.1微調而成,支援長脈絡、多輪對話、複雜角色扮演及內部獨白等功能
2024-11-11
強調開源才是AI的未來,Meta公布Llama模型家族釋出一年後的累積下載次數,其中在Hugging Face平臺已逼近3.5億、成長超過10倍
2024-09-03
Meta發布Purple Llama專案推動開源可信的生成式AI應用
Meta的Purple Llama專案目的在於提供開放人工智慧工具和評估標準,以促進開發者發展負責任的生成式人工智慧應用,目前工具有CyberSec Eval評估標準,和Llama Guard輸入輸出安全分類器
2023-12-08
Meta基於Llama 2推出程式開發語言模型Code Llama,根據Python與自然語言需求,還提供額外兩種變體,並且都有70億、130億和340億參數三種大小可供選擇
2023-08-25
史丹佛大學研究人員使用Meta LLaMA模型,和OpenAI text-davinci-003模型所生成的指令遵循資料集,以不到600美元的成本,訓練出行為與text-davinci-003模型相近的Alpaca 7B模型
2023-03-15
Meta強調LLaMA是一種較小型基礎模型,適合微調後用於多種任務,減少後續大型模型測試、驗證及探索新使用情境的運算資源需求
2023-02-27