| Databricks | 通用大型語言模型 | LLM | DBRX | 開源
Databricks強調DBRX在語言理解、程式設計及數學邏輯基準測試上的表現,優於LLaMA2-70B、Mixtral和Grok-1開源模型
2024-03-28
| IT周報 | OpenAI | LLM | 機器人 | 微軟 | GPT Builder | Meta | 基礎設施
AI趨勢周報第246期:OpenAI開源內部專用LLM分析工具
OpenAI開源自家超對齊團隊專用的語言模型分析工具;Google臺灣揭露今年三大AI落地戰略;專門用來教導機器人!Covariant發表大型語言模型RFM-1;微軟釋出GPT Builder工具,可打造客製版GPT;DeepMind開發通用AI,可接收指令玩遊戲
2024-03-17
Google運用小型評分器Cappy來提升大型語言模型的效能
Google基於RoBERTa模型開發了Cappy評分器,能夠評估大型語言模型處理指令與輸出回應的正確性,藉此提升下游任務的效能
2024-03-15
IBM與NASA合作,針對具有專業術語和複合詞的科學文獻,開發科學文獻專用的大型語言模型,目前已經在Hugging Face開源
2024-03-14
| CloudFlare | LLM | WAF
Cloudflare發布AI防火牆,保護大型語言模型不被濫用與攻擊
Cloudflare推大型語言模型用防火牆Firewall for AI,供用戶保護語言模型免遭到濫用,其具有進階偵測和管理功能,可防止模型洩漏敏感資料,或是接收不當請求
2024-03-06
| AWS | Mistral AI | LLM
Amazon Bedrock將上架Mistral 7B和Mixtral 8x7B兩開源語言模型
AWS將在雲端人工智慧模型平臺Amazon Bedrock提供兩個Mistral AI模型,分別是輕巧的Mistral 7B,以及可高效處理大量參數和資料的Mixtral 8x7B
2024-02-27
Google公布開源AI模型Gemma,支援多種框架、可跑在筆電上
根據Google公布的測試數據,Gemma 7B在推論、數學、撰寫程式上,超越Llama 2 7B以及Mistral 7B
2024-02-22
Predibase發布LoRA Land服務,集結25個微調模型之力效能可勝GPT-4
Predibase新服務LoRA Land,集合25個以Mistral-7b開源模型為基礎的微調模型,並使單一GPU可支援多模型部署,供用戶以低成本獲得較GPT-4更好的效能
2024-02-21