| Azure AI | Llama 2 | OpenAI GPT-4 Turbo with Vision | Azure AI Studio
微軟Azure AI再增添AI模型Llama2、GPT-4 Turbo with Vision
隨著Azure AI平臺提供的模型選擇更多元,微軟也提供模型標竿測試數據,協助用戶做出採購決策
2023-12-18
| Mistral | LLM | Llama 2 | SMoE | GPT | Mistral AI | Mixtral
Mistral AI開源採用SMoE架構的Mixtral 8x7B模型,整體效能超越Llama 2 70B與GPT-3.5
Mistral AI開源最新模型Mixtral 8x7B,透過採用稀疏混合專家(SMoE)模型架構,在處理大量參數和資料的同時,也維持一定的計算效率,在多數基準測試上超越Llama 2 70B(700億參數)和GPT 3.5模型
2023-12-13
| CKIP-Llama-2-7b | 中研院 | Llama 2
明清研究專用非通用!使用開源簡中語料微調LLM模型引起熱議,中研院宣布已下架繁中優化的大型語言模型CKIP-Llama-2-7b
中研院因在訓練階段部分使用了簡中的開源資料集,使得以Llama 2開發的繁中優化的大型語言模型CKIP-Llama-2-7b,在回答提問時可能出現簡中習慣的用語或詞彙,引起社群廣泛討論和關注。
2023-10-09
| LLM模型 | Llama 2 | 中研院 | CKIP Lab | CKIP-Llama-2-7b
中研院正式開源釋出繁中優化的Llama 2大型語言模型,正式採用Apache2.0釋出
中研院CKIP Lab中文詞知識庫小組,最新開源釋出了以Llama 2開發的繁中優化的大型語言模型CKIP-Llama-2-7b,並提供學術和商用,可運用在文案生成、文學創作、問答系統、客服系統、語言翻譯、文字編修、華語教學等。
2023-10-06
| Meta | Llama 2 | LLM | Llama 2 Long | 長文本
Meta新開源模型Llama 2 Long整體長文處理效能超越GPT-3.5 Turbo
Meta新的Llama 2 Long模型經過持續預訓練,能夠有效處理長文本,並在長、短上下文任務優於當前的開源模型,而且不需要人工註釋資料,整體長上下文表現可超越OpenAI的gpt-3.5-turbo-16k模型
2023-10-03
| Mistral AI | LLM | Llama 2
Mistral AI開源輕巧高效能語言模型Mistral 7B
Mistral AI推出的開源語言模型Mistral 7B,雖只有73億參數,但在各項基準測試上表現優於Llama 2 13B模型,提供開發者另一個高效且具可擴展性的選擇
2023-09-28
| 華碩 | 台智雲 | LLM | Llama 2 | 部署 | Code Llama
台智雲揭企業級LLM服務新進展,9月底將上線3種繁中優化的Llama 2模型
華碩子公司台智雲揭露新進展,要在企業級大型語言模型服務AFS中納入更多模型,包括以繁中資料強化的FFM-Llama 2 7B、13B和70B版本,預計9月底上線。
2023-09-21
IBM計畫在Watsonx.AI平臺提供Meta的Llama 2模型
IBM在自家人工智慧開發平臺Watsonx.AI提供Meta的Llama 2-chat 700模型,使用戶簡單取用模型發展自家的生成式人工智慧應用程式
2023-08-11
Meta和微軟聯手發表可免費商用的大型語言模型Llama 2
Meta開源可商用大型語言模型Llama 2,與微軟合作供用戶簡單在Azure與Windows部署與執行,但用戶也可從AWS以及Hugging Face等平臺取得Llama 2模型
2023-07-19