GovTech月報第38期:數發部擬推動建立主權AI訓練語料資料庫;TAIDE釋出Llama 3.1版8B模型
數發部宣示將從算力、資金、資料、人才4個方面推動我國AI發展,計畫在今年提出資料創新利用發展條例草案,並將建立主權AI訓練語料資料庫。國科會TAIDE計畫近期釋出以Llama 3.1為基礎的TAIDE 8B模型,加速正體中文解碼速度提升20%。
2025-02-21
| Mistral AI | LLM | 中東 | 印度 | 本地部署
Mistral推出高效能、小型化區域語言模型Saba,專為中東與南亞市場設計
Mistral AI推出具240億參數的Mistral Saba語言模型,專為中東與南亞市場設計,透過高品質資料集提升語言理解,經效能最佳化並支援本地部署,以兼顧推理速度與資料隱私
2025-02-19
| LLM | OpenAI | o3-mini | Deliberative Alignment | jailbreak
資安研究人員聲稱突破OpenAI最新防禦機制,成功在新款機器學習模型o3-mini進行越獄
CyberArk研究員透露,他們對於才正式發表不久、搭載新資安防護機制的o3系列AI模型進行測試,結果發現還是能夠成功越獄,要求AI模型提供網路攻擊步驟及工具
2025-02-11
| SwiftKV | Snowflake | LLM | 知識蒸餾
Snowflake開源可縮減LLM推論時間50%的SwiftKV模型
Snowflake在Hugging Face開源SwiftKV模型,透過模型重組與知識蒸餾,將輸入提示處理計算減半,提升大型語言模型推論效率至2倍,適用於高負載企業應用
2025-01-17
中國AI公司MiniMax推出新LLM,支援400萬Token與多模態應用
中國MiniMax推出MiniMax-01系列,語言模型支援400萬Token上下文處理,性能與頂尖模型相當,多模態模型專注文本與影像結合,適用智慧助理與多媒體生成,定價具競爭力但存政策風險
2025-01-17