| MLCommons | LLM | 安全風險 | 基準測試
MLCommons推出第一個LLM安全基準,促進AI風險評估標準化
MLCommons針對大型語言模型的安全性推出AILuminate基準測試,涵蓋12類潛在危險並進行獨立科學評估,Claude 3.5 Haiku、Claude 3.5 Sonnet、Gemma2 9B、Phi 3.5 MoE Instruct皆達非常好(Very Good)的等級
2024-12-08
| 竊資軟體 | PyPI | JarkaStealer | LLM | ChatGPT | Claude
出現命名意圖與兩大AI平臺混淆的可疑開發套件,目的是散播竊資軟體JarkaStealer
卡巴斯基的研究人員發現,有人假借提供能連接大型語言模型(LLM)的API工具為由,鎖定PyPI開發人員散布惡意套件,目的是散布名為JarkaStealer的竊資軟體
2024-11-25
| 血壓 | 國健署 | 衛教 | AI | 高血壓 | WaCare | LLM | Gemini 1.5
國健署聯手業者建置2千家血壓量測站,還導入Google生成式AI來管理數據與衛教
國健署今年展開722血壓量測計畫,不只統一血壓量測標準,如硬體環境、空間等,還導入數位管理工具,來追蹤、管理個案,還串接Gemini模型來驅動AI衛教,循序漸進提供衛教知識給使用者。
2024-11-12
OpenAI新一代具關聯思考能力的模型o1,可逐步分析推理精確解答問題
OpenAI推出全新大型語言模型o1,其能夠運用關聯思考(Chain of Thought)技巧,解決需要深度推理的問題,無論是數學還是程式設計基準測試皆表現出色,目前已在ChatGPT開放測試
2024-09-16
GitHub提供便捷語言模型測試平臺,簡化生成式AI應用開發流程
GitHub新服務提供多種語言模型測試環境,開發者可在瀏覽器IDE Codespaces中進行實驗並部署至生產環境
2024-08-02