Run:ai發展的技術,能協助企業管理和協同底層GPU的運算資源,也是Nvidia既有的合作夥伴
2024-04-25
OpenAI強化API的安全性和管理功能,新增一系列企業級功能,並且更新Assistants API大幅增加助手可擷取的檔案數量,新的向量儲存物件也更靈活好用
2024-04-24
| Amazon Bedrock | AWS | Custom Model Import | 微調 | 客製化 | 模型
AWS發表Amazon Bedrock平臺的Custom Model Import新功能,讓企業用戶將模型上傳Bedrock微調並為特定應用客製化
2024-04-24
微軟公布小語言模型Phi-3家族,宣稱比GPT-3.5T還強
小語言模型Phi-3家族包含三款模型,其中已正式釋出的Phi-3-mini經過微軟推論框架ONNX Runtime優化並支援Windows DirectML,可在多種硬體平臺如CPU、GPU、FPGA甚至行動裝置上執行
2024-04-24
| Intel Gaudi | Habana Gaudi | Habana Labs
英特爾新一代AI加速晶片Gaudi 3出爐,導入台積電5奈米製程,BF16矩陣乘法運算效能可達到上代產品的4倍
2024-04-24
| Los Alamos | Venado | 超級電腦 | Grace Hopper | Grace CPU | Nvidia Grace Hopper
美國洛斯阿拉莫斯國家實驗室啟用第一臺採用Nvidia Grace Hopper的超級電腦
隸屬美國能源部的Los Alamos國家實驗室新落成的超級電腦Venado,是美國首個部署Nvidia Grace CPU的大規模系統
2024-04-23
研究人員分別建立基於GPT、LLaMA-2及Mixtral-8x7B等10種大型語言模型的代理人,並給予已具有CVE編號但尚未被用來攻擊的開源軟體漏洞與描述資料,測試結果顯示只有採用GPT-4的代理人,能夠利用其中75%的漏洞發動攻擊
2024-04-23
| Windows 11 | AI Explorer | AI PC | ARM | 高通
雖然微軟預計和英特爾、AMD共推AI PC,但有使用者發現Windows 11 build 26100程式碼包含微軟計畫中的AI Explorer硬體規格,顯示AI Explorer似乎只提供給最新高通ARM-based電腦
2024-04-23
| GitLab | AI開發助理 | Duo Chat | Duo Pro
GitLab DevSecOps開發AI助理Duo Chat上線,開放付費用戶採購
GitLab的AI助理付費服務Duo Pro增加聊天機器人功能Duo Chat,包含在GitLab 16.11推出,讓付費版用戶透過自然語言與Duo Chat互動,完成DevSecOps程式開發
2024-04-22