新聞
![美國華盛頓及史丹佛大學研究團隊發表<s1: Simple test-time scaling>研究,以僅1,000個問題資料集訓練出s1-32B模型,並在數學測驗AIME24及MATH等標竿測試成果超越o1-preview。(<a href="https://arxiv.org/abs/2501.19393">圖片來源/arXiv:2501.19393</a>)](https://s4.itho.me/sites/default/files/styles/picture_size_medium/public/field/image/0207-s1-32b-tu_pian_lai_yuan_-arxiv-960.jpg?itok=neUH4fQ9)
美國華盛頓大學與史丹佛大學的研究團隊揭露降低AI模型開發成本的新方法,以小樣本資料集與20美元硬體費用,也能訓練出推論效能超越o1-preview的AI模型
新聞 | Nemotron-4 340B | Nvidia | 開源模型 | 指令模型 | 獎勵模型 | 合成資料
Nvidia開源Nemotron-4 340B家族,以供開發者建置大型語言模型
Nemotron-4 340B家族包含了基礎模型、指令模型及獎勵模型,其中指令模型可用來生成大型語言模型的訓練資料
2024-06-17
微軟跨平臺應用開發框架.NET MAUI擴充套件登陸VS Code
VS Code開發者現在也可安裝.NET MAUI擴充套件,使用C#和XAML的IntelliSense與熱重載功能,提高UI開發生產力
2024-06-17
新聞 | Copilot +PC | Recall | 資安 | 隱私
微軟延後部署Recall,將趕不及Copilot+ PC首發出貨
本周開始出貨的Copilot+ PC,短期內還無法正式提供基於AI技術的主打功能Recall,因為這項替用戶查找資料的功能太強大,可能導致用戶個資外洩或被駭客用來竊取機密,促使微軟決定延長Recall功能的預覽測試期間以完備其安全機制
2024-06-17
Apple正逐漸擴大程式語言Swift生態系,開放支援多種程式碼編輯器,Swift專案儲存庫現在也獨立為專門的GitHub組織,並釋出Static Linux SDK提升平臺支援
2024-06-17
駭客鎖定WordPress網站下手,目的是要脅瀏覽網站的使用者瀏覽器過舊,藉此散布惡意程式
研究人員揭露針對WordPress而來的攻擊行動,駭客入侵這些網站,然後植入彈出式視窗外掛程式,聲稱使用者的瀏覽器存在弱點必須升級,藉此散布惡意程式
2024-06-16
新聞 | IT周報 | Meta | Transformer | 局部性 | 核融合 | JAX | 蘋果 | WWDC | Apple Intelligence
AI趨勢周報第255期: Google DeepMind開源核融合裝置模擬器TORAX
Google DeepMind用Python-JAX打造托卡馬克核融合裝置模擬器並開源;Meta AI證實Transformer能處理單一像素而非16x16的區塊,效果還更好;健保署聯手Google要打造糖尿病風險預測AI;Nvidia開源HelpSteer2資料集,可低成本確保LLM與人類偏好一致;蘋果新推Apple Intelligence智慧功能
2024-06-16