圖片來源: 

Google

重點新聞(0110~0117)

Titans     Google     Transformer  

比Transformer更好!Google新模型Titans更擅長長期記憶

最近,Google研究院團隊發表一款新模型Titans,整合了短期記憶、長期記憶與注意力機制,號稱比Transformer架構和線性RNN更擅長處理長期記憶資料,而且可處理的上下文長度高達200萬個Token。進一步來說,Transformer擅長短期任務,但要處理長期任務,就得耗費大量運算資源,而且時間一長,還會丟失重要細節。為此,團隊設計一款神經長期記憶模組,能在處理當下資訊的同時,也使用長期資訊。

他們將這個模組結合注意力機制,開發出Titans。這個設計,讓模型在不損失準確度的同時,還能處理大量資料,而且,藉由深層化與非線性化的記憶模組設計和遺忘機制等技術,Titans大幅提升記憶的管理效率。Google研究院還根據不同任務需求,開發出3種Titans版本,包括MAC、MAG和MAL。其中,MAC適合處理詳細歷史上下文的任務,MAG則擅長調整即時資料和歷史資訊的重要性比重,專注目前最相關的資訊。MAL效率較高,但整體表現可能略受限制。

經測試,Titans在語言建模、常識推論、時間序列分析和基因資料建模等領域,都遠超過現有基準模型表現,特別是在超長序列處理方面。無論是語言建模還是時間序列預測,Titans在準確性與效率都展現壓倒性優勢,甚至在部分場景中還超GPT-4等具有數十倍參數量的超大型生成式模型。(詳全文)

OpenAI     AI代理     ChatGPT  

OpenAI測試ChatGPT Tasks新功能,化身AI代理

OpenAI正在測試一款ChatGPT新功能,這個功能叫做Tasks,能將ChatGPT化身為任務自動化的AI代理,也就是說,使用者可用Tasks來讓ChatGPT自動執行排程任務。目前該功能已開放Beta測試版給Plus、Team和Pro方案用戶,預計正式推出後開放給更多人使用。

在Beta版本中,用戶已經可用ChatGPT提示,來讓ChatGPT自我排程並自動執行,例如讓ChatGPT每天下午匯整AI新聞簡報、每天和用戶練習法文、提醒母親3月13日生日,用戶可設定任何時間、一次性或重覆執行任務,不論用戶是否在線上,ChatGPT都會執行任務。完成後,系統也會傳送通知或電子郵件。值得注意的是,Tasks由GPT-4o模型驅動,因此ChatGPT方案的使用限制也會套用在Tasks上。雖然目前的Tasks版本不支援語音對話、檔案上傳,也不適用於客製化的GPTs,但支援ChatGPT Web、iOS和Android版本,今年第一季後也能支援Windows App。(詳全文)

  微軟     材料設計     MatterGen  

微軟MatterGen模型突破材料設計限制

最近,微軟揭露一款生成式AI模型MatterGen,可用來設計新無機材料。進一步來說,傳統的材料設計往往仰賴大量的試錯實驗,或計算、篩選既有材料資料庫,但這些方法需要篩選數百萬個候選材料,才能找到滿足需求的少數材料。MatterGen能解決這個問題,它採專為無機材料設計的擴散模型架構,能處理材料的周期性和三維幾何結構,模仿影像生成模型消除雜訊的過程,從隨機結構中,逐步生成穩定且符合特定要求的材料。

該模型用60萬筆穩定材料資料訓練而成,資料來自Materials Project與Alexandria等權威資料庫,其生成性能在穩定性、新穎性與多樣性方面都超越了其他現有方法。MatterGen的特點是依據材料設計需求,進行條件式生成;它能針對化學組成進行定向生成,例如指定元素或化學結構來生成特定材料,還能調整晶體的對稱性來滿足應用需求。此外,MatterGen也能對機械、電子或磁性等物理性質進行優化,支援多重約束條件的材料設計。微軟MatterGen研究團隊還實際與中國深圳先進技術研究院合作,成功合成新材料TaCr₂O₆。微軟表示,這個技術可望用於電池、磁性材料等領域,例如設計高效太陽能電池材料、成本更低的儲能電池等。(詳全文)

  推理模型    NovaSky      o1 Preview  

媲美o1 Preview的推理模型來了

美國伯克萊大學NovaSky團隊日前開源自建的AI模型Sky-T1-32B-Preview,號稱在常見的理解和程式基準測試,表現都與OpenAI的o1-preview相當,且訓練成本才450美元(不計算硬體)。團隊打造這套模型的動機是,OpenAI o1、Gemini 2.0 Flash Thinking Mode這類模型雖很擅長解決複雜問題、能產生很長的思維鏈(CoT),但模型技術細節和權重都不開源,很難為學術及開源社群使用。

因此,研究團隊選定QwQ-32B-Preview模型來生成訓練資料,再透過拒絕採樣(rejection sampling)方法篩選,最終整理出約17,000筆資料的訓練資料集,包括APPs和TACO資料庫的5,000行程式碼,NuminaMATH資料集下的AIME、MATH和Olympiads子資料集,以及約1,000筆STILL-2生成的科學和解題資料。Sky-T1-32B-Preview是以QwQ-32B-Instruct為基礎模型,微調而成,並在8顆H100的平臺上用DeepSpeed Zero-3 offload優化技術,再以Llama-Factory花19小時完成訓練。這款模型在數學和程式基準測試中,表現不只與o1-preview相當,在所有測試中也優於Qwen-2.5-32B-Instruct。(詳全文)

  生成式AI搜尋     MIT科技評論     小型語言模型  

《MIT科技評論》揭露2025年十大科技趨勢預測

自1899年發行至今的《MIT科技評論》日前發布2025年十大科技趨勢預測,其中包括生成式AI搜尋、小型語言模型、無人計程車、生成式AI加速學習的機器人等。進一步來說,生成式AI搜尋靠多模態AI模型分析文字、影片、圖片、音訊等多種類型資料,能快速將資訊摘要給使用者,不再是單純列出連結、讓使用者自己判斷,改變了搜尋體驗。MIT科技評論點出,目前已有Google、微軟等搜尋龍頭和OpenAI在2024年推出生成式AI搜尋體驗,這種搜尋體驗也是目前可見的AI代理初階應用。

再來,輕量、便宜且耗能相對低的小型語言模型將崛起,這類小型模型在特定領域的表現將媲美昂貴的大型語言模型。而經過數年的測試,無人計程車現在在全球10幾個城市中正式供大眾使用,將在今年更加普及。另一方面,MIT科技評論認為,由於生成式AI快速發展,機器人學習新任務的速度比以往任何時候都快,這讓目前可自主決策的機器人,不再只會特定一招,而是具備更多技能—— 「我們正在接近通用機器人,這種機器人可以進入新環境,立即為我們處理各種任務,」MIT科技評論形容。

其他幾項科技趨勢預測,還包括今年即將上線、可觀測銀河與暗物質的薇拉.魯賓天文臺;治療牛群打嗝的有效方法將出現,因為牛群打嗝是農業溫室氣體的排放大宗;更乾淨的飛機燃料,如廢棄食用油、工業廢料合成的燃料;長效型愛滋病毒預防藥物;排放更少二氧化碳的綠色鋼鐵工廠;有效的幹細胞療法。(詳全文)

  Nvidia     護欄     Guardrails  

瞄準AI代理需求,Nvidia推AI護欄微服務、內容安全防範工具

Nvidia最近推出NIM AI護欄微服務,要來解決企業對AI代理資料安全和不遵從指令的疑慮。這款NIM AI護欄微服務是Nvidia NeMo Guardrails護欄工具集的一部分,都是以NIM微服務提供,包含內容安全、主題控管及越獄偵測。

新推出的內容安全微服務,可防止AI產出偏見或有害的回覆,主題控管微服務則能確保對話內容的主題在許可範圍內,避免離題或不適當內容。越獄偵測微服務則防範使用者越獄,以免AI遭到不當利用的攻擊。Nvidia指出,企業開發者可在開發AI代理時,使用這些輕量的微服務作為護欄,來控管特定的AI工作流程。而且這些模型輕巧,可高速執行、降低延遲,在遠端辦公或頻寬不足的地方也能執行。(詳全文)

  國科會     科技發展     AI基本法草案  

國科會揭2026年度科技發展布局、AI基本法草案進展及影響

國科會在14日揭露2026年度科技發展布局,規畫1,800億元科技預算來推動5大信賴產業和國家希望工程。其中,5大信賴產業是指半導體、AI、軍工、安控、次世代通訊,國家希望工程則指中小微型企業數位創新、創新創業雨林生態系、科技創新(如太空科技、量子、資安和生醫及精準健康等)、數位新社會等。這兩項國家工程涵蓋不少計畫,像是淨零科技方案、臺灣運動x科技行動計畫、晶創臺灣方案、大南方-新矽谷推動方案、臺灣AI行動計畫2.0、高齡科技方案,以及正在規畫的次世代通訊科技方案、智慧國家2.0方案。

在明年科技布局中,AI和晶片是一大發展重點。國科會提出5大方法來塑造臺灣主權AI,包括培養跨領域開創性的系統研發人才、補助中小型公司、打造供需媒合平臺、制定AI基本法草案,以及重新定位高等教育目標等,來實現3個目標:強化臺灣AI系統研發能力、形塑臺灣AI系統設計製造和應用的產業,以及養成人民運用AI工具和系統的文化。

國科會也揭露AI基本法草案進展,繼去年9月結束草案預告後,他們修改了部分草案內容,包括將原本的風險「分級」調整為風險「分類」,來接軌美國等促進創新的國家做法。國科會表示,後續將由數位部參考國際標準或規範,來制定風險分類框架,各目的事業主管機關再依這個框架,來訂定自己的主管業務風險分類和管理規範。最後則由行政院數位法制協調會議,來統籌、盤點各部會的AI作用法和配套措施。同時,國科會將持續發展臺灣大型語言模型,要精進既有的TAIDE模型計畫,比如持續蒐集臺灣本土特色資料集、結合國際最新開源模型,再加上國科會建置的算力資源,來優化TAIDE模型。(詳全文)

  出口管制     GPU     模型  

拜登政府祭AI出口管制法規

美國商務部工業和安全局日前發布《人工智慧擴散出口管制框架》(The Export Control Framework for AI Diffusion)暫行最終規則(IFR),限制美國進階AI技術和GPU的出口。簡單來說,美國政府會根據目的地敏感性、運算效能數量、AI模型效能和安全要求等加以審查出口與否,不過,該框架也明定了20個出口盟國,允許美國企業自由出口這些AI技術和產品,這些盟國包括主要西方國家、臺灣、南韓和日本等。

不在名單內的非盟國將面臨限制,例如以色列、新加坡、巴西、印度、印尼、馬來西亞和墨西哥等國,將受到出口上限限制,必須申請許可才能行,且完全禁止向美國對手出口。但供應鏈活動可以豁免,晶片可以移動到需要封裝或測試的地方。大學、醫療、研究機構採購一定總處理效能(TPP)的晶片則不需授權,也不計入國家採購晶片限額。不過,美國科技業者對此規範強烈反對,比如Nvidia就批評,世界各地的公司、新創和大學都在利用先進AI來推動醫療、農業、製造、教育和眾多領域的發展。甲骨文則指出,商務部的草案過於複雜且範圍太大,資訊科技及創新基金會也認為,監控國家出口的運算總量,既不切實際、也不公平。(詳全文)

圖片來源/Google研究院、OpenAI、微軟、伯克萊大學

  AI近期新聞 

1. M365 with Copilot將從臺灣等6國測試漲價,但可以關閉它

2. Mistral更新程式碼生成模型Codestral 25.01,刷新基準測試紀錄

3. Android Studio Ladybug功能更新,強化AI輔助

4. Snowflake開源可縮減LLM推論時間50%的SwiftKV模型

資料來源:iThome整理,2025年1月

熱門新聞

Advertisement