Transformer | iThome

| Google DeepMind | 銘文 | Aeneas | 拉丁銘文 | Transformer

Google DeepMind發表可用來分析古代拉丁銘文的AI模型Aeneas

Aeneas號稱是首個具備「古代銘文脈絡化」能力的AI模型

2025-07-24

| google | 生成式AI | Titans | Transformer

Google發表新Titans模型融合長短期記憶與注意力機制，突破200萬上下文Token限制

Google開源Titans模型架構研究，結合短期與長期記憶與注意力機制，支援超過200萬Token上下文，突破生成式人工智慧瓶頸，對長序列處理和語言建模帶來重大改進

2025-01-20

| IT周報 | AI | google | 長期記憶 | Transformer | OpenAI | AI代理 | 微軟 | 材料設計 | 國科會

AI趨勢周報第266期：比Transformer更好！Google新模型更擅長長期記憶

Google研究院發表一款新模型Titans，可處理的上下文長度高達200萬個Token；OpenAI測試ChatGPT Tasks新功能，化身AI代理；微軟MatterGen模型突破材料設計限制；媲美o1 Preview的推理模型來了；MIT揭露2025年十大科技趨勢預測；國科會揭AI基本法草案進展

2025-01-19

| IT周報 | Mamba | 程式碼生成 | Meta | Llama 3.1 | 蘋果 | Transformer | Nvidia

AI趨勢周報第257期： Mistral AI用Mamba架構打造程式碼生成模型

Mistral AI用Mamba 2架構打造程式碼生成模型，表現比同規模的Transformer模型好；Hugging Face釋出小又強健的語言模型SmolLM；Meta開源Llama 3.1 405B；有效加速Transformer生成時間，蘋果推LazyLLM；Nvidia推出企業級模型客製化平臺AI Foundry

2024-07-26

| IT周報 | Meta | Transformer | 局部性 | 核融合 | JAX | 蘋果 | WWDC | Apple Intelligence

AI趨勢周報第255期： Google DeepMind開源核融合裝置模擬器TORAX

Google DeepMind用Python-JAX打造托卡馬克核融合裝置模擬器並開源；Meta AI證實Transformer能處理單一像素而非16x16的區塊，效果還更好；健保署聯手Google要打造糖尿病風險預測AI；Nvidia開源HelpSteer2資料集，可低成本確保LLM與人類偏好一致；蘋果新推Apple Intelligence智慧功能

2024-06-16

| IT周報 | Transformer | xLSTM | LLM | 國科會 | TAIDE | Deepmind | 分子結構 | AI開發助理

AI趨勢周報第252期：取代Transformer？LSTM之父發表新LLM架構

LSTM之父Sepp Hochreiter提出一種新架構xLSTM，媲美Transformer；DeepMind發表可預測所有生命分子結構的AlphaFold 3模型；國科會揭TAIDE計畫最新成果；甲骨文也推出AI開發助理了；Red Hat推出AI平臺，內建IBM Granite模型；Stack Overflow聯手OpenAI，將優化Chatbot功能

2024-05-12

| IT周報 | Mamba | Transformer | google | Gemini | AWS | 思科 | AI助理 | AI聯盟

AI趨勢周報第235期：Mamba架構橫空出世，克服Transformer運算效率缺陷還具5倍吞吐量

Mamba引起AI社群關注，採狀態空間模型實現5倍吞吐量；GPT-4V最強對手來了，Google多模態Gemini模型登場；Meta、IBM等巨頭合組開源AI聯盟；Google發表新一代TPU和超級電腦架構；JetBrains新AI程式開發助理整合自家IDE

2023-12-10

| LLM | 串流 | 注意力機制 | Transformer | 語言模型串流應用

高效框架StreamingLLM可處理無限長度文本，解決LLM串流應用困境

研究人員開發出StreamingLLM框架，使語言模型能夠處理無限長度的文本，解決記憶體消耗與長序列泛化問題，提升在串流應用部署語言模型的可行性

2023-10-05

| PyTorch | Transformer | 機器學習

深度學習函式庫PyTorch 2.0正式發布，帶來高效能Transformer API與模型編譯器

PyTorch 2.0添加高效能Transformer API以及torch.compile編譯器，開發者可明顯感覺模型訓練與推理運算加速

2023-03-16

| IT周報 | google | Transformer | 機器人 | 導航 | 資料集 | 搜尋 | 大型主機

AI趨勢周報第210期：Google用Transformer模型即時導航機器人

Google成功用Transformer模型即時導航機器人，延遲僅8毫秒；司法院法庭中文語音辨識系統正式上線，準確率超過9成；Google搜尋再優化，新添資料集搜索引擎；Brave搜尋引擎自建生成式AI，幫摘要搜尋結果；IBM大型主機作業系統將擁抱AI

2023-03-09

| 微軟 | DirectML | PyTorch | Transformer

最新版DirectML PyTorch開始支援熱門Transformer模型

開發者現在可以使用DirectML PyTorch最新版本，利用GPU加速來訓練包括GPT2、BERT等熱門Transformer模型

2022-12-07

| Apache OpenNLP | ONNX Runtime | Transformer

Apache OpenNLP整合ONNX Runtime現可高效執行Transformer模型

Java NLP機器學習函式庫Apache OpenNLP藉由整合ONNX Runtime，開始能夠執行Transformer模型，使用戶獲得高效深度學習自然語言處理的能力

2022-09-23

iThome 研討會

IT EXPLAINED 數位轉型攻略 VIII

GenAI 加速企業創新落地，更需要全新 IT 戰略

日期: 即日起~04/01

CYBERSEC 2026 臺灣資安大會

CYBERSEC 2026 臺灣資安大會以「RESILIENT FUTURE」為主軸，回應風險成為日常的現實，探討如何培養能在衝擊後迅速回復，並在持續變動中不斷強化的韌性能力，作為面對資安威脅的關鍵基礎，共同打造穩定可信的數位環境。

日期: 5/5 (二) ~ 5/7(四)

DevOpsDays Taipei 2026 即刻開放徵求講者

DevOpsDays 不只是一場技術研討會，更是一個讓技術知識流動、社群共好的平臺。在技術百鍊成鋼的路上，你的實踐經驗就是最珍貴的寶藏！立即報名成為講者，讓我們一起推動臺灣 DevOps 走得更遠！

日期: 投稿截止：2026 / 3 / 10 (二)

AI Enterprise Summit 2026 講者徵稿

AI Enterprise Summit 誠摯邀請來自企業第一線與 AI 研究領域的專業人士踴躍投稿，分享您讓企業級 AI「真的上線、真的被用、真的創造價值」的獨到經驗。

日期: 投稿截止 2026/2/26（四）