推論 | iThome

| AWS | re:Invent | Trainium 2 | 晶片 | UltraServer | Claude 3.5 Haiku | Project Rainier | 加速 | 推論

【re:Invent 2024現場直擊】AWS揭Bedrock AI推論加速功能，能讓Anthropic最新模型推論加速60%

在今年re:Invent年會中，AWS揭露Trainium 2 UltraServer主機，也推出全託管AI平臺Amazon Bedrock的AI推論加速功能預覽版，可加速Llama 3.1模型和Claude 3.5 Haiku模型的推論速度。Anthropic共同創辦人暨運算長Tom Brown還透露，下一代Claude模型將由數十萬顆Trainium 2晶片來訓練。

2024-12-03

| Nvidia | H200 | GPU | 推論 | Blackwell

Nvidia公布Blackwell平臺AI推論Llama 2執行效能，為前代GPU 4倍

Nvidia公布下一代GPU架構Blackwell的執行效能，宣稱執行Llama 2模型的效能是前代產品的4倍

2024-08-29

| Nvidia | LLM | 推論

Nvidia開源TensorRT-LLM函式庫強化H100 GPU大型語言模型推論效能

Nvidia推出TensorRT-LLM模型最佳化函式庫，強化H100 GPU推論能力，協助開發者高效運行大型語言模型，結合動態批次處理技術，提高GPU使用效率

2023-09-12

| google | 3D重建 | AWS | 無伺服器 | ML | 推論 | 國研院 | 地震 | IT周報

AI趨勢周報第188期：Google新技術憑一張RGB照片就產出栩栩如生的3D人像

Google發表3D穿衣人像重建模型Phorhum，只憑一張單眼RGB人物照片，就能重建出栩栩如生的3D穿衣人像；AWS無伺服器機器學習推論服務SageMaker正式發布；國研院打造AI震前預警、震後建物監測系統

2022-04-22

| AI | 微軟 | 語音合成 | google | AutoML | 自然語言 | PDF | Nvidia | TensorRT | 推論 | 萊迪思 | 28奈米 | FPGA | IT周報

AI趨勢周報第114期：快又不漏字！微軟發表FastSpeech能更快產生逼真自然的語音

微軟發表FastSpeech仿真語音生成模型，可快速產生逼真的人類語音，解決語音合成速度緩慢的痛點。Google正式推出AutoML Natural Language，新增了PDF語意理解功能，還可支援5,000個分類標籤，訓練資料量最多可支援1百萬筆文件。Nvidia發表新一代深度學習加速的SDK TensorRT 7，透過優化的編譯器，來加速迴歸和Transformer模型的推論，比傳統CPU快10倍以上。

2019-12-19

iThome 研討會

數位轉型攻略 VII : GenAI 加速企業創新落地，更需要全新 IT 戰略

善用 GenAI 技術和工具，快速打造出更多高性價比的應用，不只是考驗企業的 AI 技術能力，更是基礎架構管理、雲原生開發能力、全方位資安與 IT 永續發展的挑戰。

日期: 即日起~05/07

DevOpsDays Taipei 2025 預售優惠熱賣中！【立即報名】搶先掌握議程亮點，探索技術趨勢、提升實戰技能！

DevOpsDays Taipei 2025是臺灣規模最大的DevOps盛會，將於6月5-6日在臺北文創大樓隆重舉行。活動聚焦DevOps開發與維運的最新趨勢，這是您與來自各地的DevOps實踐者、技術專家和開發者交流互動，並與技術社群和業界專業人士建立連結的絕佳機會！

日期: 6/5 (四) ~ 6/6(五)

CYBERSEC 2025 臺灣資安大會

2025 年臺灣資安大會規模再創新高，超過 300堂專業資安演說，凝聚突破 400 家全球資安品牌

日期: 4/15 (二) ~ 4/17(四)

【CYBERSEC 2025 臺灣資安大會】Threat Research 論壇

Threat Research 論壇將深入探討最新的資安威脅與攻擊趨勢，分析各種攻擊手法與防範策略。論壇邀請業界專家分享關於威脅情報的前沿研究與實務經驗，協助企業提升對新興威脅的防禦能力，保障數位資產的安全。

日期: 4/15 (二) ~ 4/17(四)