| AWS | AWS re:Invent 2024 | 運算 | 執行個體 | Nvidia | Blackwell | UltraServer
【re:Invent 2024現場直擊】AWS執行長揭運算服務新亮點,專為GAI設計推P6、Trn2和Trn2 UltraServer執行個體
在今日主題演講中,AWS執行長Matt Garman揭露一系列運算新亮點,包括採用Nvidia Blackwell GPU的P6系列EC2執行個體、AWS自研晶片Trainium2的EC2 Trn2執行個體,以及由4個Trn2執行個體組成的Trn2 UltraServer執行個體,可用來訓練兆級參數模型。另外,新一代Trainium3晶片將於明年推出。
2024-12-04
| AWS | re:Invent | Trainium 2 | 晶片 | UltraServer | Claude 3.5 Haiku | Project Rainier | 加速 | 推論
【re:Invent 2024現場直擊】AWS揭Bedrock AI推論加速功能,能讓Anthropic最新模型推論加速60%
在今年re:Invent年會中,AWS揭露Trainium 2 UltraServer主機,也推出全託管AI平臺Amazon Bedrock的AI推論加速功能預覽版,可加速Llama 3.1模型和Claude 3.5 Haiku模型的推論速度。Anthropic共同創辦人暨運算長Tom Brown還透露,下一代Claude模型將由數十萬顆Trainium 2晶片來訓練。
2024-12-03
Anthropic也將運用AWS Trainium及Inferentia晶片,來訓練和部署未來的基礎模型
2024-11-25
| AWS | Lambda | Python | .NET
AWS Lambda SnapStart支援Python、.NET,函式啟動時間低於1秒
除了Java,AWS Lambda SnapStart現在擴展支援Python、.NET,透過快取執行環境快照,大幅縮短啟動時間至低於1秒,特別適用於即時分析、API呼叫與機器學習應用場景
2024-11-20
Amazon Q Developer終於也有內嵌聊天功能,在程式碼編輯器就可與AI助理互動
現在Amazon Q Developer也具內嵌聊天功能,開發者不需要切換視窗,直接在編輯器內就可獲得程式碼建議,執行程式碼最佳化和添加註解等工作
2024-11-01
資安業者警告,多個熱門行動程式直接將AWS與Azure憑證寫入程式中
賽門鐵克發現多個熱門行動程式開發商直接在程式中寫入未加密的AWS或Azure憑證,將允許駭客破壞應用程式的後端基礎設施、竊取用戶資料,或是中斷服務
2024-10-24
原本僅支援macOS、Windows的AWS容器工具Finch,最新版本開始支援Linux,提供跨平臺一致的容器開發體驗,簡化流程並支援Docker API
2024-10-18