Ampere, 高通
晶片新創業者Ampere宣布將與高通(Qualcomm)合作開發一款Arm-based AI晶片,以低成本及省電等效益挑戰Nvidia,並預告正在研發256核心CPU。
Ampere是一家Arm-based晶片開發商,自稱開發出第一個雲端原生處理器。微軟Azure、Google Cloud和Oracle Cloud都推出使用Ampere Altra CPU的雲端服務,甲骨文甚至於2023年投資Ampere 1億美元為其主要投資者之一。Ampere Altra CPU是為執行即時AI作業,像是聊天機器人、資料分析及影片內容分析而設計,具備高速推論能力,但訴求比Nvidia GPU便宜。Ampere主要最新宣布中,一是和高通合作開發AI伺服器晶片,二是公告其12通道DDR5平臺處理器的未來CPU產品。
首先,Ampere與高通合作整合其CPU及後者的Cloud AI 100 Ultra AI加速器,開發專為處理LLM推論作業設計的資料中心伺服器晶片,目的在創造無GPU的AI推論(GPU-Free AI Inferencing)。一開始這項合作將使用7奈米的Ampere Altra,在幾個月後加入更新、3奈米的AmpereOne選項。而雙方合作產品第一個客戶是Supermicro,雙方表示以後也會再推廣到其他客戶。
另一項宣布是關於AmpereOne。AmpereOne為支援12通道DDR5記憶體的處理器平臺,現有規畫產品為192核心,預計今年下半推出。AmpereOne下一代為256核心產品,使用相同的氣冷式散熱技術,號稱比現有市面上產品效能提高40%。Ampere也強調AmpereOne產品在OEM及ODM硬體平臺上的效能跑分數據,比AMD伺服器處理器Genoa及Bergamo系列分別高50%及15%,每機架效能則高出34%。
另外,Meta Llama 3現在也登上Oracle Cloud Ampere-based服務,後者底層為128核心Ampere Altera CPU,完全沒有GPU,但該公司說,運行Llama 3的效能不輸執行Nvidia A10+x86 CPU的環境,但用電量僅對手的1/3。
其他宣布包括Ampere加入AI平臺聯盟中新成立的UCIe(通用小晶片互連,Universal Chiplet Interconnect Express)工作小組,將秉持開放介面標準,以便在未來CPU中可整合Ampere和客戶的技術;Ampere CPU結合NETINT的影片處理晶片Quadra T1U,提供360即時通道的同步轉碼,並使用OpenAI Whisper模型提供40道串流的即時翻譯字幕。另外,其CPU除了記憶體標註(Memory Tagging)、QoS執行(QOS Enforcement)及網格壅塞管理(Mesh Congestion Management)等功能外,也新增FlexSKU功能,允許客戶在橫向(scale out)及向上擴充(scale up)部署情境中使用同一SKU。
圖片來源/Ampere
熱門新聞
2024-12-27
2024-12-24
2024-11-29
2024-12-22
2024-12-20