今年5月Nvidia在GTC大會期間,推出新一代GPU架構Ampere,以及採用這個架構的GPU加速器A100,而在10月的GTC秋季大會上,他們發表了同樣採用Ampere架構,以及PCIe 4.0 I/O介面的兩款GPU加速卡,我們現在要介紹的,就是其中一款鎖定資料中心應用領域的A40,預計將於2021年初從OEM的伺服器廠商端供應,例如,Cisco、Dell、Fujitsu、HPE、聯想等公司,都將推出基於A40的多款伺服器。

A40這款產品的推出,機型名稱前面並未冠上任何的品牌系列,又是被Nvdia認定是用於資料中心的GPU加速卡,不免讓人聯想到更早之前發表的T4,兩者之間有關嗎?

在GTC秋季大會的會前線上記者會,Nvidia並沒有正面回答這個問題,但他們表示,A40是接續RTX 6000與RTX 8000這兩款GPU加速卡而來,它將在板卡上提供3個DisplayPort 1.4規格的視訊連接埠。之所以這樣設計,是因為他們收到許多客戶的需求,希望能在支援RTX技術的資料中心GPU當中,增添實體視訊輸出的功能,而在目前RTX 6000與RTX 8000,並未具備這樣的規格。

而且,A40主要是用於伺服器運算環境當中,但Nvidia也提到,這款產品與Quadro RTX系列之間的差異,的確是較少的。

到了2021年初,Nvidia的vGPU軟體也將開始支援A40,因此,他們旗下的多種虛擬GPU應用解決方案,像是:Quadro Virtual Data Center Workstation(vDWS)、GRID Virtual PC(vPC)、GRID vApps(Virtual Apps)、vCS(Virtual Compute Server),都可以搭配A40來使用。相較之下,早先推出的A100則是以支援vCS為主。

就技術規格而言,A40這款產品不只是具備Ampere架構的CUDA核心與Tensor Core,也提供了RT Core、顯示器連接器(A100因為是針對人工智慧與高效能運算領域的運算負載,並未提供),可加速圖形、渲染、人工智慧的處理。

搭配新架構之後,A40的CUDA核心在FP32運算的應用上,能提供2倍的吞吐能力;由於Ampere架構也搭配了第三代的Tensor Core,能讓A40提供5倍的吞吐能力,並搭配新的資料格式TF32(TensorFloat-32),以及BF16(Bfloat16),若是再結合新支援的結構化稀疏性處理(Sparsity),可達到10倍的浮點運算吞吐能力。

而在RT Core的部份,能以硬體來加速光線追蹤(ray tracing)的處理,相較於Turing架構開始提供的RT Core,A40搭配的是第二代規格,提供兩倍的運算吞吐能力,並增加可同時運行(concurrently)的光線追蹤、著色(shading)和降噪(denoising)等運算處理。

相較於A100配置40GB、HBM2的GPU記憶體,下半年發表的A40採用的是48GB、DDR6的規格,提供更大的記憶體容量,若透過NVLink連接另一張A40,可將GPU記憶體擴充至96GB。

就整體規格而言,Nvidia僅在自家網站揭露A40的部分組態,例如,GPU記憶體的容量、頻寬,GPU互連頻寬,視訊連接埠,功耗,vGPU軟體支援應用類型,並未提及GPU運算晶片本身的製程。

值得注意的是,Nvidia公開的A40規格當中,也有一些過去較少見到的配備,例如,內建信任根(Root of Trust),這裡搭配的是Microchip的CEC 1712,以此提升系統開機安全性;支援電信業者環境看重的NEBS(Network Equipment-Building System)認證標準,A40可符合NEBS第三級的要求。由此來看,A40對於大規模部署採用與用於大型機房的配置,也有了更周延的準備。或許等到2021年初,A40正式出貨之後,Nvidia會揭露更完整的規格資訊。

至於其他配置,我們是在其他合作廠商網站上看到他們揭露相關資訊,例如,目前麗臺科技就列出A40的規格,像是CUDA核心數量、Tensor Core數量、RT Core數量,雖然該公司並未列於Nvidia明年初OEM伺服器廠商清單,但他們提到的這些資訊,的確與TechPowerUpTechRadarServeTheHome等IT新聞網站所提到的規格大致相符。

產品資訊

Nvidia A40
●原廠:Nvidia
●建議售價:廠商未提供
●外型:介面卡(PCIe 4.0 x 16)
●GPU架構:Ampere
●GPU核心:10752顆CUDA核心,336顆Tensor核心
●GPU記憶體:48 GB GDDR6
●記憶體頻寬:696 GB/s 以上
●熱設計功耗:300瓦
●顯示器連接埠:3個 DisplayPort 1.4
●GPU互連介面頻寬:112.5 GB/s

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】

熱門新聞

Advertisement