微軟周三宣布Azure ND A100 v4 Cloud GPU的雲端運算服務,正式在Azure公有雲平臺上線,號稱是速度最快的超級電腦。
去年11月以預覽版問世的ND A100 v4搭載Nvidia A100 Tensor Core GPU,具備高擴充性提供超級電腦的運算效能,滿足高效能運算(HPC)及AI運算等高速需求的任務。A100 GPU效能是前代V100 GPU的1.7到3.2倍,而在加入新架構功能,像是混合精度模式、稀疏性處理(Sparsity)及多執行個體GPU(multi-instance GPU,MIG)後,則可達20倍。
微軟指出,在一項HPL(High-Performance Linkpack,HPL)標竿測試下,運行於公有雲叢集上的164個ND A100 v4 VM,其運算速度達16.59 petaflops。若和去年11月公布的全球500大超級電腦來比較,這個HPL標竿測試約等同世界第20大,或歐洲第10大的超級電腦。
若以AI和HPC的HPL分項測試項目,這164 VM測試結果為142.8 petaflop,更可躋身已知AI超級電腦的前五大。
ND A100 v4基本服務是1VM 8顆Nvidia Ampere-based A100 Tensor Core GPU起跳,單一叢集甚至可擴充到數千顆GPU,搭載Nvidia HDR 200Gb/s InfiniBand連線,每VM互連頻寬可達到1.6T/s。此外,每8GPU的1VM還具備第3代Nvidia NVlink直接互連技術,使VM內的GPU和GPU連結速度,超過每秒600 Gigabytes。
微軟強調,ND A100 v4採用產業標準的HPC和AI工具及函式庫(Nividia NCCL 2函式庫),用戶不需具備特別軟體或框架,就可使用它的GPU強大運算及互連能力。此外,如果企業在Azure原生部署AI或HPC應用,則Azure Machine Learning服務可提供專為ND A100 v4最佳化的VM及容器環境,內有範例、Jupyter Notebooks可方便快速使用PyTorch、Tensor等框架,用於訓練BERT等模型,和微軟內部工程團隊使用的是相同的Azure工具。
ND A100 v4今天起在美東、美西、美中南及西歐4個Azure區域上線。
熱門新聞
2024-12-27
2024-12-24
2024-11-29
2024-12-22
2024-12-20