由繪圖處理器大廠Nvidia維護的容器登錄服務Nvidia GPU Cloud(NGC),發展至今已將近兩年之久,在去年舉行的美國超級電腦大會SC18期間,他們也宣布,NGC目前所提供的軟體框架與應用程式容器環境,已經從2017年的18種增加到41種,橫跨深度學習、高效能運算,以及視覺化處理等多種領域,而到了2019年3月舉行的GTC大會之後,已擴充到55種。
支援多節點叢集架構的容器應用形式,提供更多高效能運算的選擇
在去年下半擴充的應用程式當中,NGC可提供下列幾種容器映像,像是:用於工程與科學領域的可程式化設計平臺MATLAB、計算格點量子色動力學(Lattice Quantum Chromodynamics,LQCD)的軟體套件Chroma、用於研究量子動力學的MILC、完全透過GPU來執行資料科學與分析流程的軟體程式庫RAPIDS,以及針對生物分子系統的建模、視覺化與分析軟體VMD。
在2018年3月底舉行的GTC大會上,Nvidia公布了Nvidia GPU Cloud當時提供的應用程式容器映像的數量有30個,涵蓋的類型有4大類。
到了11月舉行的SC18大會,Nvidia GPU Cloud宣布他們容器映像增加到41個,涵蓋的應用程式類型也擴充到6種。
整體而言,NGC這次更新最受矚目的部分在於,提供支援多節點架構的高效能運算與視覺化的容器環境,能讓超級電腦的使用者在大型運算叢集系統裡面,執行此種類型的工作負載。
基本上,在大型運算環境的部署,我們通常會使用訊息傳遞介面(MPI)這類平行運算的應用程式介面,以便執行橫跨多臺伺服器處理的工作,然而,若要在應用程式容器環境當中運用MPI並不容易,需面對高效能運算系統所定義的許多變數,像是排程機制、網路堆疊、驅動程式的不同版本。
而現在NGC提供的容器登錄服務,能夠針對5種應用程式容器,簡化其多節點部署的初始發布程序,換言之,在多個節點搭配多個GPU的架構執行大量運算負載時,將變得更為容易。
另外,在高效能運算、超級電腦領域相當受到關注的容器執行環境Singularity,NGC也提供更方便的容器部署方式,讓使用者從NGC取得的容器映像,能以系統原生的方式執行在Singularity──NGC所提供的多數Docker容器映像,只需要透過一個步驟,即可在開發者自NGC下拉時,轉換成相容於Singularity的映像,接著可在Singularity runtime執行這些容器。
Nvidia在SC18期間的演講當中,展示了NGC用於視覺化運算與多節點容器架構的情境,他們運用了兩臺DGX-2設備(裡面搭配了Tesla V100),先是載入Singularity的模組、透過MPI的方式橫跨多顆GPU執行Singularity容器,接著從NGC下載並啟動ParaView這套視覺化軟體的容器,即時操作7TB的資料集,並以此呈現M82這個矮人星系噴發大量氣體的模樣。
在SC18大會現場,Nvidia也針對上述高效能運算的NGC容器應用,設立示範專區。
關於Singularity與NGC搭配的多節點應用,以及Nvidia的展示,推動Singularity發展的 Sylabs公司也派出技術作家Ian Lumb講解箇中關鍵。
除了提供更多容器映像與容器環境的支援,Nvidia也宣布另一個與NGC服務生態有關的重大相關消息,那就是NGC就緒計畫(NGC-Ready program),號召多家伺服器與工作站廠商加入,一起提供更多支援NGC應用的運算設備,而符合這樣概念的產品稱為NGC-Ready systems。
這是SC18當時公布的NGC就緒計畫參與廠商,在伺服器的部份,聯想、華為、浪潮、曙光後續也宣布加入;工作站的部分,之後加入的廠商有Dell和Boxx;在雲端服務商的層面,阿里雲、百度、OVH也宣布加入。
目前表態參與NGC-Ready system的合作業者,分為伺服器、工作站、雲端服務等三大類。
在這項計畫推廣初期,Nvidia陸續公布多款可冠上這個名號的機型。第一波產品名單是在SC18大會期間宣布,伺服器的部份,有ATOS BullSequana X1125、Cisco UCS C480ML、Cray CS Storm NX、Dell EMC PowerEdge C4140、HPE Apollo 6500、Supermicro SYS-4029GP-TVRT,工作站的部分,則有HP Z8、聯想ThinkStation P920。
幾週之後,Nvidia繼續揭露第二批支援產品,清一色都是中國伺服器廠商的產品,包括聯想ThinkSystem HG690X、華為FusionServer G560 V5、浪潮NF5468M5、曙光X795-G30。
針對智慧城市與醫療影像等兩種產業應用,提供容器支援
在今年3月舉行的GTC大會期間,NGC所提供的容器映像,特別增加了兩種產業應用的類型,那就是智慧城市與醫療影像,可支援當中的工作流程。
以智慧城市而言,NGC目前有3種容器可供下載,分別是Smart Parking Detection、Transfer Learning Toolkit for Video Streaming Analytics,以及DeepStream。
其中,若以Transfer Learning Toolkit for Video Streaming Analytics為例,能在傳輸學習(Transfer learning)的過程結合智慧視訊分析的工作負載,像是從相機影片的畫面當中,執行物件的偵測與分類,接著,再將這樣經過重新訓練、最佳化與修整的模型,經由Nvidia DeepStream SDK部署到搭配Nvidia Tesla GPU的平臺,或是Jetson開發板上。
而在醫療影像的容器提供上,NGC備有Clara Render Server、CT Organ Segmentation AI。醫療機構可透過Nvidia Clara Train SDK,針對器官分割的MRI掃描結果進行模型的預先訓練,並基於機構現有的資料集來使用傳輸學習,以便改善資料模型。之後,我們可以將Clara Train SDK產生的最佳化模型,部署到Clara Deploy SDK,為位新的病患掃描結果提供進階的分割。
產品資訊
Nvidia GPU Cloud
●建議售價:免費
●支援應用類型:高效能運算、深度學習、機器學習、推論、視覺化、基礎架構
●支援公有雲服務:阿里雲國際版、Amazon Web Services、Google Cloud Platform、微軟Azure、Oracle Cloud Infrastructure
●用戶硬體需求:個人電腦需搭配Nvidia Titan系列或Quadro系列GPU,伺服器需搭配Tesla V100、Tesla P100、Tesla P4/P40,或是採用DGX系列應用設備
【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】
熱門新聞
2024-12-10
2024-12-08
2024-12-10
2024-12-10
2024-12-10
2024-11-29