Google推出深度學習專用的容器測試版,這是一個預先打包的容器,經過效能最佳化以及相容性測試,供開發者開箱即用,深度學習容器內含資料科學常用的工具包含Python 3環境,以及GPU用的Nvidia堆疊。深度學習容器提供多種版本,Google也為硬體最佳化了內含的TensorFlow,能用戶在GPU進行訓練,也可以在CPU上部署。

Google提到,啟動並執行機器學習專案,所花的時間通常出乎意料,開發者的目標迭代並改善機器學習模型,但是卻要花費不少的時間,管理軟體堆疊的相容性或是其他複雜的環境設定,以維持環境的一致性,確保實驗結果正確且可重複,而且當機器學習專案開發跨本地端以及雲端,要維持相依項目正確打包,並可以在其他Runtime上執行,更是一項不容易的工程。

為此,Google推出了一系列深度學習容器,提供可移植且一致的開發與測試環境,這些Docker映像檔支援了經過調校的熱門開發框架,可讓用戶隨時部署使用。

深度學習容器不只可以部署在本地端,還能在需要的時候部署到雲端,以獲得更強而有力的運算資源,深度學習容器提供了跨Google各雲端服務一致的開發環境,讓用戶可以靈活地在雲端擴展,或是與企業內部部署互通轉移。

不過,在雲端又可能會缺乏本地端資料以及套件的支援,而Google解決了這個問題,讓用戶以本地檔案擴充深度學習容器,用戶可以將這些客製化的容器部署到Cloud AI Platform Notebooks實例以及GKE上。深度學習容器可以自由地部署在GKE、AI Platform、Cloud Run、Compute Engine,甚至是Docker Swarm上。

所有的深度學習容器都擁有預先配置的Jupyter環境,因此每個容器都可以作為開發雛形空間,而且也都擁有與相對應的深度學習虛擬機器相同的Python 3環境,包括資料科學框架Conda,以及GPU映像檔Nvidia堆疊,像是UDA、cuDNN和NCCL。Google提到,要使用支援GPU的容器,用戶電腦必須安裝相容於CUDA 10的GPU,以及相關的驅動程式和nvidia-docker。

目前在深度學習容器初始版本,提供了TensorFlow 1.13、TensorFlow 2.0、PyTorch和R語言容器,Google接下來會補齊所有深度學習虛擬機器有提供的類型。

熱門新聞

Advertisement