AWS為模組化機器學習服務SageMaker加入託管競價型訓練(Managed Spot Training)功能,其使用Amazon EC2競價型執行個體,可以讓用戶在SageMaker的機器學習模型訓練,成本下降多達90%。
開發人員可以使用AWS SageMaker建置、訓練和部署任意規模的模型,除了選用自定義或是內建的演算法外,甚至也能在AWS Marketplace找到適用的演算法訓練模型,並簡單地將實驗規模的機器學習模型,擴展至正式生產規模,開發者透過選擇需要的EC2執行個體類型以及數量,配置工作負載需要的運算資源。
競價型執行個體是AWS雲端中未被使用的執行個體,用戶能以比按需型執行個體還低的價格,使用這些運算資源。而現在開發者也可以在AWS SageMaker中使用競價型執行個體,來訓練機器學習模型,該功能稱為託管競價型訓練。
託管競價型訓練和按需訓練最大的不一樣,就是按需訓練的執行個體在訓練完成之後才會結束,但是託管競價型訓練使用的執行個體,是AWS雲端上閒置的執行個體,因此當AWS需要這些運算資源的時候,機器學習訓練任務會被終止,並由AWS收回這些被占用的執行個體。
不過,由於AWS SageMaker是一個全託管的服務,因此當機器學習訓練任務需要中斷時,服務會自動處理整個過程,並且在擁有足夠運算資源時,重新啟動並恢復訓練工作。
這個AWS SageMaker託管競價型訓練功能,可以用於所有類型的訓練配置,支援所有AWS SageMaker支援的執行個體類型,可用於各種內建演算法所訓練的模型,或是自定義的模型,而且無論是單執行個體訓練、分散式訓練或是自動模型調校,也都可以採用託管競價型訓練。
用戶要使用託管競價型訓練功能,可以在控制臺啟用,或是在Amazon SageMaker SDK中,將Estimator建構器train_use_spot_instances配置成true。
熱門新聞
2025-01-15
2025-01-16
2025-01-13
2025-01-14
2025-01-14
2025-01-13