現在用戶可以直接在AWS雲端資料倉儲Amazon Redshift中,以SQL指令創建機器學習模型。這項稱作Redshift ML的功能,讓用戶可以使用SQL語法,查詢訓練資料以及指定預測的輸出值,不需要麻煩地人工移動資料,就能快速啟動機器學習模型訓練流程。現在Redshift ML已經在美東、美西、歐洲和南美上線,而亞太則在香港、東京與雪梨地區提供。

Amazon Redshift是AWS的雲端資料倉儲服務,供用戶以SQL跨資料倉儲、營運資料庫和資料湖等EB級儲存,對結構化和半結構化資料進行查詢,AWS提到,當用戶要使用這些資料,訓練機器學習模型時,需要將資料從Amazon Redshift匯出到物件儲存S3儲存桶中,並且配置像是Amazon SageMaker服務,來啟動機器學習訓練流程,這個過程繁瑣且需要多項技能,通常要集結多人才能完成。

為了簡化使用Amazon Redshift資料,進行機器學習運算的麻煩,AWS在Redshift加入機器學習功能,供用戶直接從Redshift叢集創建、訓練和部署機器學習模型,透過SQL指令創建模型後,Redshift ML會自動將資料從Redshift匯出至S3儲存桶,並且呼叫SageMaker Autopilot來準備資料,進行預處理和特徵工程。接著會選擇適當的預建置演算法,並在資料上使用該演算法以訓練模型,當然,用戶也能選擇使用特定的演算法。

Redshift ML功能自動處理了Redshift、S3和SageMaker之間的所有交互操作,包括訓練和編譯牽涉到的所有步驟。在模型訓練完成後,Redshift ML還會使用SageMaker Neo來最佳化模型進行部署,並且以SQL函式的形式,來提供機器學習運算,因此用戶就能夠使用SQL函式,將機器學習模型用於查詢、報告和儀表板上的資料。

另外,用戶可以匯入SageMaker模型到Redshift叢集中,執行本地端推理,也能夠創建在既有SageMaker端點執行遠端推理的SQL函式,不過,在後者的模式,Redshift ML將會進行批次處理,以加速處理速度。

熱門新聞

Advertisement