AWS更新Redshift簡化資料擷取並提升可靠性

AWS針對其雲端資料倉儲服務Redshift進行一系列更新，目標是要讓用戶能夠更簡單地擷取資料，並且在安全可靠的環境，快速分析資料。

Redshift現在支援從S3自動複製資料，也就是說，Redshift能夠自動將進到S3儲存桶中的檔案載入到資料倉儲中，這包括CSV、JSON、Parquet和Avro格式，如此用戶便不需要手動，或是重複執行複製程式這些繁瑣的工作。另外，Redshift也開始支援串流擷取，可以從MSK和Kinesis服務，每秒擷取數百MB的資料。

AWS關聯資料庫服務Aurora的零ETL功能也已經與Redshift整合，如此用戶便可以利用Redshift，以接近即時的速度，對儲存在Aurora MySQL資料庫的資料，進行分析和執行機器學習工作負載。AWS解釋了服務整合背後的機制，當交易資料寫入到Aurora後，資料便會在數秒鐘內複製到Redshift中。複製過程不需要用戶手動建構和維護複雜的資料工作管線，還可以選擇從多個Aurora資料庫，複製資料到同一個Redshift執行個體，以跨多個應用程式進行分析。

Redshift執行個體現在能夠被部署於多個可用區域，以增加資料倉儲的可用性，並利用自動恢復將恢復時間降至數秒鐘，另外，Redshift提供動態資料遮罩功能，可以保護儲存在資料倉儲中的敏感資料，限制不同權限的用戶能夠查看到的資料。這使得管理者不需要創建多個資料副本，就能方便不同層級的用戶和群組，存取不同層級的資料。

除此之外，Redshift現在也與Apache Spark整合，使得用戶更容易在Redshift和無伺服器Redshift服務上，建構和執行Spark應用程式。AWS Backup也新增了Redshift的支援，AWS Backup使用戶可以定義備份策略來管理應用程式的資料保護，而現在Redshift也受AWS Backup保護，讓用戶在資料服務獲得更一致的保護功能。

熱門新聞