AWS針對其雲端資料倉儲服務Redshift進行一系列更新,目標是要讓用戶能夠更簡單地擷取資料,並且在安全可靠的環境,快速分析資料。

Redshift現在支援從S3自動複製資料,也就是說,Redshift能夠自動將進到S3儲存桶中的檔案載入到資料倉儲中,這包括CSV、JSON、Parquet和Avro格式,如此用戶便不需要手動,或是重複執行複製程式這些繁瑣的工作。另外,Redshift也開始支援串流擷取,可以從MSK和Kinesis服務,每秒擷取數百MB的資料。

AWS關聯資料庫服務Aurora的零ETL功能也已經與Redshift整合,如此用戶便可以利用Redshift,以接近即時的速度,對儲存在Aurora MySQL資料庫的資料,進行分析和執行機器學習工作負載。AWS解釋了服務整合背後的機制,當交易資料寫入到Aurora後,資料便會在數秒鐘內複製到Redshift中。複製過程不需要用戶手動建構和維護複雜的資料工作管線,還可以選擇從多個Aurora資料庫,複製資料到同一個Redshift執行個體,以跨多個應用程式進行分析。

Redshift執行個體現在能夠被部署於多個可用區域,以增加資料倉儲的可用性,並利用自動恢復將恢復時間降至數秒鐘,另外,Redshift提供動態資料遮罩功能,可以保護儲存在資料倉儲中的敏感資料,限制不同權限的用戶能夠查看到的資料。這使得管理者不需要創建多個資料副本,就能方便不同層級的用戶和群組,存取不同層級的資料。

除此之外,Redshift現在也與Apache Spark整合,使得用戶更容易在Redshift和無伺服器Redshift服務上,建構和執行Spark應用程式。AWS Backup也新增了Redshift的支援,AWS Backup使用戶可以定義備份策略來管理應用程式的資料保護,而現在Redshift也受AWS Backup保護,讓用戶在資料服務獲得更一致的保護功能。

熱門新聞

Advertisement