AWS在資料庫節點ra3.4xl和ra3.16xl,加入了進階查詢加速器(Advanced Query Accelerator,AQUA),這是一個加速層,可將運算擺放到靠近資料儲存的地方執行,以減少網路流量和CPU的開銷,大幅提升查詢效率。

AWS提到,AQUA是一個分散式且硬體加速快取,可以讓Amazon Redshift資料倉儲在處理特定查詢時,比其他廠商的資料倉儲速度快上10倍,而且在ra3.4xl和ra3.16xl節點類型,用戶並不需要為AQUA額外支付費用。

AWS在2019年時,在Redshift提供了使用SSD儲存的節點類型RA3,並且在去年4月的時候,加入包括ra3.4xlarge等其他大小的節點,還在12月的時候,加入搭載託管儲存的RA3.xlplus節點,這些節點除了具有大頻寬的網路連結外,還使用了複雜的資料管理模型。

AWS解釋,每個RA3節點都具有大容量且高效能的SSD儲存,並從底層的物件儲存服務S3,獲得儲存可縮放性、高耐用性和高效能等優點,儲存系統會提供像是資料塊溫度、資料阻塞和工作負載模式等提示,來管理高效能快取,以實現高效能儲存,資料會自動被放到適當的儲存層中,用戶不需要介入,就能獲得最佳化配置。

用戶使用RA3節點來維護非常大的資料集,單個資料倉儲最多可儲存的資料達32 PB,AWS提到,當資料倉儲中的資料不斷成長,儲存成長的幅度超過CPU的效能增長,大量資料和網路流量,可能使得網路和CPU頻寬成為限制因子。

為了解決這個問題,AWS開發了AQUA,這是一個建立在RA3快取基礎上的加速器,其充分使用AWS Nitro系統和自定義FPGA加速功能,並將資料精簡(Reduction)和聚合查詢所需要的運算,放置在資料端附近執行,借此減少網路流量,減輕RA3節點中CPU的工作負擔,並允許AQUA將特定查詢的效能提高多達10倍。

這個新功能不需要額外支付費用,也不需要用戶更動任何程式碼,已經使用ra3.4xl或ra3.16xl節點託管資料倉儲的用戶,可以在數分鐘內開始使用AQUA,僅需要在叢集中啟用AQUA,並且重新啟動叢集,就可以在資料精簡和聚合查詢時,獲得極大的效能改善。

AWS提到,AQUA可以極大程度降低查詢時間,甚至可以讓部分新類型的查詢獲得即時的結果,而這些查詢可能在過去不可能實現,或是不切實際。

AQUA快取的資料都會以用戶的金鑰加密,在執行過濾和聚合操作之後,AQUA就會壓縮結果並且進行加密,然後把資料回傳至Redshift。目前該服務已經在美東、美西和歐洲地區提供,而亞太現在先在東京上線,2021上半年還會陸續在雪梨和新加坡提供。


熱門新聞

Advertisement