針對應用程式的韌性(Resilience)需求,AWS推出Resilience Hub服務,供使用者定義、追蹤和管理應用程式的韌性。Resilience Hub讓用戶制定恢復時間目標(Recovery Time Objective,RTO),以及恢復點目標(Recovery Point Objective,RPO),並且根據這些目標,評估應用程式的配置是否滿足要求。

AWS提到,建構分散式系統很難,要維持系統一直在正常運作狀態更難,用戶不應該擔心系統是否會故障,而是應該關注系統什麼時候故障,並且為此做好準備。用來衡量韌性的指標通常有兩個,一個是從故障恢復所需要的時間RTO,以及故障意外發生後,資料可能丟失的最大時窗RPO,依據用戶的業務和應用程式,指標可以用秒、分、小時和天來衡量。

用戶可以在AWS Resilience Hub中設定每個應用程式的RTO和RPO,該服務會提供建議和韌性分數,供用戶追蹤應用程式的韌性。AWS Resilience Hub能夠探索由AWS CloudFormation部署的應用程式,包括跨地區和帳戶的堆疊,並且還能從資源群組和標籤中發現應用程式,或是從AWS Service Catalog AppRegistry中選擇已經定義的應用程式。

AWS強調,AWS Resilience Hub所涵蓋的「應用程式」,不僅是應用程式軟體和程式碼,範疇還包括託管應用程式的整個基礎設施堆疊,像是網路、虛擬機器和資料庫等各部分。而AWS Resilience Hub的韌性評估功能,使用AWS Well-Architected Framework最佳實踐來評估用戶的應用程式,藉由發現因基礎設施配置不完整或是錯誤配置,找出潛在的韌性弱點,並且提供增加應用程式韌性的建議。

韌性評估會生成程式碼,協助用戶建立恢復程序,作為應用程式的AWS Systems Manager文件,也就是標準作業程序(SOP),另外,Resilience Hub會產生推薦的Amazon CloudWatch監控器和警示報表,供用戶在部署應用程式後,快速掌握任何的彈性狀態變化。

用戶將應用程式和SOP更新納入韌性評估建議後,便可以使用Resilience Hub來測試和驗證應用程式是否達到韌性目標,之後再將應用程式發布到生產環境中。Resilience Hub還與AWS Fault Injection Simulator(FIS)整合,FIS會藉由在AWS上執行故障模擬,來測試應用程式在各種故障情況的行為。

Resilience Hub也提供開發團隊API,將韌性評估和測試整合到CI/CD工作管線中,以持續進行韌性驗證,透過在CI/CD工作管線驗證韌性,能夠確保應用程式底層基礎設施的每一次更新,都不會影響其韌性。

用戶可以從控制面板全面了解應用程式的韌性狀態,Resilience Hub會全面追蹤應用程式的韌性狀態,其整合了所有組織韌性事件、警示和來自Amazon CloudWatch與FIS服務的分析。Resilience Hub針對應用程式所產生的韌性分數,代表韌性測試、警示和恢復SOP的實作水準,用戶可以透過增加分數來推進應用程式韌性。

目前Resilience Hub已經在美東、美西和歐洲地區推出,亞洲則先在新加坡和東京地區提供,之後還會陸續在更多的地區上線。用戶可以先免費試用Resilience Hub服務6個月,之後支付每個應用程式每月15美元的費用。

熱門新聞

Advertisement