6年SRE老手為何仍大當機14天
知名的企業級敏捷專案管理平臺Jira,突然在今年4月5日一早出現大災難,數百家企業所用的內部協作平臺、敏捷管理平臺、甚至是業務團隊協作平臺都大斷線,大大衝擊這些企業的運作。但多數遭殃企業沒有料到,竟要等到14天後,才能完全復原。這是近年SaaS業界最嚴重的一起當機事故
【微服務架構弱點,遇上超完整DR計畫盲點,連6年SRE老手都失守】SaaS業界近年最大當機事件追追追
這是一份值得臺灣企業參考的經典SRE事後分析報告,也是SaaS服務維運團隊必須了解的重大當機事件
文 /|2022-05-23
Atlassian四月大當機為何14天才復原?問題出在工程思維DR計畫,缺乏關鍵的顧客視角
Atlassian坦言,過去的DR計畫主要聚焦在基礎架構失敗的復原,或是從備份資料中復原企業所用服務儲存空間的做法,而少了一個關鍵環境,就是以顧客專屬入口網站(網站ID)視角的復原計畫
文 /|2022-05-23
按讚加入iThome粉絲團追蹤