| Target | SRE | 金絲雀部署 | Canary Deployment | 服務級別目標.SLO | 服務水準指標 | SLI

新手Target SRE首次重大事件的4個教訓

因為系統異動造成的問題,經常會延後發酵;監控機制必須連備用系統都監控,才有完整數據;第一時間先採取緩解對策,而不是先找出問題根源來處理;不要浪費事故教訓的價值,必須從這些事件來累積和學習

2022-01-20