| Target | SRE | 金絲雀部署 | Canary Deployment | 服務級別目標.SLO | 服務水準指標 | SLI
因為系統異動造成的問題,經常會延後發酵;監控機制必須連備用系統都監控,才有完整數據;第一時間先採取緩解對策,而不是先找出問題根源來處理;不要浪費事故教訓的價值,必須從這些事件來累積和學習
2022-01-20
| Target | SRE | 數位轉型 | DevOps
Target如何提前阻止大規模事故?從POS失效徵兆學到4大SRE教訓
這個成立才3個月的SRE團隊,驚覺幾家分店少數結帳POS機掃碼「嗶」聲響起的速度慢了,沒想到,竟是上周一次更新造成的微服務出錯,若不能趕快排除,不只全美近2千家分店,連服務上億顧客的網路商場都會大受影響,錯過2020年的復活節購物潮商機
2022-01-20
| CIO必看10大趨勢 | 雲端原生 | SRE | K8s | IT現代化
【展望後疫2022新趨勢3】IT現代化成為主流,SRE成為IT團隊必備新能力
2021年,不少企業要招募SRE職缺,不只網路原生公司,銀行、零售、高科技業,連房仲、保險、物流、媒體、百貨業者、線上電商都要招募SRE人才
2021-12-30
| google | DORA | SRE | DevOps
Google發布DevOps年度報告,菁英績效團隊的軟體交付時間從一天縮短至一小時內
2021年的Google的DevOps調查報告顯示,DevOps實踐表現最好的團隊,變得更加優秀,軟體交付時間從2019年的一天內,在今年縮短成一小時內
2021-09-22
| 網站可靠性工程 | google | SRE | Site Reliability Engineering | 17Live集團 | 17Live集團工程總監 | 林毅民
【臺灣SRE實例:17Live集團】多功能型SRE化身內部信心來源,天天成為開發團隊後盾
2017年時,17Live將DevOps團隊轉型為SRE團隊,要維運人員跳脫傳統框架,以軟體工程角度開發自動化機制,並負責監控系統狀況,來應變意外事件,成為內部的可信任對象
2021-05-06
| 網站可靠性工程 | google | SRE | Site Reliability Engineering | 17Live集團 | 7Live集團技術副總經 | 徐永吉 | 服務關鍵路徑 | Critical Path | SRE人才
【CTO看SRE:17Live集團技術副總經理徐永吉】SRE如何成為營運和工程單位的橋樑就靠2關鍵
SRE真正的價值,不是節省基礎設施成本或訂定系統可用性目標,而是要強健系統來降低營運損失,才能活化SRE在保護系統上的責任
2021-05-06
| 網站可靠性工程 | google | SRE | Site Reliability Engineering
SRE風潮開始吹進臺灣,我們不只跨海專訪新加坡星展集團SRE負責人,還歸納臺灣SRE的先行者直播平臺17Live集團和Line臺灣的SRE經驗,一窺他們如何建立網站服務信賴感的SRE專業心法
2021-05-06
| Line臺灣SRE團隊 | Line臺灣技術長 | 陳鴻嘉 | 網站可靠性工程 | google | SRE | Site Reliability Engineering | Line臺灣 | K8s | Kubernetes | 服務觀測
【臺灣SRE實例:Line臺灣】如何確保Line服務天天不中斷,專責SRE扮演開發與維運的橋樑
去年,Line臺灣工程團隊成立了一支專責的SRE維運團隊,就是要為各服務的專案團隊找到開發和維運的最佳作法,進一步確保服務可靠性
2021-05-06
| Harpreet Singh | 網站可靠性工程 | google | SRE | Site Reliability Engineering | 星展集團 | 金融業
【企業SRE實例:新加坡星展集團】頂尖數位銀行如何再進化,SRE轉型是變身科技公司的關鍵
過去7年來,星展集團大力改造銀行服務,走到了數位銀行發展的高點,2019年時,決定進一步採SRE作法來重塑維運方式,確保工程團隊交付高度可靠的應用程式,成為全球金融業界導入SRE的先驅
2021-05-05
| 網站可靠性工程 | google | SRE | Site Reliability Engineering
去年開始,不只金控、零售通路,連製造業都有企業要招募SRE,這個國外盛行已久的服務維運作法也吹進臺灣大型企業
2021-05-03
Google新發布的SRE課程,會從頭帶課程參與者了解SRE相關的概念,並且學到描述和測量服務可靠性的方法
2019-03-21