| 大當機 | CrowdStrike | 微軟 | 醫院 | 雙備援

CrowdStrike大當機的省思,臺灣大型醫院學到這2件事

經歷7月19日大當機事件,臺灣一家大型醫院除了自我警惕、更版流程要更嚴謹外,也開始評估雙備援機制的原主機和備援主機,是否應採用不同廠商的防護服務,以免廠商出事、備援主機仍無法作業。

2024-07-29

| CrowdStrike | Windows電腦 | 大當機 | 0719全球大當機 | BSOD | IT重大事故 | EDR

當企業資安與生產力發生火車對撞

一些防毒軟體產品過去也曾引發Windows電腦大當機的事故,但已很久沒遇到這類問題,沒想到2024年竟然再度上演

2024-07-26

| CrowdStrike | Windows電腦 | 大當機 | 0719全球大當機

CrowdStrike說明全球當機事件起於驗證軟體一隻臭蟲

針對7月19日爆發的全球Windows電腦大當機事件,CrowdStrike坦承是該公司某個驗證軟體臭蟲引發的連鎖效應

2024-07-25

| Azure | M365 | 大當機 | 微軟 | 服務中斷 | 0719全球大當機

微軟美國服務無預警大當機,導致M365在內的眾多Azure雲端服務中斷無法使用

微軟在美國服務在臺灣時間今天上午清晨約6點突然無預警大當機,造成包含微軟旗下的眾多服務,包括 M365 和 Azure 雲端服務均受影響。

2024-07-19

| 編者的話 | 資料遺失 | 大當機 | MFA | 帳號安全 | 高中學習歷程檔案遺失 | Atlassian | SRE

能力越大,責任越大

寫著電影《蜘蛛人》經典臺詞:「能力越大,責任越大」的T恤頗受人青睞,這是否也象徵人們對於「力量」、「能力」、「權力」的渴望?同時,也不免讓人聯想「責任」是否成為一種裝飾或是獲得更大能力的藉口,而讓人忽略扛起這個重擔所要付出的代價

2022-06-02

| 封面故事 | 微服務 | Atlassian | 大當機 | SRE | Jira | SaaS

【微服務架構弱點,遇上超完整DR計畫盲點,連6年SRE老手都失守】SaaS業界近年最大當機事件追追追

這是一份值得臺灣企業參考的經典SRE事後分析報告,也是SaaS服務維運團隊必須了解的重大當機事件

2022-05-23

| 封面故事 | 微服務 | Atlassian | 大當機 | SRE | Jira | SaaS

Atlassian四月大當機為何14天才復原?問題出在工程思維DR計畫,缺乏關鍵的顧客視角

Atlassian坦言,過去的DR計畫主要聚焦在基礎架構失敗的復原,或是從備份資料中復原企業所用服務儲存空間的做法,而少了一個關鍵環境,就是以顧客專屬入口網站(網站ID)視角的復原計畫

2022-05-23

| 資安 | 零信任 | Zero Trust | 臉書 | 服務異常 | 大當機 | 稽核工具臭蟲

臉書公布大當機始末報告:日常維護出錯所引發的骨牌效應

臉書工程師在例行性維護時發布了錯誤的命令,但命令稽核工具含有臭蟲而沒能阻止錯誤命令執行的情況下,先導致臉書全球骨幹網路斷線,接著DNS伺服器關閉BGP宣告,讓臉書在全球網路上消失,進而引發臉書內網全斷、內部工具無法使用的骨牌式災難

2021-10-06

| 臉書 | 大當機 | BGP | 服務異常

臉書、IG、WhatsApp全球服務中斷7小時,Cloudflare:可能是BGP惹的禍

Cloudflare發現Facebook的DNS伺服器一度停擺,不只自家1.1.1.1 DNS解析器、連Google的8.8.8.8或其它的公共DNS,也都找不到Facebook、Instagram與WhatsApp

2021-10-05

| Line Bank | 系統超載 | 純網銀 | 大當機

Line Bank開行首日大當機!原因是同一時間瞬間湧入大量用戶造成系統超載

Line Bank對外開行第一天就遇上大當機,從昨日傍晚開始,陸續傳出系統無法使用的問題,主因是用戶開戶踴躍,造成系統超載,雖一度在晚間8點修復,卻因同一時間瞬間湧入大量用戶,所以,造成系統再次壅塞。後來,Line Bank團隊經過內部排解,直到晚間10點,開戶申請流程才恢復正常。

2021-04-23

| Line | 大當機 | 誤關電源 | 資料中心維修出包

Line全球斷線50分鐘原因出爐:竟是資料中心維運商不小心關掉了電源

在維護時理應要接上電源,但該廠商卻錯誤地切斷了數個網路與伺服器的電源,才導致Line發生全球通訊服務大規模停擺的情況。

2021-04-14

| 東京證交所 | 大當機

【一個手冊參數異動資訊沒勘誤,竟讓日本股市交易空白一整天】東證大當機事件過程追追追

2020年10月1日早上7點4分,東證IT突然收到NAS出錯的事件通報,內部交易監控系統螢幕也無法顯示,更有不少券商發現,自己沒有收到東證7點發布的行情資訊,當時,沒人想得到,這會是東證全日交易空白的一天

2020-10-30