73
Twitterは2時間の障害の原因を2つのデータセンターのクラッシュとしている

ツイッター社は謝罪のブログ投稿で、木曜日に一部ユーザーで最大2時間続いた障害は、別々のデータセンターでほぼ同時に障害が発生したことが原因だと述べた。

Twitterは木曜日の太平洋時間午前8時20分頃から午前9時頃までダウンし、午前10時25分頃には復旧したと、エンジニアリング担当副社長のマゼン・ラワシュデ氏は述べている。一部のユーザーは、金曜日にロンドンで開幕するオリンピック関連のツイートが過負荷になったのではないかと疑っていたが、それが障害の原因ではなかった。

実際には、冗長性のために並行して稼働している2つのデータセンターの両方が故障し、ラワシュデ氏はこれを「インフラのダブルパンチ」と呼んだ。

「本日の障害で特筆すべき点は、ほぼ同時に2つの並行システムが同時に故障したことです」とラワシュデ氏は記した。「今後このような事態を回避するため、システムへの積極的な投資を進めています。」

Twitterにとって、これは約6週間で2度目の障害となった。6月21日、マイクロブログサービスは太平洋標準時午前9時頃にダウンし、午前10時過ぎに復旧し始めたものの、午前11時過ぎに完全復旧が始まる前に再びダウンした。同社は、この障害の原因をカスケードバグ、つまりあるソフトウェア要素から他の要素へと広がるタイプの問題としている。