Network×Network目次

スポンサードリンク

ANAシステム障害の原因判明、シスコ製スイッチの「世界初のバグ」でDBサーバーがダウン

ANAシステム障害の原因判明、シスコ製スイッチの
「世界初のバグ」でDBサーバーがダウン

ITpro by 日経コンピュータ参照

全日本空輸(ANA)は2016年3月30日、3月22日に発生した
国内線システムの不具合について、原因や再発防止策などを公表した。
国内線システムの4台のデータベース(DB)サーバーをつなぐ
米シスコシステムズ製イーサネットスイッチの故障が原因だった。

ANAによれば、3月22日午前3時44分にDBサーバーの1台が停止した。
その後2台が停止し、約4時間40分後の午前8時22分に最後の1台も停止。
DBサーバーが停止した理由は「正常に機能が働いた」(ANA広報)ため。
4台のDBサーバーはデータを同期しており、同期処理が
異常終了した場合に自動停止する機能を備えていた。

同期処理が失敗した原因は、4台をつなぐスイッチの不具合。
具体的には、スイッチが故障状態であるにもかからず、
故障を知らせる「故障シグナル」を発信しなかった。
国内線システムは故障シグナルを検知するとスイッチを予備機に
切り替えるが、今回はその機能そのものを作動できなかった。

スイッチは完全に停止したわけではなく、
「不安定ながらも動作していたようだ」(同)。
そのため、DBサーバー間の同期は順次失敗し、
停止していったと見られる。

ANA広報によると、スイッチは米シスコシステムズ製「Catalyst 4948E」
という。「2010年6月の発売開始以降、世界で4万3000台、うち日本で8700台を
販売しているが、今回の不具合は初めての事象と聞いている」(ANA広報)。
なぜ「故障シグナル」が発信できなかったかは分かっていない。

続き その1
続き その2

CISCO製のスイッチって壊れにくいと思ってたんだけどなー
ここまでの大きな障害で世界初のバグだとかなり
悪い印象を与えてしまうな。

それにしてもANAはCISCOと相性悪すぎ!!!
2007年にもこんなのひいてたな・・・・・

【会見詳報】ANA障害の原因判明、
「世界4例のスイッチ故障がきっかけ、対応も遅れた」

ITpro by 日経コンピュータ参照

ネットワークエンジニアとしては背筋が凍る話だな。


TOP OF THE NETWORK×NETWORK
NETWORK×NETWORK
posted by シスコ | Comment(0) | TrackBack(0) | CISCO NEWS | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:


この記事へのトラックバック