2008/11/11に発生したシステム障害について


こんな大事な日に測定が安定していなかったのは非常に残念です。

概要はこちらに記述されています。

昔の事を思い出します。

告知の履歴がこちらに列挙されています。

気になるのは

  • 作業漏れなどはないか?
  • 今晩、対応が必要なものはないか?

    その次は

  • 昨晩は特別なバッチまたは作業を行ったのか?
  • バッチが遅かったのか?
  • バッチが異常終了したのか?
  • リカバリー処理は適切だったか?
  • バッチエラーが発覚してから再開時間を告知するまでの間に何を行ったか?
  • 適切に担当者が招集できたか?
  • 対処した担当者は適切だったか?
  • 対処方法での誤りはなかったか?
  • もっとよい対象方法はなかったか?
  • DBの領域などの要領管理は出来ていたか?
  • バッチのスタート時間、処理時間を記録していたか?
  • 事前に兆候はなかったか?

    ですが、

    とにかく、正確に発生した事象を記録していただき次回は発生しない様にしていただきたいです。

    今晩も担当者は眠れない一晩になると思うのですが無理せず がんばってください。

    1. pmd
      11月 12th, 2008 14:24

      その後のコメントは特に追加されていない様です。

      この手の障害で事後の報告までキチンとされている会社は どれくらいあるのでしょうか?