HT1100で通信切断に向けて#004
Docomoのパケットバイトカウンターで見る範囲では数回に一回程度の頻度で5分間の接続が見受けられますが5分以上の接続は今のところ見つかっていません。
ただし、先日のハングアップや その後の情報収集でRAS接続を切った後の処理にコミュニケーションマネージャ系の処理を追加した方良いらしいので、そちらを追加した版を作成してテストを開始した。
Docomoのパケットバイトカウンターで見る範囲では数回に一回程度の頻度で5分間の接続が見受けられますが5分以上の接続は今のところ見つかっていません。
ただし、先日のハングアップや その後の情報収集でRAS接続を切った後の処理にコミュニケーションマネージャ系の処理を追加した方良いらしいので、そちらを追加した版を作成してテストを開始した。
追伸
本日は30分に一回の割合で同期していいます。
プログラム追加前も30分間隔は割と調子が良かったのでテストになっていないかもしれませんが…..とりあえず
不調なThinkPadからVmware Fusion 2.0上にバックアップ環境を移行しました。
障害が発生すると速やかなサービス復旧の為にサーバーを再起動しがちですが….
環境によってロードバランサー側から切り離す必要があります。
間違ってもTCPのタイムアウトが必要となる様な切り離し方を行ってはいけません。
たとえば、
電源を落とす
ネットワークから切り離す(物理的、論理的)
などです。
トラフィックが集中しているときに、このようなことを行えばロードバランサー側からWebサーバーへの接続出来ないと判断するまでに1分ほどかかってしまい、お客様を待たせてしまう場合があるからです。
このような事柄を把握せずにハードウェアのメンテナンスなどを行う様な会社に運用の委託をしてもいけません。
現状を改善できない場合には地道に教育をしていく必要があります。
サービス復旧が最優先ではありますが報告書を作成できるだけの資料を必ず残せるようにしておくことも大切です。
外部に借りているWebサーバーへのpingの遅延が大きくなり始めました。