運用管理の現場においては、管理コストを抑えつつ、以下にして効率よくサーバを管理できるかが重要。
- システム内で動作しているサーバ、アプリケーション、ネットワークなどが正常に稼働しているかを 定期的に確認することで、システムで発生した障害やリソース不足を検知してシステム管理者に通知を 行うための作業や仕組みのこと。
- システム監視は大きく分けて以下の3つ。
- pingを実行して応答確認することで、ネットワークやアプリケーションポートに接続 を行い応答を確認することでサーバやネットワーク機器、アプリケーションが正常に 稼働していることを監視する。
- 応用としてpingやポートの応答確認だけでなく応答に要した時間を監視することでネットワーク やアプリケーションの遅延を監視できる。
- サーバやネットワーク機器などのリソース状況(CPU/メモリ/ディスク/ネットワーク trafficなど)をチェックし、システムやサービスのパフォーマンスが十分であること を監視する。
- 蓄積データでグラフを作成しリソース不足を事前に対応できるようになる。
- 各サーバやネットワーク機器にログインしてコマンドを実行して情報を収集 する必要がある。
- 監視対象側でSNMPエージェントが動作してる場合、外部からSNMPコマンドを利用して 情報を収集できる。
- MRTGやRRDtoolなどのグラフ作成ソフトウェアを利用しCactiやMuninを使用すること が多い。
- サーバ上で稼働している各アプリケーション内部のステータスやリソース使用状況を監視すること。 アプリケーション固有の内部ステータスを監視することでアプリケーション固有の パフォーマンス・チューニングに役立てる。
- アプリケーション監視を行うために、アプリケーションが動作しているサーバにログインし アプリケーションで用意されたコマンドなどを利用して情報を収集する必要がある。
- アプリケーションの監視は個々のアプリケーションによって監視方法が異なるため 個別に開発が必要になる。