メニュー
SaaSpresto株式会社はLogicMonitorの国内販売代理店です

死活監視(Ping監視)とは?監視手法や効率化方法を解説

死活監視は、対象となるノードが動作しているか、停止しているかを確認するために用いられる手法であり、システムやネットワークの監視において不可欠といえるものです。死活監視はもっとも基本的な監視手法と言ってもよいでしょう。

この記事では、死活監視の概要や実施理由、Pingを利用した手法など主な監視方法や、監視を効率化するためのツールなどについて解説を行います。

目次

死活監視の概要

まずはじめに、死活監視の概要やその実施理由などを紹介します。

死活監視(Ping監視)とは

死活監視とは、ネットワークやサーバーなどが稼働しているかを定期的にチェックする取り組みを意味します。

死活監視では、サーバーやネットワークに対して疎通確認を行い、応答があることを確認することで、稼働状況を把握します。一般的にPingコマンドを利用することが多いため、死活監視はPing監視と呼ばれることもあります。

死活監視においては、「監視対象が稼働しているかどうか」という観点のみを監視対象とします。

一般的には、アプリケーションとして適切な処理が行われているかといった観点や、ユーザーに遅延なく処理結果を提供できているかといった観点までは対象としません。これらの観点をチェックする際には、アプリケーション監視(APM)やフロントエンド監視など、別の監視手法を実施することになります。

死活監視を実施する理由

死活監視を行うことで、トラブル発生の有無を確認することができます。死活監視を行った際にサーバーやネットワークなどから応答がなければ、何らかトラブルが発生していると認識できます。

システムの稼働状況について把握することは、システム運用監視の基本中の基本です。Webサイトや業務システムなどの運用を実施する場合、死活監視は必須の取り組みとなります。

他方、死活監視はシステム運用監視の一歩目ともいえます。死活監視で認識できるのは、あくまで、「システムが正常に稼働していない」という状況までです。

死活監視により問題を検知した場合には、「より具体的にどのような障害が起きており、何が原因であるのか」を確認していきます。具体的には、ログ監視やプロセス監視、リソース監視などで得られた情報を基に、システムの稼働状況や障害発生時の原因究明などをより詳細に把握し、対応を進めていくことになります。

死活監視の注意点

死活監視はあくまでネットワークやサーバーが動作していることのみを把握するものであるため、たとえ死活監視で問題が見つからなかったとして、システムが正常に動作しているとは限らない点を考慮する必要があります。

たとえば、あるサーバーのCPUリソースが不足してアプリケーションの応答速度が低下しており、ユーザーに適切な体験を提供できていない可能性もあります。また、アプリケーションのエラーにより、正常な処理が行われていないようなケースもありえます。このような状況は、リソース監視やログ監視など、他の監視手法により検知する必要があります。

死活監視を行う対象

死活監視は主にサーバーやストレージ、ネットワーク機器を対象として行われます。

サーバーについては、物理的なサーバー機器だけではなく、サーバー機器内に設置された仮想マシンやコンテナなども監視対象となります。また、Webサーバーに対してポート単位で個別に死活監視を行うこともあります。ネットワーク機器については、ルーターやスイッチ、Wi-Fiのアクセスポイントなどを対象として死活監視が実施されます。その他、監視カメラやデジタルサイネージなどの機器についても、死活監視の対象とするべきでしょう。

死活監視の主な手法

以下では、死活監視の具体的な実施方法を紹介します。

Ping監視

多くの場合、死活監視はPingと呼ばれるコマンドを利用して行われます。

Pingとは、IPネットワーク上において特定のIPアドレスを持つ機器から応答を要求できるコマンド・プログラムのことです。対象に対して手軽に疎通確認を行うことができるという利便性の高さから、Pingは使い勝手の良いプログラムとして広く利用されています。

PingはTCP/IPプロトコル群の中で定義されているICMP(Internet Control Message Protocol)プロトコルに準拠しています。特定のベンダーなどに依存した処理ではないため、製品ベンダーなどに関わらず標準的に利用することができます。一般的な機器では、Pingに対して応答を返すことができるようにプログラムされています。

指定したIPアドレスに対してPingリクエストを行うと、そのIPアドレスが設定されている機器やサーバーが正常に動作している場合には、応答を受けることができます。

その際、応答内容としてラウンドトリップタイム(パケットが宛先に送信されてから応答を受け取るまでにかかったトータルの時間)、パケットの損失率などを受け取ります。応答がない場合は「Request timed out(要求がタイムアウトしました)」や「Host Unreachable(宛先ホストに到達できない)」などのメッセージが出力されます。この場合は、対象と疎通ができていません。

注意しなければならないのが、応答がなかった場合でも、その対象が停止しているとは限らないという点です。

Pingリクエストは当然ながらネットワークを通して行われますので、対象との間に存在するネットワーク機器が停止していたり、断線があったりすれば、そもそもリクエスト自体が対象に到達できません。

watchdogによる監視

セキュリティなどを理由としてPingを停止している機器に対しては、watchdogを利用した死活監視が行われることもあります。

watchdogとは「番犬」を意味する言葉です。監視対象機器にwatchdogを設置することで、まるで番犬のように報告先に定期的にパケットを発信します。もしこのパケットが途切れたら、機器に何らか異常が発生していると想定されます。

なお、Pingのように監視側から監視対象機器に対して問い合わせを行う方法を「アクティブ監視」と呼び、watchdogのように監視対象機器から監視側へ情報を発信する方法を「パッシブ監視」と呼ぶこともあります。

ポート監視

特にWebサーバーの監視においては、ポートを対象にした死活監視が行われます。

ポートとは、IPでやり取りされる通信を複数アプリケーションに振り分けるために設定される受け口のことです。たとえばHTTP通信においては80番のポートが、メールに用いられるIMAPであれば143番のポートが利用されます。ポートを指定して通信を行うことで、各アプリケーションを特定した形で通信を行うことができます。

これらのポートに対して死活監視を行うことで、各ポートに対応するアプリケーションのレベルで稼働状況を確認することができます。たとえば、80番ポートに対して疎通確認を行い応答がなければ、HTTP通信において何らか障害が発生しており、自社のWebサイトが閲覧できない状態になっている可能性があると考えられます。

上述したPingはネットワーク層で動作するプログラムであるため、ポート監視に用いることはできません。ポート監視は、トランスポート層で動作するTCPプロトコルもしくはUDPプロトコルを用いて行います。具体的には、Tracerouteコマンドなどを利用して実施されます。

死活監視の実施方法

続いて、死活監視の具体的な実施方法を紹介します。

手動で実施する

死活監視を実現するための最も基本的な方法は、手動でPingコマンドなどを実行して対応を行うことです。

監視対象となるサーバーやネットワーク機器の数が少ない場合は、手動で実施することも不可能ではありません。この場合、運用作業のひとつとして定期的にPingコマンドを実行したり、Webサイトなどであれば目視で稼働状況を確認したりします。

監視対象が少ない場合には不可能ではない方法ですが、監視対象が増えるにしたがって手動での対応は難しくなってきます。その場合、後述するツールの利用などを検討することになります。

監視ツールを利用する

死活監視を自動化する方法として、運用監視ツールの導入が考えられます。

死活監視の対象とするサーバーやネットワーク機器のIPアドレスや、監視の頻度などをツール上で設定することで、自動的に死活監視を行うことができます。

ツールを導入することで、死活監視の自動化だけでなく、監視業務全体を効率化することもできます。監視において死活監視のみを実施することはあまりありませんので、その他の監視作業の効率化という観点でもツールの活用は有効といえるでしょう。

一般的なツールでは、死活監視により応答が得られなかった場合にはアラートを上げるように設定することも可能です。これにより、監視結果を常時モニタリングしていなくても、異常が発生したことを認識できます。

代行サービスを活用する

リソース不足やスキル不足などを理由として自社での監視が難しい場合は、監視代行サービスを利用することも検討できます。

このような代行サービスは「MSP(Managed Service Provider)」と呼ばれ、自社の運用・保守・監視などの管理全般をアウトソーシングすることができます。

ただし、代行サービスの利用には一定のコストがかかるうえ、自社にノウハウが蓄積されないというデメリットもあります。システムがビジネスコアとして認識されている昨今においては、運用監視業務のアウトソーシングの可否についてはよく検討することをおすすめします。

あわせて読みたい
マネージドサービス(MSP)との向き合い方 メリット・デメリットを踏まえ判断が必要に クラウドをはじめとして、ITがサービスとして提供されるようになった現代において、システムの運用管理もサービスとして利用できる「マネージドサービス」という仕組み...

統合的な監視を実現するLogicMonitorとは

特に自社のシステム規模が大きくなればなるほど、効率的な監視体制の構築は、業務負荷削減や素早い障害対応を行う上で重要となります。

このような状況において検討したいのが、監視業務の効率化やMTTR(Mean Time To Repair:平均修復時間)の短縮に有効な監視ツールの採用です。

SaaS型IT統合運用監視サービスであるLogicMonitorは、サーバーやネットワーク、ミドルウェア、アプリケーションなどあらゆる対象を一元的に監視できます。死活監視はもちろんのこと、ハードウェア監視、プロセス監視、ネットワーク監視、ログ監視など様々な監視項目に対応しています。

LogicMonitorには2,500種類以上のサーバー・ネットワーク機器・OS・ミドルウェアに対応した監視テンプレートが用意されています。これらを利用することで、初めて監視業務を行う際にも運用設計を効率的に実施することができます。

近年では、オンプレミスからパブリッククラウドへの移行も進んでいますが、LogicMonitorではオンプレミス・クラウド両方に対応可能です。自社に様々なIT資産がある場合でも、一元的に監視が可能となります。

LogicMonitorの詳細については、こちらのサービス資料もご覧ください。

あわせて読みたい
IT統合監視サービス「LogicMonitor」サービス概要資料 日本を含む2,000社以上での導入実績がある、IT統合監視サービス「LogicMonitor」のサービス概要資料です。 以下のような課題をもつ企業におすすめです。 現状、監視ツー...

まとめ

この記事では、死活監視についてその概要や主な実施方法、死活監視を含めた監視業務を効率化するためのツールなどについて解説を行いました。

特に近年においては、ビジネスにおけるITシステムの重要性が増しています。このような状況においては、死活監視を含めた監視業務を効率的に実施しつつ、システムの安定運用を実現しなければなりません。適切な監視ツールを活用は、システムの安定運用の一助になります。

日本を含む2,000社以上での導入実績がある、
IT統合監視サービス「LogicMonitor」
のサービス概要資料はこちらから

以下のような課題をもつ企業におすすめです。

  • 現状、監視ツールの複数導入でコスト・運用面で負荷が大きく、1つのツールで統合監視したい
  • AIOpsやオブザーバビリティの考え方を取り入れた最先端のSaaSツールで、運用のDXを推進したい
  • マルチテナント機能やシンプルな価格体系で、MSP事業者としてスムーズにサービスを提供したい
目次