メニュー
SaaSpresto株式会社はLogicMonitorの国内販売代理店です

統合監視とは?オンプレミス・クラウドが混在するハイブリッド環境でもフルスタック監視を実現

マルチクラウドやリモートワークの普及で、ITシステムは急激に変化しながら複雑化・多様化しています。これまでは、ITシステム毎の種類や目的別に、複数の似たような監視ツールを、部門ごとに多数導入することで、サイロ化されてきました。また、従来の監視ツールでは、各運用監視ツールの管理画面の切り替えの手間が発生、また、各ITシステム間の依存関係の全体像を把握することが困難でした。

統合監視ツールは、企業が保有するあらゆるITリソースの運用監視業務を一元的に行い、問題発見から原因究明まで一貫した運用監視ソリューションとなっています。本記事では、統合監視に関して、その仕組みから検討ポイントまで、網羅的に解説します。

目次

統合監視とは

統合監視とは、企業が保有するITインフラやIT資産を一元管理する仕組みです。以下では、その目的や、統合監視が求められる背景を紹介します。

①統合監視の目的

統合監視の主な目的は、ITインフラ全体を把握し、運用管理の一元化により、企業全体にあるシステムを俯瞰的にフルスタック監視することです。統合監視のそれぞれ目的の詳細を解説します。

(1)運用管理の一元化

昨今、企業が保有するITインフラやITリソースは、非常に膨大で広範囲になっています。

監視対象の機器やノードの種類毎に異なる監視ツールを導入すると、複数の管理画面を見比べて監視業務を行わなければなりません。また、サーバーやネットワークなど監視対象の種類毎に監視ツールを導入すると、そのツールの数量分の初期導入や更新作業の工数が増大していきます。

統合監視は、一つのツールで広範囲なITリソースを一元的に管理・運用できます。そして、監視項目の設定・データ収集・分析・問題の特定までを一貫して1つのツールによってワンストップで完結できるため、監視業務全体の効率化を実現できます。

(2)早期の異常検知と迅速な障害対応

システムダウンによって企業活動に機会損失を出さないためにも、ITシステムの障害発生から障害復旧までの時間は、できる限り短く抑えなければなりません。

従来の監視業務では、ITシステム間の依存関係は今ほど複雑なものではなく、障害の検知と復旧作業を行うことに主眼が置かれていました。

一方、近年のITシステムは、オンプレミス環境とクラウドが連携したサービスの提供、サーバーレス、マイクロサービスといった普及を背景に、依存関係や、システム構成とその関係性が複雑に変化します。

そのため、異常検知から短時間での原因特定や復旧作業は容易でありませんが、後述される「オブザーバビリティ」が求められています。

統合監視は、複雑な問題を短時間で解決し、異常検知だけに限らず、複数のシステムにまたがる障害の根本原因特定や復旧までを迅速に対応できるワンストップのソリューションです。将来的には、障害が発生した後ではなく、事前に検知する予兆検知が求められてきています。

②統合監視が必要とされる背景

(1)ハイブリッドクラウドやマルチクラウドの常態化

技術の発展でクラウドサービスやITシステムが多様化する中、企業が運用するITリソースやインフラも、複雑化の一途をたどります。代表的な事例は、ハイブリッドクラウド、マルチクラウド、マルチベンダーです。

ハイブリッドクラウドは、オンプレミス環境とクラウド環境の併用を意味しています。

マルチクラウド・マルチベンダーは、文字通り、複数種類のクラウドサービス・複数種類の機器の併用です。大手クラウドサービスとして、Amazon Web Services(AWS)、Azure、またはGoogle Cloud Platform(GCP)といった複数クラウドサービスの併用は、マルチクラウドの一例と言えます。

今では、ハイブリッドクラウドやマルチクラウドは、当たり前になりつつあり、常態化しています。

(2)ツールのサイロ化によって煩雑になる監視業務

このような状況を背景に、運用監視業務においてさまざまな課題が発生しています。

部門毎や監視対象毎に異なる監視ツールを利用(サイロ化)していると、監視する指標や基準がバラバラになりがちです。

オンプレミスとクラウドに相互に依存関係のあるITサービス運用をしている場合、障害発生時の影響範囲が広く、問題の解決までに時間を要します。監視対象の数に比例して異常検知のアラート通知数も増えており、対処が必要な問題を見逃すリスクも高まります。企業が持続的かつ急速に成長するためにも、これらの課題を見過ごすわけにはいきません。

統合監視は、このような課題解決ツールとして、組織規模に応じた効率的な監視業務を実現します。また、ITシステム面の課題を解決するだけでなく、部署部門を跨いで同一の運用基準や共通のダッシュボードなどの管理画面を共有することで、監視や運用に関して同じ目線、同じ尺度で情報共有や問題のエスカレーションをスムーズに行える点も統合監視の特長です。

統合監視の仕組み

統合監視にかかわらず、監視は大きく3つの基本的な業務要素があります。データの収集・モニタリング・通知の3つについて説明します。

①データの収集

統合監視では、監視対象のサーバー、ネットワーク機器、ストレージなど、ノードやホストからデータ収集を行い、データ分析や加工編集の目的でシステム的に扱いやすい形式で保存します。

データ収集の仕組みは、エージェント型とエージェントレス型に大別されます。

エージェント型は、監視対象上でデータ収集用のアプリケーション(エージェント)を各監視対象にインストールして動く仕組みです。監視対象上でデータ収集を行うため、監視対象とそのエージェントが動作していれば、ネットワークが途切れてもデータ収集が継続されるメリットを持ちます。一方で、監視対象のリソース(CPU、メモリなど)への負荷がかかりパフォーマンスに影響を与えるリスクや、監視対象の数に比例してアプリケーション(エージェント)の更新作業工数の増加がデメリットです。

エージェントレス型であれば、アプリケーション(エ―ジェント)のインストールや更新作業は不要です。エージェントレス型のツールでは、一般的にSNMPやWMIといった、監視でよく使われている標準プロトコルを利用してデータ収集を行います。

LogicMonitor
エージェントレス型とエージェント型の監視ツールの違いは?手軽な導入・運用を実現する仕組みはどちらか?... エージェントレス型の監視ツールは、監視対象にデータ収集を行うエージェントなどアプリケーションをインストールせずに監視を行う仕組みです。エージェント型との違いやそ...

②モニタリング

統合監視は、そのコンセプトにオブザーバビリティ(可観測性)という概念が据えられています。オブザーバビリティは、従来のモニタリングを要素として包含しており、今の複雑なクラウド時代に沿った監視業務のあり方を示しています。

オブザーバビリティ(可観測性)は、制御工学の用語です。ITインフラ監視におけるオブザーバビリティは、プログラム実行・モジュールの内部状態・システム間の通信などについてデータを収集し、その事象や振る舞いが「いつ、どこで起こっているのかを観測可能な状態」を指します。

メトリクス、トレース、ログは「オブザーバビリティの 3 本柱」と呼ばれます。

メトリクスの代表例は、時系列で表される集計データです。過去の利用状況やシステム性能に対して、しきい値を設けて問題を見つけます。

問題がどこで起きているのか、システムの関係性を追跡、判別を行うのがトレースです。

そして、ログを通じて、そのアラートが生成された時に、

  • 具体的にシステム全体で何が起こっていたのか?
  • そもそも何が原因で問題が起きたのか?
  • その問題の影響範囲はどこまであるのか?

などを明らかにします。

従来のモニタリングは、シンプルな一つのITシステムや監視対象から取得したメトリクスが主眼に置かれています。測定データを統計的に集計し、静的なしきい値に対する評価を、レポートやダッシュボード上で行うのです。

しかし、コンテナやサーバーレスといったクラウドネイティブの技術普及につれ、メトリクスだけでは現代の複雑なシステム間の相関関係や運用依存性を把握するには不十分です。

そのため、近年、監視運用業務のコンセプトは、モニタリングからオブザーバビリティにその主眼が移り変わりつつあります。

③アラートの通知

統合監視ツールは、従来の監視ツール同様に、異常検知をメールやチャットツール経由で運用管理担当者にアラートを通知します。

運用管理担当者は、アラートの通知設定を行うことで、定期的に管理画面等を確認することなく、異常検知に気づくことができます。

通知のタイミングは、監視対象の指標毎に設定されたしきい値を超えた場合や、システムエラーの発生時など、自社の運用方針に沿って、監視ツール上で事前にしきい値設定を行います。

監視ツールと連携可能なSlackやTeams等のチャットツールはサービス毎に異なるため、業務利用しているチャットツールがシステム連携に対応しているかどうか、監視ツール導入時に確認する必要があります。

統合監視の対象

統合監視は、企業が有する多種多様なITリソースやITインフラを監視対象とします。ここでは、そのような監視対象をクラウドとオンプレミス環境に分けて紹介します。

①クラウド環境

クラウド上で提供されるサービスは年々増え続けています。IaaS、PaaS、SaaSはその代表例です。

企業はクラウドサービスを利用することで、自社で物理サービスやデータセンターを保有することなく、ITインフラ基盤の構築を行えるようになっています。

(1)IaaS/PaaS

IaaSはInfrastructure as a Service、PaaSはPlatform as a Serviceの略称です。

IaaSは、インフラ基盤の構築に必要となる、サーバーやストレージといったハードウェアリソースのみがインターネット経由で提供されます。PaaSは、OSやミドルウェアの構築運用まで含めたサービスとして提供されます。

AWSやGCPといった大手クラウド事業者は、IaaSとPaaSの両方を包含したサービスです。

IaaSやPaaSでは、仮想化と呼ばれる技術が用いられており、物理サーバーをソフトウェア上で論理的に区切り、ユーザーは必要十分なだけのリソースを確保します。仮想化の対象はサーバーだけでなく、ネットワークも含まれます。従来は、物理ケーブルを用いて構築していたネットワークも、仮想化技術でVLAN(Virtual Local Area Network)やSDN(Software-Defined Networking)として構築可能です。

統合監視では、これらIaaSやPaaSについて、HTTPS等の通信プロトコルを用いてインターネット経由でセキュアに連携し、データ収集を行います。

(2)SaaS

SaaSはSoftware as a Serviceの略称です。代表的なSaaSとしては、Salesforce、Microsoft 365、Zoomなどがあげられます。

SaaSは認証情報さえ分かれば、個人端末から利用できてしまうため、従業員が退職後のアカウントが利用可能な状態で残ったままになるなどの問題があります。そのため、セキュリティの向上を目的に、企業が発行するメールアドレスに認証を紐付けるSSOの仕組みなどと一緒に利用されるケースが増えています。

統合監視でも、このようなSaaSのライセンス状況や利用状況を把握するための、API連携・データ収集機能が搭載されています。

②オンプレミス環境

クラウドが普及した現在でも、セキュリティ面やクラウド移行が困難などを理由に、オンプレミス環境も継続して保有する企業は少なくありません。

オンプレミス環境の場合、ソフトウェアから収集されるデータに加えて、温度や電圧などハードウェアやコンポーネントから収集される物理的な機器のデータも監視の対象です。

また、社内ネットワークを物理ケーブルで構成している場合、ルーターやスイッチを通じて、接続状況についても監視を行います。

統合監視は、一般的に、オンプレミス環境とクラウド環境も監視対象にできるため、クラウドへの段階的な移行や部分的な監視を柔軟に実現します。

監視の種類

以下では、統合監視の対象について、具体的にどのような動作や項目を監視しているかについて紹介します。

①死活監視

死活監視は、監視対象が停止していないことを監視します。

サーバーやネットワーク機器の情報収集に特化した、SNMP、ICMP、WMIといった通信プロトコルが用いられます。

システムダウンは24時間365日、常に早期検知が求められます。そのため、監視ツール上での検知から、運用管理担当者へのアラート通知まで、一連の業務フローを自動化するケースが一般的です。

②パフォーマンス監視

パフォーマンス監視は、サーバーやネットワーク機器のリソース(CPUやメモリ等)が監視対象です。

CPUやメモリの使用率が処理性能を上回ると、パフォーマンス低下やシステムダウンにつながります。運用管理担当者は、使用率に対して、しきい値を事前に設定しておき、問題発生の予兆を検知して、メモリ増設などスケールアップの対処を行います。

③ログ監視

ログ監視は、サーバーやネットワーク機器で発生したイベントを記録したログを監視することです。

ログには、いつどこで誰がどのような操作を行ったのかが詳細に記録されています。ログは、日々大量に生成されており、そのすべてに目を通すことは非現実的です。

そのため、通常は、何か異常が発生した際の原因分析に利用されます。ログをアクセス元単位でトレースして追いかけることで、特定のユーザーが行なった操作履歴や、不審なアクセス履歴の判別ができます。

統合監視ツールの検討ポイント

統合監視ツールは、監視業務の根幹を担うシステムとなるため、導入やツール選定にあたって、複数の統合監視ツールの比較検討が欠かせません。以下では、比較検討を行う上での、5つのポイントを紹介します。

①監視対象の範囲

統合監視の目的は、ITリソースやITインフラの一元管理・運用です。

統合監視サービスの特性上、主要な機器・ソフトウェアにはおおむね対応していることが想定されます。しかし、業界や顧客の要望によっては、IoTやネットワーク機器で特殊なハードウェアに加えて、M365などのクラウドサービスも監視しなければならない可能性も考えられます。

自社の監視対象について統合監視ツールが十分にカバーできるかどうかは、最優先に確認するべき項目です。

ドキュメント上で監視対象に含まれていなくても、何かしら監視する方法のワークアラウンドの用意や、今後対象に追加される予定の可能性も考えられます。

比較を行う際には、統合監視サービスの提供元に問い合わせるなどして、監視ツールの対象範囲を確認しましょう。

②エージェントの有無

監視を行う仕組みは、大きくエージェント型とエージェントレス型に分けられます。

エージェント型のツールでは、データ収集のためのアプリケーション(エ―ジェント)を各監視対象にインストールして、監視ツールの管理側にデータを送信します。そのため、監視対象の数に比例して初期導入・運用管理コストが増加する点に注意が必要です。

一方、エージェントレス型では、アプリケーション(エ―ジェント)のインストールが不要です。さまざまな通信プロトコルを用いて、監視対象のデータを監視ツールの管理側に送信します。エージェント型に比べて、初期導入・運用管理コストが少なく、監視対象範囲や領域の拡大・拡張にも柔軟な対応を行える点がメリットです。

エージェント型またはエージェントレス型のいずれにせよ、監視対象からのデータ収集には初期導入・運用管理の作業が必要になります。監視ツールがエージェント型とエージェントレス型のどちらに対応しているかは、必ず確認しましょう。

あわせて読みたい
エージェントレス型とエージェント型の監視ツールの違いは?手軽な導入・運用を実現する仕組みはどちらか? エージェントレス型の監視ツールは、エージェント型に比べて初期導入やその後の監視業務の運用負荷が低いのが特徴です。クラウドやリモートワークの普及で監視対象の領...

③マルチテナント(マルチアカウント)対応

ITリソースやITインフラの監視業務は、部署・部門単位で行うなど、必ずしも一つの組織が行うとは限りません。加えて、監視業務を外注している場合、外注先の企業と発注元のユーザー企業で、運用ツールを共有するケースも考えられます。

このような課題を解決する仕組みがマルチテナント(マルチアカウント)です。

マルチテナントは、複数のユーザーが、同一のシステムやサービスを、ユーザーの権限役割に応じて、閲覧のみなど限定したアクセス権を付与しながら、共有して利用できる仕組みです。

例えば、運用側の管理者とユーザーに大別できますが、ユーザーは、部門責任者から一般社員や派遣社員などさまざまです。部門責任者には、部門で利用しているITリソースをすべて編集・閲覧できる権限を与え、外部の派遣社員には、特定業務に関連する必要最小限のリソース閲覧に限定して権限を付与するなどが挙げられます。

一方、マルチテナントの機能がなく、顧客や組織内の部門単位で都度契約していると、その分の運用管理工数や費用も膨れ上がるだけでなく、横断組織の運用担当者が契約毎に異なる管理画面を行き来しなければなりません。

1つの管理画面内で組織の形に合わせて柔軟な導入ができるかどうかは、組織規模が大きい企業では重要な観点です。

④運用業務の自動化

監視業務には定型化されたプロセスが少なくありません。監視対象の新規追加によるエージェントのインストール作業や、定期的な監視運用レポートの生成など、決まった手順に沿って業務が行われます。

このような業務では、システム手順をプログラムコードとして記述するか、監視ツールの機能を活用することで、一連の作業を自動化できる可能性があります。監視業務の自動化は、運用管理担当者の業務負荷軽減だけでなく、人的な判断ミスの軽減にもつながります。

統合監視ツールでは、ツール毎に自動化できるプロセスが異なるため、社内で頻繁に発生するプロセスを自動化できるかは大事な検討ポイントと言えます。

⑤サポート体制

統合監視ツールは、その特性上、従来のサーバー・ネットワーク監視ツールよりも監視対象や管理領域も幅広いため、多くの専門知識が求められます。

基本的な機能は画面上で直感的に理解し、不明な点はWeb上のサポート情報から把握することもできますが、それだけでは企業毎の細かなユースケースまで網羅できません。

そのため、サービス提供業者のテクニカルサポートは重要です。

電話・メール・チャットでサポートをしているサービスもあれば、定期的なミーティングで手厚いサポートを行うサービスもあります。テクニカルサポートを受けられる時間帯や言語、返信までの時間などのサポート体制やSLAについても、サービス毎に方針が異なります。サポートが有償サービスとして提供されることもあるので、導入時にサポート体制やSLAについて確認を行いましょう。

まとめ

統合監視は、複雑化・肥大化が進む監視業務を俯瞰的にワンストップで管理できるツールです。現在では、複数の統合監視ツールが提供されていますので、自社の要件に合致した統合監視ツールを選択しましょう。

LogicMonitorは、エージェントレス型のIT運用統合監視ツールとして、2,000社以上の導入実績を持ちます。

統合されたオブザーバビリティをコンセプトに、正常監視から異常検知・問題発見まで一貫して監視業務を支援し、一元的に管理・運用できます。効率的かつ自動化を前提とした監視業務を実現する上でも、ぜひ比較検討いただければと思います。

あわせて読みたい
IT統合監視サービス「LogicMonitor」サービス概要資料 日本を含む2,000社以上での導入実績がある、IT統合監視サービス「LogicMonitor」のサービス概要資料です。 以下のような課題をもつ企業におすすめです。 現状、監視ツー...

日本を含む2,000社以上での導入実績がある、
IT統合監視サービス「LogicMonitor」
のサービス概要資料はこちらから

以下のような課題をもつ企業におすすめです。

  • 現状、監視ツールの複数導入でコスト・運用面で負荷が大きく、1つのツールで統合監視したい
  • AIOpsやオブザーバビリティの考え方を取り入れた最先端のSaaSツールで、運用のDXを推進したい
  • マルチテナント機能やシンプルな価格体系で、MSP事業者としてスムーズにサービスを提供したい
目次