ここでは弊社取扱い製品であるSolarWinds社 統合監視プラットフォーム Orion の機能であるQoE(Quality of Experience)によるサーバーの体感品質監視について説明します。
サーバーレスポンス遅くないですか?
サーバー監視には ICMP、SNMP、WMI、API など様々な監視方法があります。
SNMP、WMI、APIは一般的にサーバーに対し問合せを行い応答を受信します。
異常な応答が返ってこなければOKと判断されると思われますが、これらの監視方法では 「応答が返ってくるまでの時間」 が問題なかったどうかまでは分かりません。
またICMP(Ping)は応答時間は分かりますが、サーバーのサービスが使用しているTCPポートからの応答時間は分かりません。
このように前述した一般的な監視方法では稼働しているサーバーレスポンスの品質(体感品質)を監視するには十分ではないと考えられます。
Orionには、前述した機能の他にサーバーレスポンスを測るQoE(Quality of Experience)があります。
QoEはパケットレベルのトラフィックデータを収集しDPI(Deep Packet Inspection)機能により下記のようなメトリックを可視化することができます。
・アプリケーション毎のデータ量
・アプリケーション毎のトランザクション
ここでのアプリケーションはIISなどのWebサーバー、SQLなどのDBサーバー、Exchangeなどのメールサーバー、ADなどのアカウント管理サーバーなどの一般的なサーバーアプリ以外に、AWS、Google、Youtube、M365などのWebサービスも指定可能です。
事前定義されたアプリケーションは1000以上あり、この中から解析が必要なアプリケーションを指定します。
(あるいは新たにアプリケーションを定義することも可能です)
収集したデータより指定されたアプリケーションのデータを抽出、解析しグラフに表示します。
事前定義されているアプリケーションは →こちら
●QoE(Quality of Experience)監視画面
それでは実際の監視画面をSolarWinds社デモサイトより見てみましょう。
下記は 「最初のバイトまでの時間」 です。
TCPコネクションを確立後の最初のバイト(データ)が返ってくるまでの時間はサーバーの反応を表す目安となります。
ここでは応答時間が遅いアプリケーショントップ10を表示しています。
最初のバイトまでの時間 クリックで拡大します |
SSLやGoogle APIなどが遅い傾向であることが分かります。
その他、Microsoft、MS office、MS office365、Windows update も見受けられます。
データ量(左図)、トランザクション(右図) の表示例を示します。
これによりアプリケーション毎のデータ量、使用頻度も可視化できます。
データ量(左図)、トランザクション(右図)クリックで拡大します |
クリックで拡大します |
・応答時間がしきい値以上になった
・トランザクションが多い(分単位)
・トランザクションが少ない(分単位)
これらのアラートが発生した時、ログ、メールでお知らせすることができる他、外部プログラム実行も可能です。
アラート発行によりアプリケーションの異常にいち早く気付くことができます。
●SolarWinds社デモサイト、参考URL