WhaTap Blog

モニタリングを知らない人のための
サーバーで絶対にチェックしなければならない重要なモニタリングポイント

2019年12月20日

figure_infrastructure

CPU

CPUの性能指標は、サーバーのパフォーマンスを意味する尺度(ものさし)として使用します。IT関連のソリューションは、サーバーのパフォーマンスに応じた価格体系を持つ場合が多いですが、このような場合、ほとんどがCPUのコアに基づいて価格を設定するのも同じ理由です。CPUの使用率が一定以上を超えると、サービスに影響を与え始めるので、すべてのCPUの値は、しきい値を設定する必要があります。しきい値は、通常の警告と深刻(重大)に分かれており、警告は今後起こることをあらかじめ検出する目的であり、深刻(重大)はすぐに措置を行う必要がある場合を算定して設定されます。この問題を解決するためには、ハードウェアを追加購入したり、CPUを使用するアプリケーションのパフォーマンスを調整したりしなければなりません。

しきい値をどのように設定すべきか悩む場合が多いですが、これは実際に運営をしながら知っていくべきです。参考になる記事を紹介します。運営が上手なシステムとはどのようなシステムでしょうか?

figure_cpu WhatapのCPUしきい値の設定画面

上の画面は、Whatapが提供するCPUしきい値の設定画面です。一般的には、CPUのしきい値を設定するときに、持続時間も一緒に指定する必要があります。たとえば、持続時間を1分に設定した場合、CPUがそのしきい値を1分以上保持した際に、警告または危険だと認知するという意味です。CPUの使用率は、瞬間的に急激に高まる可能性があるので、すべてのしきい値は持続時間を保つように設計するのが一般的です。またこれも直接システムを運営しながら修正していかなければなりません。

Memory

メモリをモニタリングすると、サーバーのメモリ使用量がしきい値を超えるときにアラームを受け取ることができます。メモリの細かな区分は、OSによって異なる場合がありますが、一般的には、バッファとキャッシュメモリを含むメモリの使用量をチェックします。メモリの使用量をあまりにも早く消費したり、または継続的に使用量が落ちないのならば、これらの問題について、対策を立てなければなりません。

figure_memory figure_swap WhatapのMemoryしきい値の設定画面

Whatapのサーバーモニタリングでは、メモリの使用量とSWAPメモリの使用量の両方にしきい値を設定することができます。一般的な場合SWAPメモリは50%以上使用されないようにすることをお勧めしますが、これもシステム構成に応じて異なる場合があります。

Disk I/O & Disk 使用量

Disk I / Oは、ネットワークドライブを使用する際に、必ず確認しなければならないモニタリング要素です。ディスクの読み込み速度、書き込み速度、キュー、待機時間の割合などをモニタリングします。

ディスク使用量のモニタリングでは、ディスク使用量のしきい値設定を使用して、システムのハードドライブの使用量がしきい値に達したときにアラームを受け取ることができます。ディスクの空き容量が残っていない場合、アプリケーションの障害、データの損失、サービスの停止などの致命的な問題が発生します。

figure_disk WhatapのDisk I/Oしきい値の設定画面

WhatapではDISK I / OのBusy time(待機時間の割合)とDISK使用量のしきい値を設定することができます。簡単な設定で、重要な指標の数値を管理します。

ネットワーク

ネットワークモニタリングでは、ネットワークインターフェースの入出力トラフィックレートとパケットエラー率などをモニタリングすることができます。ネットワークで発生する問題は、発見が難しく、時間が過ぎてからでは原因を証明しにくい場合があります。

figure_network WhatapのNetworkしきい値の設定画面

Whatapでは入出力トラフィックの合計をしきい値として設定するようになっていますが、これは、利便性を最大限に高めるための手段です。トラフィックとPPS(Packet Per Second)は、外部の過剰な入出力をチェックする用途です。

最後に

上記以外にも、プロセスのモニタリング、ログモニタリング、イベントモニタリングサーバーを運営すると、問題解決に役立ちますが、本当に開発だけしなければならない状況であるのならば、特に上の4つの要素は、常にチェックできるようにモニタリングシステムを構築していただくことをお勧めいたします。

今運営しているサービスの性能をすぐに知りたい場合は?

無料で始める
<  Previous

Next  >

Recent