Nagiosはサービス状況に基づいてサービス頻度をチェックします

siを監視することでディスクのスラッシングを検出しようとしているので、vmstatコマンドから。nagiosを使用して他のサービスを監視しています。サービスチェックは5分ごとに発生します。このスラッシングサービスについては、nagiosが20分ごとにチェックする必要があります。返されたステータスがOK（つまり、警告またはクリティカル）でない場合、サービスによって返されたステータスがOKになるまで3分ごとにスラッシングサービスをチェックする必要があります。他のすべてのサービスのサービスチェック時間は変更されません。

私はNagiosを初めて使用するので、これに関するどんな助けでも本当にありがたいです。

nagios

— APZ
ソース

interval_lengthディレクティブがデフォルトで60に設定されていると仮定します。

$ grep interval_length /usr/local/nagios/etc/nagios.cfg 
# This value works of the interval_length you specify later.  If you leave
# actual seconds rather than a multiple of the interval_length variable.
interval_length=60

特別なサービスについては、で別のテンプレートを定義する必要があります/usr/local/nagios/etc/objects/templates.cfg。

define service{
        name                            special-service    
        ...
        max_check_attempts              3           
        normal_check_interval           20         
        retry_check_interval            3           
        notification_interval           60   
        ...   
        }

次のことに注意してください。

normal_check_interval：このサービスは通常の状態で20分ごとにチェックされます
retry_check_interval：サービスが非OK状態に変化したときに再チェックをスケジュールする前に待機する分数。サービスのmax_attemptsステータスが変更されずにサービスが再試行された場合、そのcheck_intervalレートでスケジュールされるように戻ることに注意してください。

このテンプレートをサービスに使用します。

define service{
    use                     special-service
    host_name               xx
    service_description     yy
    check_command           zz
    contact_groups          admins
    }

次のように、サービスの状態に基づいてを変更するために、サービスのエスカレーションを定義する必要がある場合もありますnotification_interval。

define serviceescalation{
    host_name               xx
    service_description     yy
    last_notification       0
    notification_interval   10
    escalation_options      [w,u,c]
    contact_groups          admins
    }

つまり、サービスがWARNING、UNKNOWN、またはCRITICAL状態のときに、このサービスエスカレーションが使用されます。そして今、あなたは新しい通知間隔を持っています：10分。

— 量子
ソース