Table des matières

Supervision Nagios

Nagios Core

Supervision de logs

La supervision de logs est considéré comme un service, mais un peu particulier…
En effet, Nagios utilise la notion de d'état SOFT ou HARD pour les services ou les hosts, ce qui permet de limiter les effets de faux positif. Un fonctionnement intéressant pour gérer les aléas du réseau, pour temporiser sur des changements furtif de statut. En SOFT ou en HARD, l'alarme apparaît sur l'interface Nagios, mais la notification n'est effectif que sur des états HARD.
Or, dans le cas de la supervision de log, ce fonctionnement n'est pas souhaitable, car l’événement va apparaître à un instant T, sera détecté par Nagios déclenchera un état SOFT, puis au prochain check, si on n'a pas eut de nouvelles occurrences, le service reprendra son état OK.
Donc à moins d'être collé devant l'écran de supervision en permanence ou de lire le log statut nagios régulièrement, on n'aura pas connaissance de cette alarme, car il n'y aura pas de notifications.

☛ L'idée pour palier à cette problématique, c'est tout simplement de désactiver cet état SOFT en configurant le paramètre max_check_attempts à 1 (pour les services), par exemple :

# SVG : Sauvegarde serveur
define service{
        use                             service-1d           ; Name of service template to use
        hostgroup_name                  grp-localhost
        service_description             SVG Serveur
        check_command                   check_file_age!/var/back/log/sauvegarde.log!2592000!7776000!0!0
        max_check_attempts              1                    ; Pour désactiver l'etat SOFT pour ce type de service
        }

Gestion du Flapping

FIXME : Problématique de certains checks pour les lesquels on ne les vérifie que toutes les heures ou 24h… Le flapping n'est pas intéressant dans ce cas là. A compléter