Supervision temps réel
Hôtes et services dans tous leurs états : définition
1. Type d’état et statut
Chaque élément supervisé par Centreon possède un type d’état et un statut.
Le statut traduit une disponibilité pour les hôtes et une performance pour les services. Le type d’état, quant à lui, définit le degré de confiance dans le statut de l’hôte ou du service.
À noter : les mots « état » ou « statut » sont souvent utilisés pour la même notion dans Centreon.
Traditionnellement, Centreon reprend les statuts historiques de Nagios, mais il existe des statuts propres à Centreon Engine, par exemple le statut PENDING (ou EN ATTENTE) qui signifie que l’objet (hôte ou service) n’a pas encore été vérifié.
2. Hôte et objets associés
a. Hôte
Un hôte est une entité IP, aussi appelé nœud ou ressource.
Un serveur physique ou virtuel est un hôte au sens Centreon mais également un switch, un routeur, une imprimante réseau ou encore une caméra IP. De manière générale, tout ce qui possède une IP sur le réseau peut être configuré comme un hôte dans Centreon.
Centreon contrôle la disponibilité d’un hôte. Le statut d’un hôte peut avoir les valeurs suivantes :
-
UP : l’hôte est disponible.
-
DOWN : l’hôte est indisponible.
-
UNREACHABLE : l’hôte est injoignable, à cause de l’indisponibilité d’un hôte dont il dépend (souvent un switch ou un routeur).
La vérification de la disponibilité d’un hôte se fera souvent via un simple ping. Centreon laisse toutefois la liberté dans la commande utilisée. Il est possible de vérifier l’accès à une page web pour superviser la disponibilité d’un serveur web, par exemple.
Si une sonde retourne un code de statut inconnu pour un hôte, Centreon conserve le dernier statut connu.
b. Groupes d’hôtes
Centreon permet de regrouper les hôtes dans un ou plusieurs groupes d’hôtes. Ces groupes peuvent avoir des sémantiques différentes : technique...
Interfaces pour la supervision temps réel
1. Point sur le temps réel de Centreon
La notion de temps réel utilisée dans Centreon est à nuancer par la fraîcheur des résultats de Centreon Engine et les cycles de rafraîchissement des données affichées.
Le schéma ci-dessous résume les latences à considérer.
La latence la plus importante est liée à l’intervalle des vérifications, généralement de plusieurs minutes. La bonne granularité est celle qui permet d’avoir des données de supervision à jour sans saturer les ressources. Il est nécessaire de procéder par itération.
À noter que Centreon offre la possibilité, via son interface web, de forcer immédiatement la vérification d’un service en particulier (voir la fin de ce chapitre) ou de forcer le rafraîchissement immédiat de l’interface.
Intervalle de rafraîchissement de l’interface
Le rafraîchissement des pages correspond physiquement à une requête en base de données et à un réaffichage de la page web avec les données récupérées.
Les intervalles de rafraîchissement de l’interface sont configurés dans le menu Administration - Paramètres - Centreon Web. Les deux premiers paramètres sont définis au niveau du menu Centreon Web. Ils correspondent aux écrans de supervision temps réel et ont généralement un délai plus court, 15 secondes par défaut : Intervalle de rafraîchissement pour la page des statistiques (barre d’état en haut à droite) et Intervalle de rafraîchissement pour la page de supervision.
Le rafraîchissement global de la vue personnalisée est défini dans le menu Administration - Paramètres - Supervision. Par défaut, cette valeur est fixée à 20 secondes.
Les intervalles de rafraîchissement ont un impact non négligeable sur la consommation de ressources de la plateforme de supervision, notamment si le nombre d’utilisateurs connectés est élevé.
Contrôle de la mise à jour dynamique des listes
Les listes de supervision temps réel sont toutes surmontées...
Actions d’exploitation depuis les vues temps réel
1. Aperçu des actions possibles sur les hôtes et services
Plusieurs actions d’exploitation sont possibles depuis les vues temps réel de Centreon. Les actions peuvent être lancées sur plusieurs hôtes ou services à la fois depuis les menus déroulants des listes ou sur un hôte spécifique ou un service spécifique depuis sa vue détaillée.
Actions disponibles depuis la liste des services
Actions disponibles depuis la liste détaillée
Ci-dessous un récapitulatif des actions disponibles sur les hôtes et les services. Elles sont traitées dans la suite de ce chapitre.
Action |
Hôte |
Service |
Acquitter/désacquitter |
Oui |
Oui |
Planifier un arrêt |
Oui |
Oui |
Ajouter un commentaire |
Oui |
Oui |
Planifier un contrôle immédiat |
Non |
Oui |
Planifier un contrôle immédiat forcé |
Non |
Oui |
Soumettre un résultat |
Non |
Oui (passif seul) |
Activer/désactiver les contrôles actifs |
Oui |
Oui |
Activer/désactiver les contrôles passifs |
Oui |
Oui |
Activer/désactiver les contrôles de vérification de l’hôte |
Oui |
Non |
Activer/désactiver les notifications |
Oui |
Oui |
Activer/désactiver le gestionnaire d’événements |
Oui |
Oui |
Activer/désactiver la détection des oscillations |
Oui |
Oui |
Activer/désactiver le suivi précis (processeur compulsif) |
Non |
Oui |
Certains boutons d’action n’apparaissent que si nécessaire. Inutile d’essayer d’acquitter un hôte qui ne serait pas en erreur ou de tenter de forcer l’état sur un service actif.
2. Acquitter un hôte ou un service en alerte
Service acquitté au sein de l’ancienne interface