Gestion de la disponibilité

Par ses fonctions de gestion de la disponibilité, SmartReport fournit les outils et les informations permettant aux exploitants et aux administrateurs de :

  • Vérifier continuellement le bon fonctionnement de l’infrastructure
  • Anticiper et prévenir les pannes
  • Identifier les dysfonctionnements et informer les administrateurs concernés

La gestion de la disponibilité et des incidents regroupe les fonctionnalités suivantes : Cartographie, Monitoring Actif, Monitoring passif et Alerting.

Surveillance de la disponibilité et alertes

Le module de surveillance et d’alertes est l’outil d’exploitation dont le bénéfice est le plus immédiat sur la gestion de la disponibilité du système d’information. Son rôle est de vérifier le fonctionnement d’un équipement ainsi que des services informatiques qu’il fournit afin de détecter les pannes, et de les anticiper quand cela est possible.

Basé sur l’ordonnanceur de Nagios, SmartReport fournit 2 méthodes complémentaires afin de qualifier l’état de fonctionnement d’un équipement ou d’une application : le monitoring actif et le monitoring passif.


Monitoring Actif

Par des tests spécifiques à chaque équipement et applicatif, SmartReport vérifie régulièrement (sur une cadence spécifique) que l’équipement répond conformément à ce qui est attendu. Il s’agit généralement de tests réseau (ex : icmp ping pour vérifier la connectivité sur un routeur) ou applicatif (ex : requêtes HTTP ou SQL). Les tests sont réalisés « en tant qu’utilisateur » de l’équipement ou de l’application. Le résultat est donc généralement le même que celui qu’obtiendrait un utilisateur. Aucun agent ou module logiciel n’est installé sur l’équipement supervisé.

Si un dysfonctionnement est détecté, par exemple si aucune réponse n’a été reçue dans le délai imparti, ou si elle ne contenait pas la chaîne de caractères attendue, un ou plusieurs tests sont effectués à nouveau, sur une cadence plus courte ou plus longue selon l’application, de façon à confirmer le diagnostic et à éviter les faux positifs, c’est-à-dire les alertes émises alors que l’équipement fonctionne correctement.
Si le dysfonctionnement est confirmé, une alerte est émise par email, ou par sms via une passerelle tierce (non fournie). Les modes d’alertes sont souples et sont étendus à tout ce qui peut être « scripté ».

Édition des services


Avantages de Nagios

Le moteur de Monitoring Actif est basé sur l’ordonnanceur du logiciel Opensource de référence en matière de monitoring : Nagios. Ce choix permet d’une part de bénéficier de toute l’intelligence du moteur, notamment en matière de réduction des faux-positifs mais aussi d’intégrer facilement la plupart des plugins de monitoring existants déjà grâce à Nagios et à sa communauté d’utilisateurs.
Il permet également de se baser sur une installation existante afin de gagner du temps lors de l’intégration de la solution, en récupérant l’existant.


Monitoring passif

Le Monitoring passif est une méthode de surveillance de la disponibilité basée sur le protocole SNMP et plus particulièrement sur les «traps» que remontent régulièrement les équipements actifs. SmartReport remplit le rôle de serveur de Traps SNMP et reçoit en permanence les évènements transmis par les équipements. Si ces derniers correspondent à des évènements configurés et reconnus, l’évènement est enregistré et une alerte est émise.

Gestion des alertes par Trap SNMP


Monitoring par NRPE

Le protocole NRPE permet à SmartReport de déléguer la réalisation de tests auprès d’un équipement tiers, un serveur le plus généralement qui réalise le test pour lequel il est configuré et transmet son résultat à SmartReport au travers de l’agent NRPE.
NRPE est particulièrement pertinent quand il s’agit de réaliser des tests spécifiques à une application ou à un système, et que ces tests ne peuvent être réalisés à distance au travers du réseau ou d’un serveur d’application. On utilise alors des tests ou des scripts « locaux », exécutés directement sur l’équipement supervisé.

L’utilisation du protocole NRPE est parfois nécessaire pour réaliser des tests à partir de points précis du réseau, plutôt que de manière centralisée, notamment dans le cas d’un réseau WAN.

Alertes

Lors de la détection d’un incident, lorsqu’un seuil est atteint ou simplement lors d’un retour à la normale, SmartReport peut émettre une alerte par email auprès d’un contact ou d’un groupe de contacts que vous définissez. Ceux-ci sont spécifiques à chaque équipement et / ou service. Les fréquences de ré-émission sont paramétrables.
Les alertes sont émises par email, par « net send » ou par SMS au travers de passerelles tierces, non fournie. Les modes d’alertes sont souples et sont étendus à tout ce qui peut être « scripté ».