Nous l’avons vu dans les articles précédents, le traitement des faux positifs dans la supervision est indispensable. En effet, l’absence de traitement fait augmenter drastiquement le coût d’exploitation du SI par des interventions inutiles et coûteuses.
ServiceNav, en tant que solution de supervision, propose différents moyens d’éviter les faux positifs notamment à travers un paramétrage correct de la supervision : les seuils et les contrôles complémentaires.
Mais par où commencer ?
Une question récurrente qui vient lors de la configuration de la supervision et lors du traitement des faux positifs est : par où commencer ?
En réalité, il existe 2 types de faux positifs si aucun travail n’a été effectué :
- Ceux en permanence en alerte ou en critique et qui ne changent pas de statut.
- Il s’agit souvent d’un problème de seuils. Par exemple le nombre d’utilisateurs connectés à une base MS SQL qui est tout le temps entre 100 et 250 avec un seuil critique à 30. Dans ce cas : il faut régler les seuils.
- Ceux qui « bagotent », c’est-à-dire que leur statut passe de OK à non OK (Alerte, Critique ou Inconnu) plusieurs fois par jour.
- Il peut s’agir d’un problème de seuils, mais plus vraisemblablement d’un problème de contrôles complémentaires non mis en place.
Comment identifier les éléments à traiter ?
Pour le premier cas, les éléments en permanence en non OK, l’exploitation technique de ServiceNav et ses filtres est le meilleur endroit pour travailler.
En recherchant tous les éléments en non OK et non acquittés et en s’interrogeant sur chacun d’entre eux, je vérifie l’onglet métrique, je regarde l’historique, …
- Vrai problème ? Je le prends en compte, j’ouvre un ticket grâce à l’intégration ticketing (l’élément sera acquitté) et l’équipe en charge du RUN va s’en occuper
- Faux positifs ? Je modifie les seuils
Pour le second cas, les éléments qui « bagotent », il existe aussi des outils dans ServiceNav et notamment le rapport « Résumé des informations d’exploitation ».
Un fichier Excel qui sort sur les 7, 30 ou 90 jours de son choix, pour chaque élément le nombre de passage dans chacun des statuts et le temps pour chaque statut.
Ici un exemple sur 7 jours : (nous avons trié la colonne « Nombre de passage en critique par ordre décroissant »)
On constate très rapidement qu’en traitant les 10 premières lignes (soit 10 équipements ou services sur les 1315 du fichier), nous allons réduire de plus de 50% le nombre d’alertes (386 sur les 736 que contient le fichier).
Le ROI est donc immédiat !
En conclusion
L’intérêt du traitement des faux positifs dans la supervision est un incontournable. ServiceNav propose des outils et méthodes pour optimiser le traitement, des consultants formés à ses outils pour vous aider si nécessaire.
Et ensuite ?
Pour ServiceNav, le traitement des faux positifs de la supervision reste une priorité et l’ensemble de la stack BigData déployée depuis la version 4.0 va permettre d’apporter encore plus d’intelligence au produit et dans les mois qui viennent proposer des ajustements de seuil automatique ou faire des propositions de contrôles complémentaires.