Introduction
Objectif : configurer la supervision de la solution de supervision ServiceNav par elle-même.
Ce document est destiné aux administrateurs de la solution ServiceNav.
Il décrit les points de contrôle à déployer sur les équipements de la solution ServiceNav afin de s’assurer qu’ils fonctionnent bien.
Pour des raisons de sécurité, certains points de contrôle peuvent être mis en œuvre uniquement à l’intérieur du réseau VPN ServiceNav.
Ce document décrit donc les points de contrôle à mettre en service pour chaque équipement de la solution. Pour chaque équipement, il est décrit :
- Quel équipement le supervise
- Sur quel réseau : VPN, Internet
- Nom du point de contrôle
- Arguments du point de contrôle
- Fréquence du point de contrôle
- Criticité du point de contrôle
- Si une politique de notification doit être mise en œuvre de façon obligatoire : la nature de la politique de notification est de la responsabilité de l’administrateur de la solution.
Prérequis
Certains points de contrôle sont à positionner sur chaque boitier de supervision afin que ceux-ci se supervisent eux-même.
Par contre, il est nécessaire qu’un boitier de supervision supervise tous les autres composants de la solution ServiceNav. Ce boitier de supervision sera appelé dans ce document : le superviseur.
Afin de s’assurer que le superviseur est lui même opérationnel, celui-ci doit être lui même supervisé de façon croisée par un autre boitier de supervision. Ce second boitier de supervision sera appelé sentinelle dans la suite du document.
La solution ServiceNav nécessite donc au minimum deux boîtiers de supervision afin d’être supervisée.
Il est conseillé de localiser la sentinelle sur une infrastructure différente du reste de la solution ServiceNav.
Le diagramme suivant expose une implémentation typique.
ServiceNav Box
Les points de contrôle ci-dessous sont à mettre en œuvre pour tous les boitiers de supervision.
Depuis | Modèle | Arguments | Intervalle contrôle (min) | Notif. oblig. |
Créer/recenser un équipement avec adresse IP : 127.0.0.1 sur la communauté « coservit » | ||||
Elle-même | CPU | Ident. modèle | Ident. modèle | |
Elle-même | LIN-DiskIO | Ident. modèle | Ident. modèle | |
Elle-même | LIN-Diskspace | Ident. modèle | Ident. modèle | X |
Elle-même | LIN-Network_traffic | Ident. modèle | Ident. modèle | |
Elle-même | LIN-RAM | Ident. modèle | Ident. modèle | |
Elle-même | LIN-Swap | Ident. modèle | Ident. modèle | |
Elle-même | check_vsb_remote_health | Ident. modèle | Ident. modèle | X |
Créer/recenser un équipement avec adresse IP = celle du réseau VPN ServiceNav sur la communauté « coservit » | ||||
Superviseur | LIN-Proc-CPU-Usage | processus :nscaapache2nagiosremoteOperationBoxseuil alerte : 70 seuil critique : 80 | 5 | X |
Superviseur | LIN-Proc-RAM-Usage | processus :nscaapache2nagiosremoteOperationBoxseuil alerte : 70 seuil critique : 80 | 10 | X |
Superviseur | Lin-Process-SWAP | processus :nscaapache2nagiosremoteOperationBoxseuil alerte : 10 seuil critique : 20 | 15 | X |
Superviseur | Lin-Process-Nb-Byname | processus : apache2 seuil alerte : 20 seuil critique : 80 | 5 | X |
Superviseur | Lin-Process-Nb-Byname | processus : nagios seuil alerte : 50 seuil critique : 100 | 5 | X |
Superviseur | VSBox-Live-Status | Nom du boitier défini sur le site web | 15 | X |
ServiceNav Box Mutualisée
Implémenter les points de contrôle définis dans le chapitre précédent.
Ajouter en plus les points de contrôle suivants :
Depuis | Modèle | Arguments | Intervalle contrôle (min) | Notif. oblig. |
Créer/recenser un équipement avec adresse IP = celle du réseau VPN ServiceNav sur la communauté « coservit » | ||||
Superviseur | TCP-Port | 5667 | 5 | X |
Si le superviseur exerce aussi le rôle de ServiceNav Box mutualisée, le point de contrôle doit être créé sur la sentinelle.
ServiceNav Box – superviseur
Depuis | Modèle | Arguments | Intervalle contrôle (min) | Notif. oblig. |
Créer/recenser un équipement avec adresse IP : 127.0.0.1 sur la communauté « coservit » | ||||
Elle-même | CPU | Ident. modèle | Ident. modèle | |
Elle-même | LIN-DiskIO | Ident. modèle | Ident. modèle | |
Elle-même | LIN-Diskspace | Ident. modèle | Ident. modèle | X |
Elle-même | LIN-Network_traffic | Ident. modèle | Ident. modèle | |
Elle-même | LIN-RAM | Ident. modèle | Ident. modèle | |
Elle-même | LIN-Swap | Ident. modèle | Ident. modèle | |
Elle-même | check_vsb_remote_health | Ident. modèle | Ident. modèle | X |
Créer/recenser un équipement avec adresse IP = celle du réseau VPN ServiceNav sur la communauté « coservit » | ||||
Sentinelle | LIN-Proc-CPU-Usage | processus :nscaapache2nagiosremoteOperationBoxseuil alerte : 70 seuil critique : 80 | 5 | X |
Sentinelle | LIN-Proc-RAM-Usage | processus :nscaapache2nagiosremoteOperationBoxseuil alerte : 70 seuil critique : 80 | 10 | X |
Sentinelle | Lin-Process-SWAP | processus :nscaapache2nagiosremoteOperationBoxseuil alerte : 10 seuil critique : 20 | 15 | X |
Sentinelle | Lin-Process-Nb-Byname | processus : apache2 seuil alerte : 20 seuil critique : 80 | 5 | X |
Sentinelle | Lin-Process-Nb-Byname | processus : nagios seuil alerte : 50 seuil critique : 100 | 5 | X |
Sentinelle | VSBox-Live-Status | Nom du boitier défini sur le site web | 15 | X |
ServiceNav Box – sentinelle
Depuis | Modèle | Arguments | Intervalle contrôle (min) | Notif. oblig. |
Créer/recenser un équipement avec adresse IP : 127.0.0.1 sur la communauté « coservit » | ||||
Elle-même | CPU | Ident. modèle | Ident. modèle | |
Elle-même | LIN-DiskIO | Ident. modèle | Ident. modèle | |
Elle-même | LIN-Diskspace | Ident. modèle | Ident. modèle | X |
Elle-même | LIN-Network_traffic | Ident. modèle | Ident. modèle | |
Elle-même | LIN-RAM | Ident. modèle | Ident. modèle | |
Elle-même | LIN-Swap | Ident. modèle | Ident. modèle | |
Elle-même | check_vsb_remote_health | Ident. modèle | Ident. modèle | X |
Créer/recenser un équipement avec adresse IP = celle du réseau VPN ServiceNav sur la communauté « coservit » | ||||
Superviseur | LIN-Proc-CPU-Usage | processus :nscaapache2nagiosremoteOperationBoxseuil alerte : 70 seuil critique : 80 | 5 | X |
Superviseur | LIN-Proc-RAM-Usage | processus :nscaapache2nagiosremoteOperationBoxseuil alerte : 70 seuil critique : 80 | 10 | X |
Superviseur | Lin-Process-SWAP | processus :nscaapache2nagiosremoteOperationBoxseuil alerte : 10 seuil critique : 20 | 15 | X |
Superviseur | Lin-Process-Nb-Byname | processus : apache2 seuil alerte : 20 seuil critique : 80 | 5 | X |
Superviseur | Lin-Process-Nb-Byname | processus : nagios seuil alerte : 50 seuil critique : 100 | 5 | X |
Sentinelle | VSBox-Live-Status | Nom du boitier défini sur le site web | 15 | X |
ServiceNav – Site Web
Depuis | Modèle | Arguments | Intervalle contrôle (min) | Notif. oblig. |
Créer/recenser un équipement avec adresse IP : celle du réseau VPN ServiceNav ou IP locale sur la communauté « coservit » | ||||
Superviseur | CPU | Ident. modèle | Ident. modèle | |
Superviseur | LIN-DiskIO | Ident. modèle | Ident. modèle | |
Superviseur | LIN-Diskspace | Ident. modèle | Ident. modèle | X |
Superviseur | LIN-Network_traffic | Ident. modèle | Ident. modèle | |
Superviseur | LIN-RAM | Ident. modèle | Ident. modèle | |
Superviseur | LIN-Swap | Ident. modèle | Ident. modèle | |
Superviseur | LIN-Proc-CPU-Usage | processus :rsyncsshdcronexim4openvpnsnmpdseuil alerte : 10 seuil critique : 20 | 5 | X |
Superviseur | LIN-Proc-CPU-Usage | processus : mysqldapache2seuil alerte : 70 seuil critique : 90 | 5 | X |
Superviseur | LIN-Proc-CPU-Usage | processus :ODS_PerfData,ODS_StatusDataVS_UpdateBoxProviderVSB_InitialisationVS_CommandProcessingVS_ExternalSynchroVS_ITDiscoveryVS_ITInventoryseuil alerte : 50 seuil critique : 70 | 5 | X |
Superviseur | LIN-Proc-CPU-Usage | processus : ndo2db seuil alerte : 70 seuil critique : 90 | 5 | X |
Superviseur | LIN-Proc-CPU-Usage | processus : beam.smpepmdinet_gethostseuil alerte : 15 seuil critique : 50 | 5 | X |
Superviseur | LIN-Proc-RAM-Usage | processus : rsyncsshdcronexim4openvpnsnmpdseuil alerte : 5 seuil critique : 10 | 10 | X |
Superviseur | LIN-Proc-RAM-Usage | processus :ODS_PerfDataODS_StatusDataVS_UpdateBoxProviderVSB_InitialisationVS_CommandProcessingVS_ExternalSynchroVS_ITDiscoveryVS_ITInventoryseuil alerte : 50 seuil critique : 70 | 10 | X |
Superviseur | LIN-Proc-RAM-Usage | processus : apache2seuil alerte : 5 seuil critique : 10 | 5 | X |
Superviseur | LIN-Proc-RAM-Usage | processus : mysqldseuil alerte : 50 seuil critique : 70 | 5 | X |
Superviseur | LIN-Proc-RAM-Usage | processus : ndo2dbseuil alerte : 50 seuil critique : 70 | 10 | X |
Superviseur | LIN-Proc-RAM-Usage | processus : beam.smpepmdinet_gethostseuil alerte : 10 seuil critique : 20 | 10 | X |
Superviseur | Lin-Process-Swap | processus : rsyncsshdcronexim4openvpnsnmpdseuil alerte : 5 seuil critique : 10 | 15 | X |
Superviseur | Lin-Process-Swap | processus : mysqld,apache2seuil alerte : 10 seuil critique : 20 | 15 | X |
Superviseur | Lin-Process-Swap | processus :ODS_PerfDataODS_StatusDataVS_UpdateBoxProviderVSB_InitialisationVS_CommandProcessingVS_ExternalSynchroVS_ITDiscoveryVS_ITInventoryseuil alerte : 50 seuil critique : 70 | 15 | X |
Superviseur | Lin-Process- Swap | processus : ndo2db seuil alerte : 10 seuil critique : 20 | 10 | X |
Superviseur | Lin-Process-Swap | processus : beam.smpepmdinet_gethostseuil alerte : 5 seuil critique : 10 | 15 | X |
Superviseur | Lin-Process-Nb-Byname | processus : apache2 seuil alerte : 70 seuil critique : 100 | 5 | X |
Superviseur | Lin-Process-Nb-Byname | processus : ndo2db seuil alerte : 1000 seuil critique : 1500 | 5 | X |
Superviseur | TCP-Port | Port : 80Seuil alerte : 2 Seuil critique : 4 | 1 | X |
Superviseur | TCP-Port | Port : 443Seuil alerte : 2 Seuil critique : 4 | 1 | X |
Superviseur | TCP-Port | Port : 9465Seuil alerte : 2 Seuil critique : 4 | 1 | X |
Superviseur | check_vsp_process_health | Nom d’utilisateur : supervision Mot de passe : supervision Vhost : %2f Processus : ODS_PerfData Seuils « messages ready » : 10:50 Seuils « messages processing » : 2:5 Seuils « temps IDLE » : 300:900 | 10 | X |
Superviseur | check_vsp_process_health | Nom d’utilisateur : supervision Mot de passe : supervision Vhost : %2f Processus : ODS_StatusData Seuils « messages ready » : 10:50 Seuils « messages processing » : 2:5 Seuils « temps IDLE » : 300:900 | 10 | X |
Superviseur | check_vsp_process_health | Nom d’utilisateur : supervision Mot de passe : supervision Vhost : %2f Processus : VSB_Initialisation Seuils « messages ready » : 2:5 Seuils « messages processing » : 2:5 Seuils « temps IDLE » : 300:900 | 10 | X |
Superviseur | check_vsp_process_health | Nom d’utilisateur : supervision Mot de passe : supervision Vhost : %2f Processus : VS_CommandProcessing Seuils « messages ready » : 2:5 Seuils « messages processing » : 2:5 Seuils « temps IDLE » : 300:900 | 10 | X |
Superviseur | check_vsp_process_health | Nom d’utilisateur : supervision Mot de passe : supervision Vhost : %2f Processus : VS_ITDiscovery Seuils « messages ready » : 10:20 Seuils « messages processing » : 2:5 Seuils « temps IDLE » : 300:900 | 10 | X |
Superviseur | check_vsp_process_health | Nom d’utilisateur : supervision Mot de passe : supervision Vhost : %2f Processus : VS_ITInventory Seuils « messages ready » : 10:20 Seuils « messages processing » : 2:5 Seuils « temps IDLE » : 300:900 | 10 | X |
Superviseur | check_vsp_process_health | Nom d’utilisateur : supervision Mot de passe : supervision Vhost : %2f Processus : VS_ExternalSynchro Seuils « messages ready » : 10:20 Seuils « messages processing » : 2:5 Seuils « temps IDLE » : 300:900 | 10 | X |
Superviseur | Check_Aliveness_RabbitMQ | Idem modèle | 2 | X |
Créer/recenser un équipement avec adresse IP : adresse IP publique sur la communauté « coservit » | ||||
Sentinelle | TCP-Port | Port : 80Seuil alerte : 2 Seuil critique : 4 | 1 | X |
Sentinelle | TCP-Port | Port : 443Seuil alerte : 2 Seuil critique : 4 | 1 | X |
ServiceNav – Business Intelligence
Depuis | Modèle | Arguments | Intervalle contrôle (min) | Notif. oblig. |
Créer/recenser un équipement avec adresse IP : celle du réseau VPN ServiceNav ou IP locale sur la communauté « coservit » | ||||
Superviseur | CPU | Ident. modèle | Ident. modèle | |
Superviseur | LIN-DiskIO | Ident. modèle | Ident. modèle | |
Superviseur | LIN-Diskspace | Ident. modèle | Ident. modèle | X |
Superviseur | LIN-Network_traffic | Ident. modèle | Ident. modèle | |
Superviseur | LIN-RAM | Ident. modèle | Ident. modèle | |
Superviseur | LIN-Swap | Ident. modèle | Ident. modèle | |
Superviseur | Lin-Process-CPU | processus :rsyncsshdcronexim4openvpnsnmpdseuil alerte : 10 seuil critique : 20 | 5 | X |
Superviseur | LIN-Proc-CPU-Usage | processus : mysqldseuil alerte : 70seuil critique : 90 | 5 | X |
Superviseur | LIN-Proc-CPU-Usage | processus : javaseuil alerte : 70seuil critique : 90timeperiod : 00h – 08h | 5 | |
Superviseur | LIN-Proc-RAM-Usage | processus : rsyncsshdcronexim4openvpnsnmpdseuil alerte : 5 seuil critique : 10 | 10 | X |
Superviseur | LIN-Proc-RAM-Usage | processus : mysqldseuil alerte : 50 seuil critique : 70 | 10 | X |
Superviseur | LIN-Proc-RAM-Usage | processus : javaseuil alerte : 50 seuil critique : 70 timeperiod : 00h – 08h | 5 | |
Superviseur | Lin-Process-Swap | processus : rsyncsshdcronexim4openvpnsnmpdseuil alerte : 5 seuil critique : 10 | 15 | X |
Superviseur | Lin-Process-Swap | processus : mysqldseuil alerte : 10 seuil critique : 20 | 15 | X |
Superviseur | Lin-Process- Swap | processus : javaseuil alerte : 10 seuil critique : 20timeperiod : 00h – 08h | 5 | |
Superviseur | VS_VBI_check_dw_vs_param : kpi_performance_scheduler | Nom d’utilisateur : supervision Mot de passe : <voir configuration serveur> Nom du processus : kpi_performance_scheduler_status Statut(s) attendu(s) : SUCCESS Temps avant péremption du statut : 1440 | 720 | X |
Superviseur | VS_VBI_check_dw_vs_param : kpi_status_scheduler | Nom d’utilisateur : supervision Mot de passe : <voir configuration serveur> Nom du processus : kpi_status_scheduler_status Statut(s) attendu(s) : SUCCESS Temps avant péremption du statut : 1440 | 720 | X |
Superviseur | VS_VBI_check_dw_vs_param : inventory_quantity_synchronizer | Nom d’utilisateur : supervision Mot de passe : <voir configuration serveur> Nom du processus : inventory_quantity_synchronizer_status Statut(s) attendu(s) : SUCCESS Temps avant péremption du statut : 1440 | 720 | X |