Ça y est, votre solution de supervision est déployée sur votre SI et vos différentes équipes semblent conquises ! L’activité sur votre système d’information est stable et vous avez de bons retours. Seulement un beau jour, vous constatez que vos services sont lents et que des utilisateurs vous remontent des dysfonctionnements, alors comment identifier le(s) problème(s) et éviter que l’utilisateur devienne l’outil de supervision ? La réponse en trois mot : le monitoring informatique. 

Les tâches autour d’une solution ne s’arrêtent pas une fois celle-ci mise en place. Problèmes matériels, résolutions de bugs, évolution des utilisateurs, mises à jour… Un grand nombre de paramètres peuvent entraîner des dysfonctionnements sur votre SI sans monitoring informatique. Hé oui ! C’est un indispensable. Mais au-delà de l’alerting, il vous aidera à solutionner ces problèmes et à les prévenir (comme le dit l’adage, il vaut mieux prévenir que guérir !). Mais alors, que faut-il surveiller ?

#1 La latence

Un site web ou une application lente peut faire fuir un client potentiel et cela peut vite se chiffrer en plusieurs milliers d’euros. Une bonne réactivité des services donne aussi des utilisateurs heureux ! Mais que faire des informations de latence une fois récoltées ? Classer ces données en fonction de leurs criticités afin d’en mesurer plus efficacement l’impact est une première bonne approche avant d’entamer des actions permettant d’améliorer la qualité des applications impactées.

#2 Les erreurs

Contrairement à la latence, les erreurs ont tendance à provoquer des problèmes plus évidents. Bugs, mauvaise interopérabilité et bien d’autres sources d’erreurs peuvent mener à des dysfonctionnements importants voir une défaillance imminente du système. Il devient alors indispensable de pouvoir être alerté à temps des erreurs sur le SI, que ce soit sous forme de point de mesures précis ou via la lecture des logs. (Ces informations peuvent être rassemblées dans un tableau de bord afin d’avoir une vision claire sur leur impact).

#3 Le throughput (le débit)

Superviser son débit réseau est tout aussi judicieux. Cette surveillance permet d’identifier les goulots d’étranglement pouvant amener à de la latence au niveau des applications. Le débit peut aussi permettre d’indiquer un problème de capacité dans le cas d’un débogage de performance. Ces données fournissent suffisamment d’informations pour mieux comprendre l’évolution du trafic dans le temps.

#4 L’utilisation ou le Capacity Planning

Ce peut-être dommage de voir planter une application pour un stockage rempli ou une insuffisance de RAM sur un serveur. Vous trouvez cela absurde ? Nous aussi. Pour éviter ces imprévus, il vous faut mettre en place des mesures de l’utilisation des ressources. Le capacity planning vous permet également d’avoir une vision d’ensemble sur les capacités maximales de votre SI : la planification des capacités doit garantir que vous disposez de suffisamment de ressources (processeur, bande passante, stockage, RAM…). Suivre l’utilisation des ressources et faire le lien avec l’évolution du SI vous permettra ainsi d’anticiper les futurs besoins en matériel et en ressources de votre système.

En surveillant la latence, les erreurs, le débit et l’utilisation des ressources de votre système, une large partie des principaux besoins en supervision devraient être couverts. Si ces bests practices du monitoring informatique sont correctement mises en place, vous serez alors à l’abri des principales sources de dysfonctionnements pouvant mettre à mal votre SI et impacter votre activité !

Fort d’une expertise de plus de 15 ans dans la mise en place de solutions de monitoring informatique Open Source, Capensis saura répondre à vos besoins pour votre projet de supervision ou d’hypervision.