Blog

3 étapes faciles pour supprimer le bruit des alertes

par David Cooper 17 avril 2017 | 3 min de lecture

Pour beaucoup de nos clients, réduction du bruit d'alerte C'est une tâche ardue, mais gratifiante. Optimiser ses alertes, c'est réduire les interruptions nocturnes et améliorer le bien-être des collaborateurs. Cependant, sans les outils adéquats, cette tâche peut vite devenir fastidieuse.

Dans cet article, je vais vous présenter une méthode efficace pour identifier les alertes parasites et inexploitables, et y remédier. Vous pourrez ainsi contrôler facilement les notifications envoyées à votre équipe, sans avoir à modifier la configuration des outils en amont.

1. Obtenez une vue d'ensemble et identifiez les alertes parasites.

Tout d'abord, il vous faut une vue d'ensemble et en temps réel de votre infrastructure d'alerte. Pour bien comprendre les dépendances entre les services, le comportement des alertes et l'impact de toute panne, vous avez besoin d'une visualisation qui vous permette d'analyser facilement des milliers de points de données.

Notre Application de santé des infrastructures , qui vit à l'intérieur de notre Console de commandes des opérations C'est exactement ce que fait cet outil. Imaginez-le comme une chronologie ultime, où vous pouvez repérer ces alertes bruyantes et redondantes qui sollicitent constamment votre équipe.

operations command console

 

2. En savoir plus sur ces alertes

D’où viennent-elles ? Quelle est leur gravité ?

Après avoir identifié une source de bruit, vous pouvez obtenir plus d'informations à son sujet en explorant notre nouvelle Tableau des alertes Ici, vous pouvez rechercher, trier et filtrer les alertes concernant votre système. entier L'infrastructure. Ces alertes ont également toutes été automatiquement normalisées via l'infrastructure. API Événements v2 ce qui permet de trouver facilement toutes les informations pertinentes sans avoir à mémoriser les schémas de différents fournisseurs. Dans mon exemple, je peux voir que les alertes proviennent de la source prodsql-a Toutes ces alertes ont un niveau de gravité « Info ». Ce sont des alertes informatives et elles ne devraient pas alerter mon équipe.

alert tables

 

3. Agir et réprimer

Comme j'ai repéré des alertes informatives qui ne devraient pas alerter mon équipe, je vais utiliser PagerDuty. Moteur de règles d'événements Pour supprimer ces alertes d'information, les règles d'événements de PagerDuty couvrent plusieurs intégrations, ce qui est très pratique car je n'ai pas besoin de modifier la configuration de mes outils de surveillance en amont, ce qui me fait gagner du temps.

create events rules

Voilà, j'ai identifié avec succès une alerte non exploitable et a créé une règle d'événement pour la supprimer. Désormais, ces types d'alertes ne m'alerteront plus, mais toutes ces données existent toujours et sont visualisées dans PagerDuty, ce qui me permet d'avoir une vue d'ensemble complète de mon infrastructure en permanence.

Trouver le juste équilibre de suppression d'alerte La gestion des alertes est autant un art qu'une science. Cependant, plus vous disposez d'informations et plus votre infrastructure d'alerte est transparente, plus vous avez de chances de vous concentrer sur l'essentiel, de minimiser les risques et, au final, de réussir. Chez PagerDuty, nous vous fournissons les solutions nécessaires pour comprendre, analyser et réagir intelligemment aux événements d'infrastructure. Nous sommes fiers d'accompagner les équipes de développement et d'exploitation dans leur développement. gérer leurs services en production avec facilité.

Pour plus d'informations sur ces solutions, consultez notre dernier article. publication de fonctionnalités conçues pour les développeurs .