Blog

Optimisez le triage avec des alertes et des suppressions

par Sean Higgins 22 novembre 2016 | 4 minutes de lecture

En tant que plaque tournante qui centralise DevOps et Opérations informatiques En ce qui concerne les données des outils, de nombreuses organisations comptent sur PagerDuty pour les avertir lorsqu'un composant de leur infrastructure informatique présente un comportement inattendu. Si vous avez déjà utilisé PagerDuty , vous avez probablement déjà dû gérer plusieurs incidents liés à un même problème, pour lesquels vous avez été notifié. Cela se produit généralement si vous disposez de systèmes de surveillance redondants ou si un point de défaillance ou de dégradation unique provoque un effet domino, plusieurs outils déclenchant simultanément des alertes.

Pour y remédier, nous avons apporté des modifications importantes à notre modèle de données en redéfinissant le concept d'alerte dans PagerDuty, comme un objet qui suit l'état de l'outil de surveillance. L'utilisation d'alertes dans PagerDuty est essentielle à deux nouvelles fonctionnalités prometteuses : Triage et suppression des alertes.

Présentation du triage des alertes

Avec la disponibilité du nouveau Triage des alertes Grâce à cette fonctionnalité, vous pouvez regrouper les alertes liées en un seul objet incident, permettant ainsi une véritable gestion des incidents de bout en bout. Les intervenants ne sont plus alertés sur des symptômes individuels et cloisonnés. Les workflows de résolution sont désormais centrés sur un objet incident véritablement représentatif d'un problème ou d'une panne réel(le) impactant le service. Cette fonctionnalité redéfinit la manière dont les clients peuvent trier et interagir intelligemment avec les données de leurs systèmes afin de réduire le bruit, d'améliorer la collaboration interfonctionnelle et de réduire les délais de résolution.

Les alertes seront automatiquement activées sur les nouveaux services PagerDuty et vous pourrez commencer à utiliser les nouvelles fonctionnalités de tri des alertes immédiatement. Pour les services existants où cette configuration est pertinente, cliquez simplement sur « Modifier le service » et activez l'option « Créer des alertes et des incidents ».

incident-behavior

Lorsqu'un service est configuré pour Créer des alertes et des incidents Toutes les alertes exploitables créeront un incident parent. Pour regrouper les alertes associées en un seul incident, sélectionnez deux incidents ou plus dans la liste, cliquez sur « Fusionner » et sélectionnez l'incident dans lequel fusionner tous les éléments.

merge-incidents

Lorsque vous fusionnez plusieurs incidents, vous pouvez facilement modifier le résumé de l'incident pour refléter avec précision le problème en question, afin que les intervenants puissent rapidement se mettre au courant.

merge-incidents-summary

Avantages du triage des alertes

Alert Triage présente de nombreux avantages lorsqu’il s’agit de permettre un flux de travail de résolution d’incident plus fluide.

seamless-incident-resolution-workflow

  • Centraliser les informations d'alerte critiques Au lieu de traiter plusieurs alertes de manière indépendante, sans corrélation ni consolidation, les intervenants peuvent désormais enquêter sur un seul incident pour se mettre rapidement au courant.
  • Voir tous les services impactés – Identifier rapidement tous les services qui ont été impactés par l’incident.
  • Rationaliser le transfert interfonctionnel – Ceci est particulièrement utile pour le NOC et les intervenants de premier niveau, car ils n’ont désormais plus qu’à interagir avec un seul objet pour la réaffectation, au lieu de réaffecter ou d’escalader manuellement les alertes individuelles.
  • Réduire la fatigue liée aux alertes – Les intervenants ne sont désormais alertés que sur un seul incident avec tout le contexte d’alerte consolidé, au lieu de plusieurs fois à partir d’outils cloisonnés envoyant des alertes redondantes.
  • Établir un commandement d'incident pour une meilleure collaboration – Les flux de travail de réponse, tels que la mobilisation des intervenants et les conférences, sont désormais centrés sur l’objet d’incident amélioré avec tout le contexte pertinent, simplifiant ainsi les communications.
  • Tirer parti des actions groupées pour une vitesse améliorée – Lorsqu’une action est entreprise sur un incident parent, elle est automatiquement appliquée à toutes les alertes enfants, et vice versa.

L'utilisation des alertes et la nouvelle fonctionnalité de tri des alertes sont essentielles pour exploiter pleinement la valeur ajoutée de PagerDuty et sont accessibles à tous les clients sans frais supplémentaires. Nous vous encourageons vivement à consulter les articles d'assistance suivants pour en savoir plus :

N'hésitez pas à nous contacter support@pagerduty.com Si vous avez des questions ou des commentaires, n'hésitez pas à nous contacter. Nous espérons qu'avec Alert Triage, vous et vos équipes bénéficierez d'une réponse optimisée aux incidents.