Surveillance des événements cardiaques
Surveillez la connectivité du système et détectez les pulsations manquées grâce à la fonction de surveillance des événements de pulsation de PagerDuty.
Gestion d'état avancée
Éliminez la gestion manuelle des pulsations grâce à une automatisation qui différencie les fenêtres de maintenance des pannes système réelles à l'aide de variables de cache et d'une orchestration d'événements.
Contexte centré sur le service
Obtenez une visibilité immédiate sur les services métier affectés, leurs dépendances et l'impact sur les clients en cas de défaillance des signaux de présence.
Résolution automatisée
Accélérez les temps de réponse grâce à la résolution automatique des alertes dès la reprise de l'activité et à la création d'incidents qui permettent aux équipes de se concentrer sur les vrais problèmes plutôt que sur les distractions.
Comment PagerDuty Advance peut-il vous aider aujourd'hui ?
Problème
Les organisations utilisant un système de surveillance des pulsations hérité sont confrontées à des angles morts opérationnels avec des contrôles d'état binaires de base qui nécessitent une association manuelle entre les défaillances des pulsations et les problèmes réels du système, créant du bruit à cause d'alertes obsolètes et d'un manque de contexte sur l'impact sur le service ou les conséquences commerciales.
Solution
La surveillance des pulsations cardiaques de PagerDuty, basée sur l'AIOps, transforme les simples contrôles de connectivité en une gestion opérationnelle intelligente grâce à un suivi automatisé de l'état, une association basée sur des règles et un contexte centré sur le service qui réduit le bruit tout en accélérant les délais de résolution grâce à une visibilité complète de l'impact sur l'activité.
Étapes techniques du poste
1a. Créer une variable de cache de données d'événement
- Pour les événements où event_action = « déclencheur »
- Extraire le champ dedup_key de l'événement actuel
1b. Créer une variable de cache de comptage d'événements
- Pour les événements où event_action = « déclencheur »
- Définissez la durée de votre Fenêtre temporelle souhaitée pour les battements cardiaques
2. Créer une règle d'orchestration pour résoudre les alertes
Condition
- Pour les événements où event_action = « déclencheur »
- Variable de cache du nombre d'événements >= 1
- La variable de cache des données d'événement existe
Action
Alerte de suspension pour le Fenêtre temporelle souhaitée pour le rythme cardiaque + 5 secondes (Ce délai supplémentaire sert de marge de manœuvre pour permettre au webhook de résoudre l'alerte précédente.)
Déclenchement du webhook sur alerte suspendue
- URL : https://events.pagerduty.com/v2/enqueue
- Clé de routage : COPIER LA CLÉ D'INTÉGRATION DEPUIS EO
- Clé de déduplication : {{NOM DE LA VARIABLE DU CACHE DE DONNÉES D'ÉVÉNEMENT}}
- Action de l'événement : « résoudre »
- *Champs supplémentaires* (Veuillez noter que, selon les règles de routage de l'orchestration des événements, des champs supplémentaires peuvent être nécessaires pour que l'événement soit acheminé vers le service approprié afin de résoudre l'alerte. Ceci n'est pas requis si la déduplication globale est configurée pour l'orchestration des événements.)
3. Créer une règle d'orchestration pour capturer le premier événement de battement de cœur
Condition
- Pour les événements où event_action = « déclencheur »
- Variable de cache du nombre d'événements
Action
- Alerte de suspension pour le Fenêtre temporelle souhaitée pour le rythme cardiaque + 5 secondes