Réduisez le MTTR et optimisez l'automatisation grâce à l'orchestration globale des événements de PagerDuty.
L'orchestration globale d'événements de PagerDuty est désormais disponible. Son puissant moteur de décision enrichit les événements, contrôle leur routage et déclenche des actions de réparation automatique en fonction des données recueillies. Les équipes peuvent utiliser cette fonctionnalité avec l'ensemble des services PagerDuty. Cet investissement continu dans l'orchestration d'événements témoigne de l'engagement de PagerDuty à fournir à ses clients des capacités d'automatisation de pointe.
Les clients participant à notre programme d'accès anticipé constatent déjà les avantages de l'orchestration globale des événements, notamment une réduction du MTTR et une meilleure standardisation de la réponse aux incidents à grande échelle. Comme l'explique Kiril Yurovnik, responsable technique chez Riskified : « Face à la multiplication des incidents, il est impératif de minimiser les perturbations et les efforts, d'autant plus que les entreprises cherchent à optimiser leurs processus informatiques dans le contexte économique actuel. Nous utilisons l'orchestration globale des événements de PagerDuty dans le cadre de notre programme d'accès anticipé, et les résultats sont très encourageants. Riskified a pu réduire les perturbations à grande échelle, en particulier dans les environnements hors production, ce qui permet à notre équipe de gagner un temps précieux pour se concentrer sur l'innovation. »
Que sont les orchestrations d'événements mondiaux ?
L'orchestration d'événements mondiaux est comme Orchestration des événements de service En effet, elle permet aux utilisateurs de définir des règles complexes qui déterminent le traitement d'un événement. La différence réside dans le fait que l'orchestration globale d'événements enrichit les événements dès leur ingestion. Une fois les données normalisées, l'événement est acheminé vers un service en fonction de différents critères. Ainsi, les intervenants disposent des données d'événement les plus complètes possibles pour entamer le processus de réponse.
L'orchestration globale d'événements comporte trois composantes clés qui contribuent à son succès dans la mise à l'échelle de la réponse aux incidents.
Règles d'orchestration globale Cette fonctionnalité permet aux utilisateurs d'appliquer des actions aux événements, quel que soit le service utilisé. Les équipes peuvent créer des règles qui traitent les données d'événements provenant de différents services et les utiliser pour optimiser le routage des événements. Les organisations peuvent ainsi mettre en place et améliorer la remédiation automatique. De ce fait, l'intervention humaine n'est plus nécessaire pour résoudre un incident. Un routage plus intelligent permet également de réduire l'impact d'un incident.
Gestion améliorée des clés d'intégration Cela réduit la charge de travail liée à la gestion des clés d'intégration pour différents outils de surveillance. Les utilisateurs peuvent ainsi combiner les clés d'intégration au sein d'une seule orchestration d'événements. Mieux encore, la gestion améliorée des clés d'intégration est désormais disponible pour tous les abonnements PagerDuty .
API supplémentaires Permet une gestion à grande échelle. Les équipes peuvent utiliser les API REST pour la gestion des sources d'événements et des règles d'orchestration globales. Ces deux API sont compatibles avec Terraform. Elles s'ajoutent aux API REST de gestion de l'orchestration d'événements et de services.
« L’utilisation de l’orchestration d’événements globale de PagerDuty s’est avérée essentielle pour garantir l’efficacité et l’évolutivité de nos processus de routage d’événements, et ainsi optimiser nos opérations et dépenses informatiques », a déclaré Brian Long, ingénieur infrastructure cloud chez Hyland. « Grâce à l’orchestration d’événements globale, notre organisation peut détecter l’état « résolu » de nos notifications afin de le traiter comme tel et de réduire d’au moins trois le nombre d’endroits où ces conditions doivent être configurées. Nous pouvons ainsi consacrer notre temps à l’innovation plutôt qu’à la configuration. »
Comment l'orchestration d'événements mondiaux peut-elle aider mon équipe ?
Grâce à l'orchestration d'événements mondiaux, les équipes verront :
- Processus de réponse aux incidents codifiés : démocratiser et diffuser des procédures de réponse aux incidents bien comprises au sein d'équipes distribuées
- Moins d'incidents : Utilisez les données d'événements contextuels de tous les services de votre écosystème pour améliorer la précision de la suppression.
- Résolution plus rapide : Déployer l'automatisation au sein des équipes et activer les diagnostics automatisés à grande échelle grâce à un enrichissement standardisé et une normalisation des données.
L'utilisation de l'orchestration globale d'événements par les équipes peut varier selon leur structure organisationnelle. Les fonctionnalités correspondent à deux types d'équipes : les équipes ITOps, SRE et NOC, et les équipes de développement.
équipes ITOps pourra tirer parti des capacités de normalisation des événements, garantissant ainsi que tous les événements se présentent de la même manière à leur arrivée.
Équipes SRE Il est possible de créer et d'étendre l'automatisation à l'ensemble des services d'un écosystème technique. L'automatisation à grande échelle et sa standardisation au sein d'une organisation s'en trouve ainsi simplifiée.
Pour les équipes d'intervention de niveau 1 telles que les NOC L'orchestration globale des événements leur permet de gérer le flux massif d'événements entrants. Ces événements peuvent être acheminés vers le centre d'opérations réseau (NOC) s'ils répondent à certains critères. De plus, à mesure que l'événement traverse différents niveaux de règles et de règles imbriquées, l'automatisation peut fournir des diagnostics à l'intervenant de niveau 1. Si la solution à un incident est bien connue, les organisations peuvent mettre en place une remédiation automatique.
équipes de développement On constatera moins d'incidents et une résolution plus rapide. Grâce à la remédiation automatique, les incidents peuvent être résolus avant même d'affecter les services d'astreinte des équipes de développement. De plus, grâce à des critères de routage précis, les incidents ne sont pas transférés d'une équipe à l'autre. Si l'automatisation, le centre d'opérations réseau (NOC) ou les intervenants de niveau 1 ne parviennent pas à résoudre un incident, celui-ci est transmis à l'expert métier. Et lorsque ce dernier commence à travailler sur l'incident, les informations de diagnostic sont déjà disponibles, ce qui réduit le temps de résolution.
Comment puis-je commencer dès aujourd'hui ?
L'orchestration globale d'événements est généralement disponible pour tous les clients PagerDuty AIOps. Pour la voir en action, Rejoignez-nous sur Twitch Vendredi 14 avril.
PagerDuty AIOps aide les équipes à réduire le nombre d'incidents, à accélérer leur résolution et à améliorer leur productivité, sans déploiement long ni maintenance lourde. Pour essayer PagerDuty AIOps, vous pouvez demander une période d'essai. ici ou prendre notre tournée des produits Si vous souhaitez parler à notre service commercial, contactez-nous via ce formulaire .
Pour en savoir plus sur l'orchestration d'événements mondiaux, inscrivez-vous à cette formation. webinaire Si vous êtes client PagerDuty AIOps et que vous souhaitez créer votre première orchestration d'événements globale, ceci article de la base de connaissances peuvent vous montrer comment démarrer.