- PagerDuty /
- Blog /
- Automatisation /
- PagerDuty à re:Invent 2022 lance des diagnostics automatisés pour AWS qui permettent aux organisations de résoudre les incidents plus rapidement afin qu'elles puissent innover davantage
Blog
PagerDuty à re:Invent 2022 lance des diagnostics automatisés pour AWS qui permettent aux organisations de résoudre les incidents plus rapidement afin qu'elles puissent innover davantage
C'est cette période de l'année ! PagerDuty revient à Sin City pour AWS re: Invent 2022 ! La conférence mondiale rassemble des organisations de toutes tailles et devrait explorer les thèmes de la modernisation, de l'automatisation et de la résilience dans le cloud. Dans le contexte économique actuel, les entreprises cherchent à faire évoluer leurs opérations et à optimiser leurs coûts tout en offrant à leurs clients des expériences numériques permanentes. L'automatisation joue un rôle clé en aidant à soutenir l'efficacité opérationnelle et les coûts. Cette année, nous sommes ravis d'apporter une nouvelle solution à l'étage re:Invent : Diagnostics automatisés pour AWS Cela permet aux équipes d'ingénierie de consacrer plus de temps à l'innovation et de subir moins d'interruptions. Nous sommes également fiers d'être sponsor Platinum de re:Invent, d'approfondir notre relation à long terme avec AWS et de proposer des CloudOps automatisés à nos clients.
Le cloud dévore le monde
Selon Gartner, « d’ici 2023, 40 % de toutes les charges de travail des entreprises seront déployées dans des services d’infrastructure et de plateforme cloud, ce qui représente une augmentation par rapport aux 20 % de 2020 ». Cette citation souligne encore davantage le fait que l’adoption du cloud reste une priorité absolue pour les entreprises qui cherchent à numériser davantage leurs services et leur infrastructure back-end. AWS vous offre une évolutivité, une agilité et une vitesse d’innovation sans précédent, mais les équipes sont confrontées à une complexité croissante et à des dépendances toujours croissantes entre les systèmes, les processus et leurs organisations. Cette situation complexe menace de mettre en péril l’expérience des clients et des employés, sans parler des revenus.
À mesure que les organisations migrent vers le cloud et déploient des architectures cloud natives, la complexité accrue peut entraîner davantage d’incidents (coûteux). De nombreuses organisations fonctionnent dans des architectures cloud complexes contenant plusieurs services interconnectés (dont beaucoup existent de manière éphémère) qui sont déployés dans différentes zones de disponibilité et différents comptes. Lorsqu’un incident se produit, il peut falloir beaucoup de temps pour le résoudre sans en comprendre la cause profonde ou sans savoir qui dispose des privilèges d’accès appropriés et de l’expertise en la matière. Cela signifie de nombreuses escalades et des développeurs éloignés de tâches à forte valeur ajoutée.
Les incidents peuvent coûter cher — vraiment cher. Un grand détaillant peut perdre plus de 200 000 $ par minute de revenus pour chaque minute où le site est en panne. Les incidents entraînent également des coûts de productivité, car les ingénieurs travaillent à résoudre le problème au lieu de créer de nouvelles fonctionnalités et de se concentrer sur l'innovation. Une mauvaise expérience client à cause ou pendant un incident peut coûter encore plus cher à une organisation sous forme de réputation de marque. Et lorsque vous additionnez tous ces facteurs, le coût d'un incident est bien plus élevé que ce que vous avez peut-être prévu.
La résilience est importante
La résilience est essentielle pour garantir que vos clients profitent de leurs expériences numériques avec peu ou pas d'interruption. La réalité inconfortable ? Des pannes et des services seront inévitablement causés. Cela nous arrive à tous. Ce qui compte vraiment, c'est la rapidité avec laquelle vous pourrez récupérer et remettre vos services dans le vert, en plus de veiller à ce que des incidents similaires ne se reproduisent pas à l'avenir. Il est essentiel de garantir une visibilité totale sur votre infrastructure hybride et de vous assurer que vous pouvez détecter et diagnostiquer rapidement les problèmes pour assurer la continuité de votre activité et de tous vos services.
La résilience n'est pas une simple affaire de hasard, c'est une responsabilité partagée. Les clients doivent mettre en place leur infrastructure, leurs opérations et leur personnel de manière à pouvoir faire face aux incidents et y réagir rapidement. Définir clairement la propriété et la responsabilité en laissant les équipes créer et s'approprier leurs services est un élément essentiel pour garantir une réponse ciblée et en temps réel aux incidents.
PagerDuty offre aux équipes une réponse aux incidents de bout en bout et des capacités d'automatisation avancées qui orchestrent rapidement et précisément la bonne réponse, à chaque fois. L'automatisation des processus aide les équipes à diagnostiquer et à résoudre rapidement les incidents en réduisant considérablement le nombre d'escalades et le MTTR afin que les équipes d'ingénierie puissent se concentrer sur l'amélioration continue et l'innovation.
Trop d'humains, trop peu de temps
Les architectures cloud modernes pour les clients AWS sont des composites de quelque 250 services AWS et 25 000 workflows SaaS disponibles sur le marché, combinés à des logiciels développés en interne et à d'autres systèmes hérités.
Lorsque des incidents surviennent dans ces environnements cloud complexes, il est souvent nécessaire d'avoir accès à une expertise complète de la pile cloud pour déterminer la cause profonde probable, exclure d'autres possibilités parmi les dépendances et vérifier les faux positifs. Cela peut nécessiter qu'un premier intervenant fasse appel à plusieurs ingénieurs experts pour recueillir ces diagnostics afin de déterminer qui doit être le résolveur final.
Les intervenants de première ligne manquent souvent de savoir-faire et d'accès pour collecter le contenu de diagnostic dans les environnements AWS. De nombreux intervenants de première ligne sont des généralistes et manquent de connaissances techniques sur les investigations nécessaires pour diagnostiquer des problèmes spécifiques dans les services. Les premiers intervenants ne disposent pas non plus d'un accès superutilisateur pour pouvoir exécuter des investigations techniques en raison des politiques de sécurité.
Cela signifie que les premiers intervenants doivent généralement faire appel à plusieurs experts pour obtenir les données dont ils ont besoin pour trier un incident, ce qui prend plus de temps au personnel pour résoudre l'incident et interrompt davantage de membres de l'équipe. Dans le cas de pannes graves, cela allonge inutilement le temps nécessaire à la résolution d'un incident, détourne les ingénieurs de tâches à forte valeur ajoutée et augmente le coût global d'une panne. L'automatisation peut jouer un rôle clé non seulement pour résoudre les incidents plus rapidement, mais aussi pour fournir aux premiers intervenants les données de diagnostic dont ils ont besoin pour résoudre les incidents par eux-mêmes, économisant ainsi un temps d'ingénierie précieux.
Diagnostics automatisés pour AWS
Avec les diagnostics automatisés pour AWS, les intervenants en cas d'incident peuvent rapidement trier eux-mêmes les incidents, réduisant ainsi le besoin de faire appel à de l'aide, accélérant la résolution pour les clients et augmentant l'efficacité opérationnelle. Diagnostics automatisés pour AWS dans PagerDuty fournit des modèles de tâches de diagnostic prédéfinis et fréquemment utilisés pour les services couramment utilisés, notamment Amazon EC2, AWS Lambda, Amazon ECS, Amazon RDS, etc. Les clients peuvent facilement configurer ces modèles de tâches pour qu'ils fonctionnent dans leurs environnements spécifiques et étendre les étapes de diagnostic dans un flux de travail. Les diagnostics automatisés pour AWS permettent également aux clients de concevoir rapidement leurs propres tâches de diagnostic pour AWS, ainsi que l'automatisation corrective pour l'atténuation et la remédiation qui peuvent être invoquées par les intervenants dans PagerDuty Incident Response ou déclenchées par PagerDuty Event Intelligence.
Les équipes du service client et les parties prenantes sont coordonnées avec des informations d'état en temps réel pour offrir une meilleure expérience de support client. L'automatisation aide les équipes internes à fonctionner plus efficacement en réduisant de 25 minutes le MTTR, en réduisant le nombre de personnes nécessaires pour résoudre un incident et en diminuant de 40 % le nombre d'escalades, ce qui permet d'économiser du temps et de l'argent tout en améliorant l'expérience client.
Diagnostics automatisés pour AWS :
- Donne aux premiers intervenants le pouvoir de trier, d'atténuer et de résoudre les incidents, améliorant ainsi le MTTR à tous les niveaux.
- Réduit les escalades vers les ingénieurs en utilisant des modèles de tâches prédéfinis et des intégrations de plug-ins aux outils et services AWS critiques
- Permet aux équipes d'améliorer en permanence l'efficacité de la réponse aux incidents dans leurs environnements AWS, ce qui permet de gagner du temps aux ingénieurs
En savoir plus sur les diagnostics automatisés pour AWS ou Commencez ici .
Rencontrez PagerDuty chez AWS re:Invent
Il y aura de nombreuses occasions de rencontrer notre équipe à re:Invent, de récupérer des objets, de saluer Pagey et d'assister à des conférences éclair sur notre stand.
Arrêtez-vous chez nous stand #3819 pour obtenir une démonstration de nos offres de produits, notamment l'automatisation des processus, la réponse aux incidents, l'intelligence des événements et le service client, afin de voir comment PagerDuty Operations Cloud peut vous aider à améliorer vos opérations numériques. Nous aurons également de nombreuses conférences éclair de nos partenaires – en savoir plus ici .
Si vous souhaitez éviter la foule et planifier une réunion ou une démonstration dans l'une de nos salles de réunion, soumettez simplement votre demander ici . Notre équipe peut adapter la conversation à vos besoins spécifiques et partager davantage sur PagerDuty et AWS.
Lundi 28 novembre, 14h30 au Théâtre Vénitien, Niveau 2, Session #PRT217
Rejoignez-nous pour notre panel de leaders du secteur de SalesForce, Netflix, Sailpoint et Benefitfocus qui discuteront de la façon dont ils ont transformé leurs organisations avec PagerDuty et AWS.
Mercredi 30 novembre, de 18h à 20h
Rejoignez notre les leaders et vos pairs de l'industrie au Matteo's Ristorante Italiano pour des cocktails et des conversations en soirée. Découvrez comment PagerDuty aide certaines des entreprises les plus innovantes au monde à offrir une expérience client supérieure.
Pour en savoir plus sur PagerDuty et AWS Cliquez ici ou montre ce webinaire.