PagerDuty image

Un géant australien du commerce de détail offre une expérience numérique permanente grâce à PagerDuty

PagerDuty image

Industrie: Vente au détail

Emplacement: Australie

Intégrations clés :

Dynatrace
Jira
Microsoft Teams
ServiceNow

En internalisant le développement et la gestion de son site web, ce géant de la distribution a saisi l'opportunité de repenser son écosystème technologique. Le site web serait le premier à utiliser une toute nouvelle plateforme API, et l'entreprise avait besoin d'une visibilité en temps réel sur le système pour gérer et diagnostiquer les problèmes. Un développeur principal a déclaré : « Le site web était la première application à utiliser les nouvelles API de la nouvelle plateforme. Offrir une expérience d'achat en ligne réussie était essentiel à notre stratégie. »

Soutien au lancement d'un site web interne

Bien que l'équipe d'ingénierie soit expérimentée, des processus de gestion des incidents plus évolutifs étaient nécessaires pour s'adapter à un environnement en constante mutation. « Nous avions besoin de technologies très diverses pour soutenir cette initiative sur la nouvelle plateforme », explique le développeur principal. Malgré la présence d'un système de journalisation, il n'existait aucun moyen simple d'alerter l'équipe en cas de problème. Il fallait qu'une personne examine et interprète les journaux, détermine si l'alerte justifiait un appel et identifie la personne à contacter. Avec le temps, le rythme soutenu des livraisons de l'équipe d'ingénierie a rendu difficile la recherche de la bonne personne au bon moment.

Le détaillant devait relever ces défis pour garantir la haute disponibilité de son site web. Une panne pouvait entraîner une perte de productivité, un manque à gagner et nuire à son image de marque. Après analyse, l'équipe a défini plusieurs exigences techniques nécessaires à l'amélioration de la réponse aux incidents :

  • Comprendre les causes profondes des incidents.
  • Tirez parti des capacités de l'IA pour obtenir des recommandations intelligentes au fil du temps.
  • Encourager la responsabilisation des utilisateurs vis-à-vis des produits permet de réduire le temps nécessaire pour qu'un incident parvienne à l'ingénieur compétent et d'éliminer les signalements erronés.
  • Gérer et mesurer le MTTA et le MTTR.

Pour ce faire, l'entreprise avait besoin d'une plateforme capable d'enrichir les informations disponibles, de relier les dépendances entre les systèmes et de synchroniser les données avec les outils ITSM et APM. Cela permettrait de savoir qui est affecté par un incident et quelles fonctionnalités pourraient être perturbées, et de garantir que les tâches critiques soient rapidement acheminées vers les équipes concernées.

Intégration de PagerDuty dans l'écosystème

PagerDuty a été choisi comme plateforme d'opérations numériques évolutive et facile à utiliser. PagerDuty s'est intégré aux services existants du détaillant, offrant une visibilité complète sur l'écosystème. Cela a permis à l'équipe de mettre en place un processus orchestré pour les tâches critiques et a favorisé une culture de propriété du produit .

Une intégration étroite avec ServiceNow L'outil s'est immédiatement révélé précieux pour la gestion des incidents : il a permis de définir les priorités, de synchroniser les notes entre les deux plateformes et de clôturer les incidents sur chacune d'elles. « C'était vraiment formidable de bénéficier d'une intégration aussi poussée prête à l'emploi, ne nécessitant que très peu d'efforts », a confié le développeur principal. Jira L'intégration a été utilisée pour les alertes ne nécessitant pas le processus ITSM formel, par exemple les conséquences d'autres problèmes. L'équipe a exploité les workflows de Jira pour gérer ces alertes, en synchronisant les notes entre les deux plateformes. Cette intégration a favorisé une conception applicative plus robuste, amélioré la qualité de la journalisation et garanti la création de tickets de qualité.

Tirer parti de l'automatisation et de l'intelligence événementielle

La gestion d'événements basée sur l'apprentissage automatique de PagerDuty, Renseignements sur les événements , a permis d'automatiser la réponse aux incidents. Événements de modification Il a permis d'obtenir une vision globale de la situation, en faisant remonter des informations cruciales sur les déploiements et les mises à jour récentes dans le dépôt de code. Ceci s'est avéré particulièrement utile pour les projets Terraform, en fournissant des indications sur des événements tels que la date, le lieu et l'auteur d'une fusion.

Grâce à des intégrations clés, l'équipe a mis en place des services techniques pour la gestion des incidents. Les ingénieurs ont été habilités à gérer la base de données des services techniques, en assurant le suivi des responsabilités de chacun. Des dépendances ont été créées entre ces services, permettant ainsi la corrélation des problèmes via les API. Au fil du temps, PagerDuty a pu identifier les facteurs potentiels d'un incident et localiser l'ingénieur compétent. « Nous constatons les avantages d'une approche basée sur l'IA pour nos services et leurs dépendances », a déclaré le développeur principal. «PagerDuty nous a permis de gagner en confiance dans nos services et nous a fourni une source fiable d'informations techniques, du point de vue de l'ingénierie, sur l'état d'un service. »

Il était essentiel pour le détaillant de comprendre l'impact d'un incident sur son activité. L'utilisation de PagerDuty Services aux entreprises PagerDuty a permis de communiquer efficacement les informations aux parties prenantes concernées. Mieux encore, les responsables de services pouvaient s'abonner aux alertes ou consulter le tableau de bord d'état pour être informés des événements et de leur résolution. « L'utilisation de PagerDuty a permis à notre service d'assistance de savoir immédiatement quelle fonctionnalité pourrait être affectée par un incident donné », a expliqué le développeur principal.

Avantages de PagerDuty

Grâce à PagerDuty, le magasin a pu lancer avec succès son nouveau site web en interne via la nouvelle plateforme API. Fort d'une meilleure gestion des incidents, l'entreprise est désormais en mesure d'offrir une expérience d'achat en ligne exceptionnelle à ses clients, tout en veillant au bien-être de ses employés.

L'équipe a réalisé :

  • Visibilité complète de la pile. L'intégration avec les technologies existantes, notamment ServiceNow, Microsoft Teams, Jira et Dynatrace, a permis de centraliser les opérations. L'IA établit des liens pertinents, accélérant ainsi le diagnostic des causes profondes des problèmes d'API.
  • Temps de résolution réduit. Les fonctionnalités AIOps éliminent les processus manuels et les approximations dans le traitement des incidents. Les alertes exploitables sont immédiatement transmises à l'ingénieur compétent. Des données précises permettent d'analyser la réponse aux incidents, aidant ainsi les équipes à optimiser leurs opérations.
  • Amélioration de la santé de l'équipe. Grâce à un haut niveau d'intégration et à une responsabilité produit clairement définie, les ingénieurs reçoivent moins d'alertes et sont convaincus que celles qu'ils reçoivent leur sont destinées.
  • Communication efficace avec les parties prenantes. Les tableaux de bord d'état permettent aux équipes de voir lorsqu'un incident affecte un service métier qui leur est important.
  • Expérience client omnicanale. Une expérience de vente au détail réinventée pour les clients, qui peuvent désormais faire leurs achats en toute simplicité, que ce soit en magasin ou en ligne.

Le développeur principal a déclaré : «PagerDuty nous aide à comprendre nos applications, à visualiser l'état de santé de nos produits et à favoriser une culture de responsabilisation. »

Une plateforme solide pour l'avenir

Des plans d'amélioration continue sont prévus dans toute l'organisation. L'entreprise explore… Analyse de PagerDuty , y compris tableaux de bord intelligents afin de mesurer l'impact des incidents sur les équipes, et introduira autopsies Afin d'éviter de répéter les mêmes erreurs, l'entreprise étudie activement les meilleures façons d'intégrer davantage de fonctionnalités d'analyse des événements pour aider l'équipe à réduire le bruit et à accélérer la résolution des incidents. Pour optimiser davantage les opérations, PagerDuty sera déployé auprès d'autres équipes, notamment celles chargées de l'infrastructure et de la sécurité de l'entreprise.

« Avec le recul, nous avons atteint nos objectifs et nous disposons d'une base très solide sur laquelle nous pouvons bâtir », a déclaré le développeur principal.

Pour en savoir plus sur la façon dont PagerDuty aide les détaillants à offrir des expériences client exceptionnelles, rendez-vous sur www.pagerduty.com/clients ou www.pagerduty.com/industries/retail/ , et commencer un Essai gratuit de 14 jours aujourd'hui.