SAP révolutionne ses processus de réponse rapide aux incidents majeurs grâce à PagerDuty
Taille: Plus de 100 000 employés
Industrie: Technologie
Emplacement: Walldorf, Allemagne
Client depuis : 2019
SAP est le leader du marché des logiciels d'application d'entreprise, avec des clients dans plus de 180 pays. Plus des trois quarts des revenus transactionnels mondiaux transitent par un système SAP.
Ces dernières années, SAP s'est engagée dans une transformation numérique de son activité et a transféré ses services clients vers le cloud. Dans le cadre de son rôle au sein de Services cloud mondiaux Au sein de l'équipe GCS, Mitchell Rose, responsable de programme senior, est chargé de garantir la disponibilité mondiale de ces services. « La vision de SAP est de contribuer à un monde plus performant et d'améliorer la vie des gens », explique-t-il, « mais pour y parvenir, nous devons réduire au maximum le nombre et l'impact des pannes et incidents dans le cloud qui affectent nos clients. »
L'équipe Global Cloud Services a pour mission d'aider les équipes techniques de SAP à garantir la disponibilité permanente de leurs services et infrastructures cloud grâce à une gestion intelligente des pannes. « Cela impliquait la création d'un service de gestion des incidents majeurs capable de s'adapter à l'échelle de SAP, nous permettant ainsi de garantir la disponibilité de services tels qu'Ariba, Concur et Fieldglass », a déclaré Rose.
Des difficultés ont entravé la réponse aux incidents majeurs.
Compte tenu de ces difficultés, l'équipe savait que développer et déployer un tel service au sein d'une organisation de la taille de SAP serait complexe. De nombreuses équipes utilisaient des outils internes personnalisés pour leurs besoins techniques respectifs ; or, ces outils n'étaient pas adaptés à l'ensemble de l'organisation. Au fil des années, les acquisitions réalisées par SAP ont entraîné l'utilisation d'outils et de processus différents au sein de l'organisation, rendant la collaboration et la cohésion difficiles.
« Les modèles opérationnels variaient considérablement d'une équipe à l'autre », explique Rose. « Les définitions opérationnelles différaient, et le mot « priorité » avait une signification différente pour chaque équipe. Leurs systèmes de gestion des tickets, leurs outils ChatOps, leurs processus et leurs pratiques étaient également différents. Pour réussir, nous avions besoin d'une plateforme de pointe qui corresponde à notre vision de la gestion des incidents majeurs. C'est pourquoi nous avons adopté PagerDuty. »

PagerDuty contribue à accélérer la réponse aux incidents majeurs
L'équipe des services cloud mondiaux de SAP utilise PagerDuty pour orchestrer sa réponse aux incidents majeurs. Depuis l'adoption de PagerDuty, SAP a amélioré sa gestion des incidents majeurs, réduisant de 30 % les délais de réponse et de communication initiaux et de 26 % les délais de résolution en deux mois.
« Nous avons réussi à réduire l'impact et la durée des incidents majeurs », a déclaré Rose. « Grâce à PagerDuty, nous pouvons mobiliser les bonnes personnes, sur les bons problèmes, au bon moment. Résultat : nous avons réduit de 25 % le nombre de personnes nécessaires pour résoudre les incidents majeurs en seulement deux mois. »
PagerDuty a également contribué à améliorer communication Entre les équipes et les parties prenantes, SAP doit gérer les incidents critiques ayant un impact sur les clients, comme les interruptions de service cloud. SAP active alors le mode « SWAT », sa procédure interne de réponse aux situations critiques. L’équipe SWAT pilote ensuite la communication interne, y compris avec les responsables de la communication client.
Grâce à PagerDuty, l'équipe d'intervention spéciale (SWAT) a accès à des informations en temps réel sur l'état d'un incident, ce qui lui permet de tenir informées les autres parties prenantes, y compris la direction. Les décisions de déclencher l'intervention spéciale sont ainsi prises plus rapidement, ce qui contribue à réduire le temps de réponse aux incidents majeurs de plusieurs heures à quelques minutes dans de nombreux cas.

Favoriser une plus grande collaboration et une plus grande responsabilisation
GCS a intégré PagerDuty à son dispositif de gestion des incidents majeurs afin d'optimiser sa collaboration avec les équipes MIM (Major Incident Management) de SAP. Désormais, en cas d'incident majeur, l'équipe concernée (par exemple, l'équipe SuccessFactors ou Ariba MIM) est notifiée pour coordonner la réponse la plus adaptée.
«PagerDuty nous a permis d'aligner nos équipes métiers et techniques autour d'un modèle opérationnel commun pour la gestion des incidents majeurs », a déclaré Rose. « Grâce à ce cadre commun, nous avons harmonisé nos processus et nos critères de gravité et de priorité. Nous avons également clairement défini les responsabilités des services lors d'un incident majeur, à l'échelle de SAP. »
«PagerDuty est devenu un outil essentiel pour SAP. »
– Mitchell Rose , Responsable de programme senior, SAP
Avantages de PagerDuty
Depuis la mise en œuvre de PagerDuty, l'équipe des services cloud mondiaux de SAP a amélioré son excellence opérationnelle, avec notamment les avantages suivants :
- La capacité à mobiliser les bonnes personnes avec les bonnes informations en temps réel, optimisant ainsi la réponse aux incidents majeurs
- Une réduction de 25 % du nombre d'intervenants nécessaires pour les incidents majeurs, en deux mois.
- Collaboration inter-équipes accrue et prise en charge des services
- Amélioration de la communication en temps réel avec l'ensemble de l'entreprise concernant les incidents majeurs, contribuant à l'atteinte des SLA de performance internes.
- Réduction de l'impact et de la durée des incidents majeurs, avec des temps de réponse réduits de 30 % et des temps de résolution réduits de 26 %.
- Intégration transparente avec divers outils commerciaux et internes
«PagerDuty est devenu un outil essentiel pour SAP, permettant à nos équipes de collaborer et de réagir rapidement aux incidents majeurs, et nous aidant à continuer de fournir aux clients SAP des services numériques de classe mondiale », a conclu Rose.
Tourné vers l'avenir
L'équipe des services cloud mondiaux de SAP s'efforce d'améliorer la résolution des incidents et utilisera les rapports d'analyse post-mortem de PagerDuty , ainsi que les incidents passés, pour faciliter le dépannage des problèmes actuels. Par ailleurs, SAP souhaite automatiser davantage son processus de réponse aux incidents majeurs en créant des procédures d'exploitation automatisées, alignées sur les principaux indicateurs d'impact sur l'activité, grâce à PagerDuty.
Pour découvrir comment PagerDuty peut aider votre équipe à simplifier et à transformer ses opérations dans un monde numérique, contactez votre gestionnaire de compte ou essayez un Essai gratuit de 14 jours aujourd'hui.