Manheim améliore l'agilité de ses produits et favorise le travail d'équipe collaboratif grâce à PagerDuty.

PagerDuty image

Industrie: Automobile

Emplacement: Atlanta, Géorgie

Client depuis : 2014

Manheim® est le principal fournisseur nord-américain de services de remarketing automobile, mettant en relation acheteurs et vendeurs sur le plus vaste marché de véhicules d'occasion en gros et au sein du réseau de ventes aux enchères le plus étendu. Grâce à ses 115 points de vente physiques, numériques et mobiles, l'entreprise aide les concessionnaires et les entreprises clientes à atteindre leurs objectifs commerciaux en leur fournissant des solutions de gestion des stocks complètes et innovantes. Chez Manheim, l'équipe investit massivement dans l'avenir du développement logiciel, un levier stratégique majeur. Afin de faire progresser cet aspect de l'activité, Manheim a adopté les pratiques DevOps en complément de ses opérations informatiques traditionnelles. Jason Riggins, directeur de l'ingénierie de production, est responsable de la direction stratégique, du pilotage et de la supervision de plusieurs équipes : ingénierie des mises en production, opérations de développement et opérations sur site. Ces équipes d'ingénierie de production constituent le socle indispensable pour garantir un déploiement logiciel fiable et, par conséquent, des revenus stables.

Combler le fossé de communication lors d'incidents critiques

Avant la mise en place de PagerDuty , Manheim disposait d'une procédure de suivi manuelle pour les incidents affectant les applications et services critiques. Les intervenants d'astreinte devaient utiliser un numéro de téléphone Google ou le système téléphonique interne pour signaler un incident.

Manheim devait maintenir le rythme de ses équipes d'ingénierie de production et améliorer ses méthodes de recrutement des intervenants adéquats en cas d'incident. L'entreprise avait besoin d'une plateforme standardisable pour toutes les équipes de développement. Le problème résidait dans le cloisonnement important qui y régnait suite à d'anciennes restructurations. Ce cloisonnement, notamment au sein des opérations informatiques, devenait de plus en plus problématique pour Manheim : « Nous étions moins agiles. Les tickets s'accumulaient, les problèmes étaient dus au cloisonnement des équipes et un manque de communication s'était installé entre les différentes unités », a déclaré Riggins. « Il nous fallait absolument changer les choses pour rester compétitifs. »

«PagerDuty était globalement un produit plus abouti, c'est pourquoi nous l'avons choisi. »

– Jason Riggins Directeur de l'ingénierie de production, Manheim

Recruter les bonnes personnes, avec les bonnes informations, pour réduire les temps d'arrêt

« Nous avons comparé PagerDuty à l'un de ses concurrents. Si nous avons opté pour PagerDuty , c'est notamment grâce à son expérience reconnue dans le secteur et à sa clientèle fidèle. PagerDuty était une plateforme plus aboutie et plus riche en fonctionnalités, ce qui explique notre choix », a déclaré Riggins.

Depuis, Manheim a transformé ses méthodes de développement logiciel et amélioré son support informatique et ses capacités de réponse. « L'utilisation de PagerDuty a largement contribué à ces changements significatifs pour l'entreprise, car elle nous a permis de gagner en efficacité », a déclaré Riggins. L'entreprise utilise actuellement PagerDuty pour la gestion des incidents de divers services, la planification des astreintes, les politiques d'escalade, la gestion des événements et une intégration API personnalisée. La possibilité de personnaliser les notifications, la planification et les politiques d'escalade permet à Manheim de constituer systématiquement l'équipe adéquate, tandis que la fonctionnalité de gestion des événements lui permet de centraliser les incidents et de réduire le délai moyen de résolution (MTTR). Grâce à PagerDuty, Riggins et ses équipes peuvent désormais attribuer facilement les charges de travail et les incidents aux équipes appropriées. L'entreprise n'est plus dépendante d'une seule équipe pour ouvrir des tickets lors d'un incident et attendre la réponse d'une autre. « Avec PagerDuty, la gestion des incidents au sein des équipes et entre elles leur permet de développer leurs propres politiques d'escalade et de devenir autonomes », a conclu Riggins. Grâce à ces avantages concrets sur l'activité et à ce retour sur investissement tangible, Manheim continue de développer la mise en œuvre de PagerDuty.

Lorsque Manheim a commencé à chercher une solution, l'entreprise a découvert que PagerDuty automatisait le travail de ses équipes d'astreinte. «PagerDuty nous a permis de transférer les équipes d'astreinte vers les heures de jour, ce qui a augmenté la productivité globale », explique Riggins. C'est alors que l'entreprise a adopté un modèle d'équipes de compétences, évoluant vers un modèle « vous le développez, vous l'exploitez ». L'équipe développe et assure le support du logiciel, tandis que PagerDuty contribue à la surveillance et aux alertes de l'application, améliorant ainsi sa disponibilité globale. Le Centre d'opérations d'entreprise (EOC) identifie les alertes critiques les plus importantes et fournit une réponse immédiate à chaque équipe DevOps, au lieu de leur transmettre chaque alerte. Si un développeur d'astreinte manque une alerte, il ajoute l'équipe EOC à la procédure d'escalade, constituant ainsi une ligne de défense supplémentaire pour l'organisation.

Un autre avantage de PagerDuty pour Manheim réside dans son intégration native avec Datadog, New Relic et Amazon CloudWatch. « Nous disposons d'une suite d'outils de supervision et PagerDuty nous permet d'être plus proactifs et plus rapides », explique Riggins. À une époque, suite au déploiement d'une modification, la qualité de service avait chuté, les files d'attente s'étaient engorgées et le temps de réponse n'était plus satisfaisant. Manheim a désormais standardisé ses opérations sur PagerDuty, Datadog et New Relic.

Trouver une solution de gestion des incidents complète et agile

PagerDuty permet à Manheim de se connecter aux services informatiques critiques et de générer des données d'événements avec les équipes concernées au moment opportun, ce qui accroît son agilité opérationnelle et l'efficacité de son service informatique. Globalement, cette solution de gestion des incidents de niveau entreprise a renforcé la confiance et la communication au sein de l'organisation. «PagerDuty va gagner en popularité et devenir la norme. Nous comptons sur la stabilité et la précision qu'il nous PagerDuty. Sans cette solution, nous serions au point de départ », a déclaré Riggins.