Manheim verbessert die Produktagilität und fördert die kollaborative Teamarbeit mithilfe von PagerDuty.

PagerDuty image

Industrie: Automobil

Standort: Atlanta, Georgia

Kunde seit: 2014

Manheim® ist Nordamerikas führender Anbieter von Fahrzeugvermarktungsdienstleistungen und verbindet Käufer und Verkäufer mit dem größten Großhandelsmarktplatz für Gebrauchtfahrzeuge und dem umfangreichsten Auktionsnetzwerk. Mit 115 physischen, digitalen und mobilen Auktionen unterstützt das Unternehmen Händler und Geschäftskunden dabei, ihre Geschäftsergebnisse durch innovative Komplettlösungen für das Bestandsmanagement zu optimieren. Manheim investiert stark in die Zukunft der Softwarebereitstellung, die einen strategischen Geschäftstreiber darstellt. Um diesen Geschäftsbereich weiterzuentwickeln, hat Manheim DevOps-Praktiken neben dem traditionellen IT-Betrieb eingeführt. Jason Riggins, Leiter der Produktionsentwicklung, ist verantwortlich für die strategische Ausrichtung, Führung und Überwachung mehrerer Teams: Release Engineering, Entwicklungsbetrieb und Standortbetrieb. Diese Teams der Produktionsentwicklung bilden das Fundament für eine zuverlässige Softwarebereitstellung und damit für die Umsatzgenerierung.

Überwindung der Kommunikationslücke bei kritischen Ereignissen

Vor der Einführung von PagerDuty nutzte Manheim ein manuelles Nachverfolgungsverfahren, wenn Vorfälle auftraten und kritische Anwendungen und Dienste beeinträchtigt waren. Die Bereitschaftskräfte mussten eine Google-Telefonnummer oder das hauseigene Telefonsystem verwenden, um einen Vorfall zu melden.

Manheim musste mit seinen Produktionsentwicklungsteams Schritt halten und seine Methoden zur Rekrutierung der richtigen Einsatzkräfte bei Störungen verbessern. Dafür benötigte das Unternehmen eine Plattform, die sich teamübergreifend standardisieren ließ. Die Herausforderung bestand darin, dass das Unternehmen aufgrund vergangener Umstrukturierungen stark in Silos organisiert war. Diese Silo-Struktur innerhalb der IT-Abteilung wurde für Manheim zunehmend problematisch: „Wir waren weniger agil. Es gab einen Berg von Support-Tickets, Probleme aufgrund der strikten Silo-Strukturen und Kommunikationslücken zwischen den verschiedenen Abteilungen“, erklärte Riggins. „Wir mussten etwas ändern, um weiterhin führend zu sein.“

„PagerDuty war insgesamt ein ausgereifteres Produkt, weshalb wir uns für sie entschieden haben.“

– Jason Riggins , Direktor der Produktionstechnik, Manheim

Die richtigen Mitarbeiter mit den richtigen Informationen rekrutieren, um Ausfallzeiten zu reduzieren

„Wir haben PagerDuty und einen ihrer Mitbewerber in einem direkten Vergleich getestet. Einer der Gründe, warum wir uns für PagerDuty entschieden haben, war ihre langjährige Branchenerfahrung und der bestehende, bewährte Kundenstamm. PagerDuty war insgesamt eine ausgereiftere und funktionsreichere Plattform, weshalb wir uns für sie entschieden haben“, erklärte Riggins.

Manheim hat seitdem seine Softwareentwicklung grundlegend verändert und seine IT-Support- und Reaktionsfähigkeit verbessert. „Ein wesentlicher Bestandteil dieser geschäftsrelevanten Veränderungen ist PagerDuty , da es uns geholfen hat, effizienter zu werden“, so Riggins. Aktuell nutzt das Unternehmen PagerDuty für das Incident-Management verschiedener Services, die Rufbereitschaftsplanung, Eskalationsrichtlinien, das Ereignismanagement und eine kundenspezifische API-Integration. Die Möglichkeit, Benachrichtigungen, Planung und Eskalationsrichtlinien individuell anzupassen, hilft Manheim, stets das richtige Team zusammenzustellen. Die Ereignismanagement-Funktion ermöglicht es Manheim zudem, Incidents zu aggregieren und die mittlere Lösungszeit (MTTR) zu verkürzen. Durch die Implementierung von PagerDuty konnten Riggins und seine Teams Arbeitslasten und Incidents nahtlos den entsprechenden Teams zuweisen. Das Unternehmen ist nicht mehr darauf angewiesen, dass ein Team bei einem Incident Tickets erstellt und dann auf die Reaktion eines anderen Teams wartet. „Mit PagerDuty ermöglicht die leistungsstarke Incident-Verwaltung innerhalb und zwischen Teams die Entwicklung eigener Eskalationsrichtlinien und eine eigenständige Arbeitsweise“, sagte Riggins. Aufgrund dieser geschäftsrelevanten Vorteile und des messbaren ROI baut Manheim die Implementierung von PagerDuty kontinuierlich aus.

Als Manheim nach einer Lösung suchte, stießen sie auf PagerDuty, das die Arbeit ihrer Bereitschaftsteams automatisierte. „PagerDuty konnten wir die für die Bereitschaftsarbeit benötigten Mitarbeiter in den Tagesbetrieb verlagern, was die Gesamtproduktivität steigerte“, so Riggins. Daraufhin stellte das Unternehmen auf ein Capability-Team-Modell um, das auf dem Prinzip „Sie entwickeln es, Sie betreiben es“ basiert. Das Team entwickelt und betreut die Software, während PagerDuty die Überwachung und Alarmierung der Anwendung übernimmt und so die Verfügbarkeit erhöht. Das Enterprise Operation Center (EOC) identifiziert die wichtigsten Warnmeldungen und leitet umgehend eine Reaktion an jedes DevOps-Team weiter, anstatt jede einzelne Meldung zu senden. Übersieht ein Entwickler im Bereitschaftsdienst eine Warnmeldung, wird das EOC-Team in die Eskalationsrichtlinie aufgenommen und dient so als zusätzliche Verteidigungslinie für das Unternehmen.

Ein weiterer Vorteil von PagerDuty für Manheim liegt in der sofort einsatzbereiten Integration mit Datadog, New Relic und Amazon CloudWatch. „Wir verfügen über eine Reihe von Monitoring-Tools, und PagerDuty ermöglicht uns, proaktiver und schneller zu agieren“, so Riggins. Früher führte das Unternehmen eine Änderung ein, woraufhin die Servicequalität sank, Warteschlangen sich stauten und die Reaktionszeiten nicht den Anforderungen entsprachen. Manheim setzt nun standardmäßig auf die Betriebsinfrastruktur von PagerDuty, Datadog und New Relic.

Eine umfassende und flexible Lösung für das Incident-Management finden

PagerDuty ermöglicht Manheim die Anbindung an kritische IT-Services und die Bereitstellung von Ereignisdaten für die richtigen Teams zum richtigen Zeitpunkt. Dies steigert die operative Agilität und IT-Effizienz. Insgesamt hat die Incident-Management-Lösung der Enterprise-Klasse das Vertrauen und die Kommunikation innerhalb des Unternehmens verbessert. „PagerDuty wird sich weiter verbreiten und zum Standard werden. Wir verlassen uns auf die Stabilität und Genauigkeit, die uns PagerDuty bietet. Ohne diese Lösung stünden wir wieder ganz am Anfang“, so Riggins.