Wie Einzelhändler mit PagerDuty ihre Produktivität steigern, die Reaktion auf Vorfälle verändern und Teams stärken
Für Einzelhändler ist Verfügbarkeit Geld und Probleme können kosten Tausende von Dollar pro Minute . Bei einer Infrastruktur, die aus komplexen Diensten wie Zahlungsgateways, Lagerbeständen und mobilen Anwendungen besteht, ist die Weiterentwicklung digitaler Abläufe von entscheidender Bedeutung, um sicherzustellen, dass die Dienste immer verfügbar sind und die Kunden das optimale Erlebnis erhalten.
Auf unserem Summit 2021 treffen sich Vertreter von Einzelhändlern Hudson's Bay Company , Bunnings , Und Loblaw diskutierten, wie PagerDuty ihnen hilft, Teams zu stärken, Transparenz zu erreichen und Probleme proaktiv zu lösen.
Verbesserung der Produktivität und Mitarbeiterzufriedenheit durch Geräuschunterdrückung
Kanadische Einzelhandelsgruppe Hudson's Bay Company verwendet PagerDuty für eine durchgängige Reaktion auf Vorfälle bei seinen 100 Diensten.
Das Unternehmen stellte fest, dass seine Teams zu viele Warnmeldungen erhielten. Ohne eine Priorisierung wurden die Mitarbeiter oft nachts durch unnötige Warnmeldungen geweckt. Um diese Warnmeldungsmüdigkeit zu reduzieren, mussten zunächst Daten gesammelt werden. Das Unternehmen rief den Warnmeldungsverlauf eines Jahres von PagerDuty ab und ermittelte, welche Dienste am meisten Lärm verursachten. Wie sich herausstellte, erzeugten die vier wichtigsten Warnmeldungsdienste 80 % der Warnmeldungen. Als Nächstes traf sich das Team mit den Dienstinhabern, um Strategien für das Warnmeldungsmanagement zu entwickeln. Dies geschah auf vier Arten:
- Priorisieren Sie Warnungen: Dienstbesitzer ordneten Vorfällen, die bestätigt werden mussten, die Prioritätsstufe P1 oder P2 zu und versendeten weniger dringende P3- oder P4-Warnmeldungen per E-Mail und über andere, weniger störende Kanäle.
- Geben Sie Warnungen statt Alarme aus: Die Teams ersetzten Warnungen mit sehr niedriger Priorität (wie etwa Serverspeicher- oder CPU-Auslastung) durch Soft-Warnungen.
- Gruppieren Sie Warnungen nach Zeit oder Typ: Bei lauteren Diensten entschieden die Dienstbesitzer, wie viele Alarme erforderlich waren, bevor sie über die PagerDuty Plattform eine Benachrichtigung ausgaben.
- Taxonomie verbessern: Durch die Standardisierung der Vorfallsprache reduzierte das Unternehmen Verwirrung und verbesserte die teamübergreifende Zusammenarbeit.
Im Laufe des sechsmonatigen Projekts konnte Hudson's Bay alle Alarme um 61 % reduzieren, also insgesamt rund 8.000. Die vier wichtigsten Dienste reduzierten die Alarme um 76 % oder rund 5.500. Die mittlere Zeit bis zur Bestätigung (MTTA) verbesserte sich um 38 %, wobei die meisten Vorfälle innerhalb von drei bis vier Minuten bestätigt wurden. Die Teams waren mit den Ergebnissen sehr zufrieden und das Unternehmen überprüft seine Daten regelmäßig, um neue Verbesserungsmöglichkeiten zu finden.
Transformation der Reaktion auf Vorfälle
Australische Baumarktkette Bunnings wollte seine E-Commerce-Funktion intern abwickeln und benötigte eine digitale Betriebsmanagementplattform, um seine Ziele zu unterstützen. Wie viele Einzelhändler verfügte es über ein komplexes und vernetztes Technologie-Ökosystem, das Bestandslösungen, Website-Authentifizierungs- und Autorisierungstools sowie Preisplattformen umfasste.
Das Projekt bot die Möglichkeit, auf alternative Technologien umzusteigen, und Bunnings wollte ein System, mit dem sich neue Anwendungen problemlos integrieren ließen. Bunnings bemerkte außerdem einen deutlichen Anstieg der Vorfälle während Marketingkampagnen oder nach Preisänderungen und suchte nach einer Möglichkeit, seinen Vorfallreaktionsprozess zu skalieren. Das Unternehmen wandte sich an PagerDuty , um Hilfe zu erhalten.
Mithilfe des intelligenten Ereignismanagements von PagerDuty konnte Bunnings seinen Vorfallmanagementprozess schnell erheblich verbessern. Es ordnete Warnmeldungen Prioritäten zu, wodurch die Anzahl der Warnmeldungen sofort reduziert wurde, und verbesserte die Zusammenarbeit und Kommunikation im Team durch die Synchronisierung von Notizen zwischen Vorfällen. Dank PagerDuty konnte Bunnings außerdem Bereitschaftsrotationen und Eskalationsrichtlinien verbessern und komplexe Probleme schneller lösen. Beispielsweise half PagerDuty dem Team, Probleme zu korrelieren, die voneinander abhängige Anwendungen wie Standortsuche, Kasse und Preisgestaltung betrafen.
Mit PagerDuty verfügt Bunnings nun über vollständige Systemtransparenz und einen effizienten Incident-Response-Prozess, der es ermöglicht, MTTA und mittlere Lösungszeit (MTTR) genau zu messen und sicherzustellen, dass Warnmeldungen die richtigen Teams erreichen. Ingenieure können die Verantwortung dafür übernehmen, Datenbanken mit technischen Serviceinformationen auf dem neuesten Stand zu halten. Diese Informationen helfen dem Geschäfts- und Supportteam, die Auswirkungen eines Problems genau zu bestimmen.
Optimieren Sie das Kundenerlebnis mit Echtzeit-Operationen
Die Pandemie hat den Einzelhandel stärker unter Druck gesetzt als je zuvor, da der Kundenverkehr in stationären Geschäften auf Online-Shopping umgestiegen ist. Angesichts dieser erhöhten Belastung standen viele Einzelhändler vor beispiellosen Herausforderungen, die Verfügbarkeit aller Plattformen sicherzustellen. Wie unsere Summit-Referenten gezeigt haben, kann die Zusammenarbeit mit PagerDuty dazu beitragen, Probleme proaktiv zu lösen, um das Endergebnis zu schützen und sicherzustellen, dass E-Commerce-Dienste immer verfügbar sind.
Befähigung von Teams durch eigenverantwortliches Engineering
Loblaw ist eine kanadische Supermarkt- und Apothekenkette mit mehr als 2.400 Filialen im ganzen Land. Seit dem Start des E-Commerce-Geschäfts im Jahr 2012 hat der Entwicklungszweig Loblaw Digital schrittweise auf ein Full-Service-Eigentumsmodell [MA1] umgestellt. Der Einzelhändler arbeitet mit PagerDuty zusammen, um seine Vorfallmanagementprozesse neu zu definieren.
Zuvor verließen sich Loblaws Entwicklungsteams auf zentralisiertes Änderungsmanagement und Reaktionsorchestrierung. Als das E-Commerce-Geschäft skalierte und die Teams wuchsen, wurde klar, dass dieser Ansatz ineffizient und nicht nachhaltig war. Wenn ein Team beispielsweise eine Bereitstellung durchführen wollte, musste es Tage im Voraus eine Anfrage einreichen und war einem langwierigen Genehmigungsprozess unterworfen. Ebenso gingen Vorfallwarnungen an alle Teams, was zu einem Alarmchaos führte. Um intelligenter arbeiten zu können, musste Loblaw Digital eigenständig werden.
Der Wechsel zu einem Full-Service-Ownership-Modell hat sowohl die Prozesse des Vorfallmanagements als auch des Änderungsmanagements radikal verändert. Mithilfe von PagerDuty konnten Teams nun ihre eigenen Vorfälle schnell lösen und Kollegen auf dem Laufenden halten, ohne dass lange Gruppengespräche nötig waren. Die Teams hatten außerdem die Flexibilität, den ganzen Tag über Einsätze durchzuführen, ohne sich um eine komplexe Genehmigungskette kümmern zu müssen.
Als die Pandemie 2020 ausbrach, verzeichnete Loblaw eine Verzehnfachung des Online-Verkehrs und die Zahl der Vorfälle ging durch die Decke. Loblaw Digital ist davon überzeugt, dass sein eigenständiger Ansatz es den Teams ermöglichte, angesichts veränderter Umstände widerstandsfähiger und flexibler zu sein. Die Zusammenarbeit mit PagerDuty zur Stärkung der Teams, Stabilisierung der Systeme, Verwaltung von Warnmeldungen und Festlegung von Bereitschaftsrotationen und Eskalationsrichtlinien versetzt sie in eine ideale Position, um die Belastung zu bewältigen.