PagerDuty image

Ecobee verbessert Teamgesundheit und Produktivität mit PagerDuty

PagerDuty image

Größe: 101–500 Mitarbeiter

Industrie: Technologie

Standort: Toronto, Ontario

Kunde seit: 2016

Wichtige Integrationen:

Terraform

ecobee, ein 2007 gegründetes kanadisches Unternehmen für Hausautomation, entwickelt WLAN-fähige Thermostate für private und gewerbliche Anwendungen. Diese helfen Nutzern, den Komfort zu maximieren, ihren CO₂-Fußabdruck zu reduzieren und Kosten zu sparen. Hinter diesem benutzerfreundlichen Produkt verbergen sich der kontinuierliche Einsatz geschäftskritischer Anwendungen und Dienste, eine regional verteilte Infrastruktur sowie selbstheilende Servercluster, die die Verfügbarkeit der Dienste für die weltweite Kundschaft gewährleisten.

Jordan Christensen, VP of Technology bei ecobee, verantwortet die Plattforminfrastruktur des Unternehmens, einschließlich Automatisierung, Selbstheilung sowie durchgängiger Servicebereitstellung und -verfügbarkeit. „Die übergeordnete Mission meines Teams ist der Aufbau einer zuverlässigen, fehlertoleranten Infrastruktur, und PagerDuty ist die entscheidende Plattform, mit der wir diese Zuverlässigkeit messen und überwachen“, erklärte er.

Herausforderungen

Da das Hauptprodukt von ecobee für die Temperaturregelung in Millionen von Wohn- und Geschäftsgebäuden verantwortlich ist, müssen die zugehörigen Dienste stets online und für die Nutzer verfügbar sein. Schon eine kleine Störung oder ein Anwendungsausfall kann zu Umsatzeinbußen führen – daher zählt jede Minute, um potenzielle Vorfälle frühzeitig zu erkennen und darauf zu reagieren, bevor sie Kunden beeinträchtigen.

Um seinen Nutzern das bestmögliche Kundenerlebnis zu bieten, musste ecobee das Störungsmanagement proaktiv und präventiv angehen. Dazu benötigten die Entwicklungsteams eine Plattform, die Echtzeit-Transparenz über die gesamte Infrastruktur und die Dienste von ecobee ermöglichte.

Infrastruktur als Code mit Terraform

Jordans Plattformteam stützt sich stark auf PagerDutys Terraform-Integration Um ihre PagerDuty Instanz als Code in die übergeordnete Infrastruktur zu integrieren, können Teams durch die Einbindung von PagerDuty in Terraform den Echtzeitzustand ihrer Infrastruktur besser verstehen und volle Transparenz über Bereitschaftsdienste und -pläne erhalten, da alles als Code innerhalb der Terraform-Umgebung definiert ist.

Diese Technik ermöglichte es den Teams, den manuellen Aufwand für das Bereitschaftsmanagement zu reduzieren und die Verwaltung von Bereitschaftsrotationen und -plänen für verschiedene Anwendungen und Dienste zu automatisieren. „Da PagerDuty als Code in die Infrastruktur integriert ist und nicht als separate Schnittstelle dient, ist es ein zentraler Bestandteil der Infrastruktur und kein separater Zusatzdienst“, erklärte Jordan. Diese verbesserte Transparenz und die Möglichkeit, den Code innerhalb der ecobee-Codebasis zu bearbeiten, versetzen seine Teams in die Lage, den Zustand der Infrastruktur im Falle von Störungen besser zu verstehen. Mithilfe dieser Integration arbeitet das ecobee-Team schrittweise an einer Verfügbarkeit von 99,999 % (vier Neunen).

Die Vorteile von PagerDuty

Mit PagerDuty kann ecobee Störungen proaktiv und kollaborativ bearbeiten und ist stets über den jeweiligen Kontext informiert. „Die Erkenntnisse sind präzise und spezifisch, nicht allgemein gehalten“, erinnert sich Jordan. Die zentrale Erfassung aller Signale von Containern, Servern, Anwendungen und Microservices in PagerDuty erleichtert es seinen Teams, Probleme zu diagnostizieren und automatisch die richtigen Ansprechpartner zur Behebung des Problems einzubinden, bevor es Auswirkungen auf den Kunden hat.

Jordans Team hat von PagerDuty mehrere Vorteile profitiert, darunter:

  • Verbesserte Transparenz und Kommunikation zwischen den Engineering-Teams und anderen wichtigen Stakeholdern während des gesamten Incident-Management-Lebenszyklus
  • Ein automatisierter Antwortprozess, der den manuellen Aufwand reduziert und die Produktivität sowie die Work-Life-Balance verbessert.
  • Teams, die durch die Praxis von Verantwortlichkeit und umfassender Eigenverantwortung befähigt werden, positive Veränderungen herbeizuführen.
  • Die Schaffung eines sicheren Umfelds, in dem Nachwuchsingenieure Vorfälle eskalieren und direkt mit erfahrenen Ingenieuren zusammenarbeiten können, wenn sie Unterstützung benötigen, trägt zu einer verbesserten Teamgesundheit bei.

Starker Fokus auf die Gesundheit des Teams

Durch die flächendeckende Einführung von PagerDuty in der gesamten Entwicklungsabteilung – sowie in anderen wichtigen Geschäftsbereichen und bei relevanten Stakeholdern – konnte die Führungsebene laut Jordan den Fokus verstärkt auf das Wohlbefinden der Teams, die Work-Life-Balance und die Förderung junger Entwickler legen. „Mit PagerDuty fühlen sich die Mitarbeiter im Bereitschaftsdienst sicher, da sie wissen, dass sie Probleme an erfahrenere Entwickler eskalieren können, um Unterstützung zu erhalten und gemeinsam eine Lösung zu finden“, erklärte Jordan. Kleinere Vorfälle entwickeln sich oft zu Lernmöglichkeiten, was die Motivation und das Wohlbefinden der Teams im gesamten Unternehmen stärkt.

„Ohne PagerDuty wäre es für unser Unternehmen extrem schwierig, ein angemessenes Vorfallmanagement und eine adäquate Reaktion durchzuführen.“

Jordan Christensen , Vizepräsident für Technologie

Die Zukunft von PagerDuty mit ecobee

Ecobee plant, die Nutzung und den Ausbau von PagerDuty im gesamten Unternehmen fortzusetzen. Insbesondere die Entwicklungsteams möchten lernen, PagerDuty besser zu nutzen. PagerDuty Moderne Einsatzreaktion So können sie Reaktionsabläufe für bestimmte Dienste implementieren und bestimmte Aufgaben innerhalb einer Reaktionsmaßnahme automatisieren. Die Teams planen außerdem, die Slack-Integration von PagerDuty zu nutzen, um die Kommunikation zu zentralisieren und die Zusammenarbeit zwischen den Teams bei größeren Vorfällen zu verbessern.

Darüber hinaus möchte ecobee die Nachbearbeitung von Vorfällen in seiner PagerDuty Instanz formalisieren, um den gesamten Vorfalllebenszyklus auf einer zentralen Plattform abzubilden. Jordans Team möchte außerdem das volle Potenzial der PagerDuty REST-API ausschöpfen, um die Automatisierung zu fördern und die betriebliche Effizienz im gesamten Unternehmen zu steigern. „Wir haben das Potenzial von PagerDuty noch lange nicht ausgeschöpft“, erklärte Jordan.

Möchten Sie mehr darüber erfahren, wie PagerDuty die Gesundheit und das Vorfallmanagement Ihres Teams verbessern kann? Melden Sie sich für einen Heute zwei Wochen kostenlos testen !