PagerDuty sorgt für bessere Sichtbarkeit der Verbrauchervergleichsseite Verivox
Größe: Mehr als 500 Mitarbeiter
Industrie: Technologie
Standort: Heidelberg, Deutschland
Kunde seit: 2018
Verivox, eines der führenden deutschen Vergleichsportale für Energie, Mobilfunk, Versicherungen und mehr, bedient über acht Millionen Verbraucher, die Preise vergleichen und ihren Anbieter wechseln möchten. Da so viele Kunden auf die korrekten Informationen von Verivox vertrauen, muss die Website stabil und zuverlässig funktionieren. Angesichts der starken Konkurrenz, 13 Entwicklungsteams, die wöchentlich neue Funktionen veröffentlichen, und der über das ganze Land verteilten Engineering-Teams benötigte das Unternehmen eine bessere Möglichkeit, seine digitalen Abläufe zu skalieren und zu automatisieren, um Ausfallzeiten zu minimieren.
In der Vergangenheit verließ sich Verivox auf sein Site Reliability Engineering (SRE)-Team, das Warnmeldungen manuell prüfte und Teams über Vorfälle informierte. Die Warnprotokolle des Unternehmens lösten jedoch regelmäßig ungültige Warnmeldungen aus, was Ressourcen verbrauchte und die Transparenz des Netzwerkzustands beeinträchtigte. Da zudem eine Person eine ganze Woche lang außerhalb der Geschäftszeiten (einschließlich Wochenenden) Rufbereitschaft hatte, riskierte Verivox sowohl eine Überlastung der Mitarbeiter als auch das mögliche Übersehen wichtiger Warnmeldungen mitten in der Nacht.
„Durch die Eliminierung manueller Eingriffe hat PagerDuty unseren Alarmierungsprozess enorm verbessert. Und wir verlieren keine Vorfälle mehr aus den Augen, die die Produktion beeinträchtigen.“
– Leiter SRE, Verivox
Von manuell zu automatisiert
Laut dem Leiter des Site Reliability Engineering war „ PagerDuty in erster Linie für die Automatisierung der Alarmierung unerlässlich.“ Da PagerDuty über 200 Integrationen bietet, konnte Verivox die PagerDuty -Plattform für digitales Betriebsmanagement problemlos mit all seinen Überwachungstools – wie New Relic, Zabbix und AWS CloudWatch – in seiner gesamten hybriden Produktionsumgebung aus Datenbanken, Cloud-Anwendungen, Windows- und Linux-Servern und mehr verbinden.
Die Automatisierung PagerDuty ermöglichte es Verivox, Bereitschaftsrollen besser zu definieren und zuzuweisen. Dadurch kann das Unternehmen Probleme sofort an die zuständigen Mitarbeiter weiterleiten, anstatt dass ein Mitarbeiter erst jemanden kontaktieren muss. Benötigt das Bereitschaftsteam zusätzliche Unterstützung, kann es per automatisiertem Ablauf die richtigen Ansprechpartner hinzuziehen. „Durch die Eliminierung manueller Interaktionen hat PagerDuty unseren Alarmierungsprozess deutlich verbessert“, sagte er. „Und wir verlieren keine produktionsrelevanten Vorfälle mehr aus den Augen.“
„Wir reagieren und beheben Vorfälle schneller als je zuvor, was angesichts unseres kurzen Entwicklungszyklus wirklich wichtig ist“, fügte er hinzu.
Die Automatisierung gleicht zudem die saisonalen Schwankungen im Arbeitsablauf von Verivox aus, indem sie den Bereitschaftsdienst standardisiert und dem Unternehmen eine bessere Kostenprognose ermöglicht. Dank PagerDuty bieten die Bereitschaftsteams nun ganzjährig die gleiche umfassende Abdeckung und gewährleisten so auch außerhalb des Spitzenquartals (4. Quartal) ein gleichbleibend hohes Kompetenzniveau.
Verbesserte Transparenz wirft Licht auf digitale Abläufe
Durch den Einsatz von PagerDuty hat Verivox nun einen besseren Überblick über Störungen. Das Team von Spitzchaks Team kann die genaue Anzahl der Störungen pro Dienst und deren Behebungsgeschwindigkeit einsehen. Die Daten helfen ihnen festzustellen, ob die Plattform ordnungsgemäß funktioniert oder ob ein bestimmter Dienst beeinträchtigt ist. Mit der umfangreichen API-Funktionalität von PagerDuty kann Verivox verschiedene Berichte und Alarmmechanismen generieren sowie automatisierte Wartungsarbeiten einrichten.
„Mit PagerDuty erhalten wir einen umfassenderen Überblick. Früher mussten wir Entscheidungen aus dem Bauch heraus treffen. Mit PagerDuty haben wir ein klareres Bild davon, was in unserer Produktionsumgebung vor sich geht“, sagte er.
Die erhöhte Transparenz hilft Verivox auch dabei, die Qualität von Überwachung und Benachrichtigungen zu verbessern. Da Verivox ungültige, veraltete Benachrichtigungen aus PagerDuty entfernt hat, ist die Überwachung nun deutlich besser als zuvor. Und weniger Benachrichtigungen bedeuten, dass Verivox weniger Vorfälle bearbeiten muss. „Früher hat unser Benachrichtigungssystem 10- bis 20-mal mehr E-Mails versendet, als der Bereitschaftsdienstmitarbeiter bearbeiten musste“, erklärte er. „Jetzt liegt das Verhältnis eher bei 1:1.“
Blick in die Zukunft
Das Unternehmen plant, PagerDuty in Kürze unternehmensweit und in den Tochtergesellschaften der Muttergesellschaft einzuführen. „Mit PagerDuty erhalten wir einen deutlich besseren Überblick über den Zustand unserer Produktionsumgebung, und wir prüfen derzeit die Möglichkeiten von PagerDuty.“ Operationskommandokonsole Und Betrieblicher Gesundheitsmanagementdienst „“, sagte er.
Verivox wählte PagerDuty ursprünglich aufgrund seiner Benachrichtigungsfunktionen, nutzt es nun aber auch zur Optimierung anderer wichtiger Aspekte seines digitalen Betriebsmanagements. Da ein optimales Kosten-Nutzen-Verhältnis für schnell wachsende Unternehmen wie Verivox entscheidend ist, um im Wettbewerb die Nase vorn zu haben, plant das Unternehmen außerdem, PagerDuty zur Definition und Messung wichtiger Leistungsindikatoren einzusetzen.
Besuchen www.pagerduty.com Für weitere Informationen zur digitalen Betriebsmanagementlösung von PagerDuty oder um Einblicke, Strategien und praktische Erfahrungen in einem unserer zahlreichen Schulungszentren zu gewinnen, besuchen Sie uns. bevorstehende Veranstaltungen Die