Größe: 250+
Industrie: Technologie
Standort: Boston, MA
Kunde seit: 2/2010
Brightcove ist ein weltweit führender Anbieter von Cloud-Services für Video. Das Unternehmen bietet Produkte, die die Art und Weise, wie Organisationen Videoerlebnisse bereitstellen, revolutionieren. Dazu gehören Video Cloud, die marktführende Online-Videoplattform, und Zencoder, ein führender Anbieter von cloudbasierten Medienverarbeitungsdiensten und HTML5-Videoplayer-Technologie. Mehr als 6.300 Kunden in über 70 Ländern nutzen die Cloud-Content-Services von Brightcove, um Videoerlebnisse auf PCs, Smartphones, Tablets und Smart-TVs zu erstellen und zu betreiben.
Frühe Herausforderungen in Brightcove
Vor drei Jahren führte Brightcove ein DevOps-Modell ein, um den Entwicklern die Verantwortung für Design, Produktion und Support ihres Codes zu übertragen. Ziel von DevOps ist die schnellere Entwicklung hochwertiger Software. Die meisten DevOps-Umstellungen scheitern jedoch an fehlenden kulturellen und technologischen Anpassungen. Brightcove ging den ersten kulturellen Schritt in Richtung dieses Modells, indem die Rufbereitschaft auf die Entwickler ausgeweitet wurde. Es erschien logisch, dass diejenigen, die den Code geschrieben hatten, auch die Probleme beheben sollten. Brightcoves ausgeprägte Teamkultur ermöglichte es den Mitarbeitern, ihre Rufbereitschaft selbst zu planen. Diese Pläne erwiesen sich jedoch als schwer zu handhaben, da ständig neue Teammitglieder hinzukamen und häufige Änderungen nötig waren. Zudem lösten diese Pläne nicht das Problem des Incident-Lifecycle-Managements. Es war unklar, wer an einem Incident arbeitete und in welcher Phase er sich befand. Dies führte dazu, dass Probleme zu früh an andere Teammitglieder oder Vorgesetzte eskaliert wurden.
„Uns fehlte Transparenz hinsichtlich der Zuständigkeit für Vorfälle, was unsere Effizienz beeinträchtigte.“ – Leitender Engineering Manager
Alle Bereitschaftsingenieure erhielten Benachrichtigungen über ihre Blackberry-Geräte, die mit ihren Überwachungstools synchronisiert waren. Die Blackberrys wurden zwischen den Teammitgliedern rotiert, doch dieser Ansatz war umständlich, fehleranfällig und schränkte die Teilnahme derjenigen ein, die außerhalb der Reichweite waren. Außerdem gab es keine Möglichkeit, übersehene Probleme an andere Teammitglieder weiterzuleiten. Da die Teams auf drei globale Standorte anwuchsen, mussten sie eine faire Lösung für die Verteilung der Bereitschaftsdienste finden.
„Wir brauchten eine Lösung, die zu unserem flexiblen Arbeitsumfeld passte. Der Austausch eines physischen Geräts war nicht praktikabel.“
Brightcove musste die Logistik der Rufbereitschaft vereinfachen und die Verantwortung für die Dienstplanung direkt den diensthabenden Ingenieuren übertragen. Schließlich sollten Ingenieure, die Rufbereitschaft übernehmen müssen, auch mitbestimmen können, wann sie Dienst haben und wie sie benachrichtigt werden. Für den vollständigen Übergang zu einem DevOps-Modell benötigten sie die passende Technologie, um ihren kulturellen Wandel zu begleiten.
Kontrolle an Bereitschaftsingenieure übertragen
Für die Ingenieure von Brightcove ist eine ausgewogene Work-Life-Balance wichtig. Wenn Teammitglieder während ihrer Rufbereitschaft Urlaub nehmen möchten, suchen sie gemeinsam nach Vertretungen. Dank PagerDuty für die Rufbereitschaftsplanung lassen sich Änderungen problemlos umsetzen.
„Nachdem wir die Rufbereitschaftsdienste untereinander getauscht haben, ist es kinderleicht, die Dienstpläne in PagerDuty zu aktualisieren.“
Dank PagerDuty gehören verpasste Alarme bei Brightcove aufgrund ineffektiver Benachrichtigungen über ihre Blackberrys der Vergangenheit an. Techniker können nun selbst festlegen, wie sie benachrichtigt werden. Da einige Teammitglieder in Gebieten mit schlechtem Mobilfunkempfang leben, haben sie ihre Festnetznummer in ihre Alarmierungsrichtlinien eingebunden. Alle Bereitschaftstechniker können jetzt die für sie optimalen Alarmeinstellungen wählen. Verpasst der primäre Bereitschaftstechniker einen Alarm, wird der stellvertretende Techniker benachrichtigt. Durch die natürliche Eskalationskette fungiert PagerDuty als Sicherheitsnetz für Vorfälle bei Brightcove und stellt sicher, dass alle Probleme schnell behoben werden.
„Ich kann mir ein Leben ohne PagerDuty nicht mehr vorstellen. Mehrere Alarmierungsmethoden und Eskalationsstufen sind für mich selbstverständlich.“
Um die Transparenz von Vorfällen zu verbessern, hat Brightcove PagerDuty mit HipChat integriert. So kann jeder den Lebenszyklus eines Vorfalls verfolgen. Dadurch entfällt die hektische Suche nach dem zuständigen Mitarbeiter und dessen Status. Bei Bedarf können andere Teams Unterstützung leisten. Führungskräfte werden nicht mehr fälschlicherweise über geringfügige Probleme benachrichtigt und können bei größeren Problemen schnell hinzugezogen werden.
„Dank PagerDuty gibt es weniger Notfallübungen. Wir wissen jetzt, ob ein Vorfall bearbeitet wird und von wem. Das ist eine echte Stressreduzierung.“
Mit PagerDuty verfügt Brightcove über die Technologie, um den DevOps-Wandel zu unterstützen und seinen Kunden einen qualitativ hochwertigen und äußerst zuverlässigen Service zu bieten.