- PagerDuty /
- Der Blog /
- Best Practices und Einblicke /
- Erreichen Sie eine bessere Verantwortlichkeit durch Full-Service-Eigentum
Der Blog
Erreichen Sie eine bessere Verantwortlichkeit durch Full-Service-Eigentum
Softwareteams, die bessere Produkte und Services anbieten möchten, müssen auf schnellere Release-Zyklen setzen. Der Betrieb zuverlässiger Systeme mit immer höheren Geschwindigkeiten stellt jedoch eine große Herausforderung dar. Softwareteams können Qualität und Geschwindigkeit gewährleisten, indem sie die Richtlinien für die fortlaufende Serviceverantwortung anpassen. Bereitschaftsdienste spielen in diesem Modell zwar eine große Rolle, doch Wissenserweiterung, robusterer Code, verstärkte Zusammenarbeit und Übung sorgen auch dafür, dass Ingenieure nicht mit einem Albtraum aufwachen müssen.
In diesem Blog werde ich mich mit den Konzepten von Full-Service-Eigentum , psychologische Sicherheit bei der Transformation, die Ethik der Rechenschaftspflicht und die Auswirkungen von Eigentum auf das Kundenerlebnis.
Was ist Full-Service-Eigentum?
Full-Service-Ownership ist die Philosophie, dass Ingenieure für den Code und die Services verantwortlich sind, die sie in der Produktion erstellen. Diese „Code it, ship it, own it“-Mentalität bedeutet, die DevOps-Prinzip keinen Code mehr über die Mauer in den Betrieb zu werfen oder sich auf die Site Reliability Engineering (SRE)-Team um die Zuverlässigkeit der Dienste in der Praxis sicherzustellen. Stattdessen sind Verantwortlichkeit, Zuverlässigkeit und kontinuierliche Verbesserung die Hauptziele des Full-Service-Eigentums.
Warum Verantwortlichkeit wichtig ist
Wenn Ingenieure für ihre eigenen Entwicklungen auf Abruf bereitstehen, liegt die Verantwortung direkt bei ihnen bzw. ihrem Team. Das ist wichtig, denn die digitale Transformation hat die Arbeitsweise der Menschen und das Konsumverhalten der Verbraucher verändert. Verbraucher erwarten implizit, dass die Dienste funktionieren.
Wenn ich beispielsweise versuche, einen Online-Einkauf zu tätigen (in der Regel immer über mein Mobilgerät), erwarte ich ein nahtloses, sicheres und effizientes Erlebnis. Wenn ich unterbrochen werde, weil eine Seite nicht lädt oder einen Fehler ausgibt, wechsle ich einfach zu einem anderen Unternehmen, das meine Anfrage erfüllen kann. Laut der PagerDuty -Bericht zum Stand der digitalen Operationen 2017 in Großbritannien , 81,2 % der Verbraucher werden dasselbe Verhalten zeigen.

Ingenieure stärken Die Verantwortung für den gesamten Lebenszyklus ihres Codes und ihrer Services zu übernehmen, verschafft Unternehmen einen Wettbewerbsvorteil. Neben dem Unternehmen profitiert auch der Entwickler von der vollständigen Serviceverantwortung, da diese Verantwortung qualitativ hochwertige Arbeit gewährleistet und ihm einen direkten Einblick in die tatsächliche Leistung des Codes/Services und die Auswirkungen auf den Alltag der Kunden gibt.
Zuverlässigkeit – über KMU hinaus
Serviceausfälle sind unvermeidlich. Unternehmen können Ausfallzeiten und Kundenbeeinträchtigungen jedoch reduzieren, indem sie umgehend einen Fachexperten (Subject Matter Expert, SME) in den Vorfall einbeziehen. Der SME ist der Entwickler, der den Code/Service erstellt hat und über das nötige technische Wissen verfügt, um auf Vorfälle zu reagieren und Korrekturmaßnahmen zu ergreifen, um durch kontinuierliche Verbesserung für weniger Serviceunterbrechungen zu sorgen. Als Verantwortliche sind die Entwickler dazu angehalten, möglichst fehlerfreien Code zu automatisieren, zu testen und zu erstellen.
Darüber hinaus verzeichnen Teams, die die volle Serviceverantwortung übernehmen, einen Zuwachs an Gesamtwissen. Durch Praktiken wie Bereitschaftsübergaben, Code-Reviews, tägliche Stand-ups und Misserfolg am Freitag Durch Übungen entwickeln einzelne Ingenieure umfassenderes Fachwissen über die gesamte Codebasis. Zu den neuen Fähigkeiten gehören auch Systemdenken, Zusammenarbeit und das Arbeiten in nicht isolierten Umgebungen. Teams und Einzelpersonen bauen durch den Austausch von Informationen die notwendige Redundanz an Fähigkeiten und Wissen auf.
Kontinuierliche Verbesserung
Da Ingenieure bestrebt sind, ihre Produkte, ihren Code und/oder ihre Services kontinuierlich zu verbessern, ist ein Nebeneffekt der vollständigen Serviceverantwortung die Verbesserung sowohl der Services als auch der Warnmeldungen. Warnmeldungen, die die Arbeitszeit unterbrechen, müssen umsetzbar sein. Wenn Teammitglieder wiederholt durch nicht umsetzbare Warnmeldungen unterbrochen werden, besteht die Möglichkeit, das System durch die Analyse der Daten zu verbessern.
Die Bereinigung des Überwachungssystems ist zeitaufwändig. Durch die Einführung von Warnmeldungen wird jedoch die Bereitschaft für alle Teammitglieder verbessert und die Alarmmüdigkeit , wodurch geistige Energie frei wird, um sich auf zukünftige Releases und Automatisierung zu konzentrieren. Entwickler, die den Code geschrieben und die Warnmeldungen dafür definiert haben, erstellen eher umsetzbare Warnmeldungen, da sie sonst nachts geweckt werden. Neben umsetzbaren Warnmeldungen werden Ingenieure dazu motiviert, Code von höchster Qualität zu produzieren, da besserer Code weniger Unterbrechungen bedeutet.
Darüber hinaus ist Bereitschaft nicht als Dauereinsatz gedacht und die vollständige Verantwortung für den Service ermutigt die Teams, Zeit für „Ruhepausen“ einzuplanen.
Stellen Sie sich vor, Sie arbeiten im Operations-Team und sichten einen Vorfall – Zeit ist entscheidend, und Sie benötigen schnell Antworten. Gehen Sie sorgfältig eine Liste aller für diesen Service zuständigen Teammitglieder durch? Oder rufen Sie den KMU an, von dem Sie wissen, dass er sonntags immer ans Telefon geht? Bei jedem Vorfall dieselbe Person anzurufen, belastet eine Person unnötig und kann zu einer einzigen Fehlerquelle führen, die schließlich zum Burnout führen kann. Ein Bereitschaftsdienst erfüllt daher mehrere Funktionen und unterstützt Unternehmen bei der kontinuierlichen Verbesserung:
- Ingenieure wissen, wann sie nicht dienstbereit sind. Sie wissen, dass ihr Code und ihre Dienste abgedeckt sind, sodass sie sich vollkommen entspannen können. Das reduziert das Risiko von Burnout und Mitarbeiterfluktuation.
- Die Last, der „Ansprechpartner“ für KMU zu sein, wird im Rotationsverfahren auf den Rest des Teams verteilt.
- Dienste werden zuverlässiger
- Das Wissen und die Fähigkeiten des Teams werden durch ein tieferes Verständnis der Codebasis verbessert
Indem die vollständige Serviceverantwortung über die Codierung hinausgeht und auch Versand und Eigentum einschließt, reduziert sie das mit Vorfällen verbundene Chaos, indem sie Rollen und Verantwortlichkeiten definiert, unnötige Ebenen entfernt und letztendlich eine Kultur der Ermächtigung und Rechenschaftspflicht fördert.
Wie war Ihre Erfahrung? Hat Ihnen die Bereitschaft geholfen, ein besserer Ingenieur zu werden? Hassen Sie den Gedanken, einen Pager in die Hand zu nehmen? Teilen Sie Ihre Gedanken auf unserer Community-Foren ! Schauen Sie sich unseren Leitfaden an, wenn Sie mehr erfahren möchten Best Practices für Full-Service-Eigentum .
Eine Version dieses Artikels wurde am 20. September 2019 auf www.opensource.com veröffentlicht.