- PagerDuty /
- Der Blog /
- Best Practices und Einblicke /
- Die besten Kennzahlen für den Kulturwandel in DevOps-Teams
Der Blog
Die besten Kennzahlen für den Kulturwandel in DevOps-Teams
Was ist ein datengesteuertes Team?
Jeder möchte die Leistung seines Teams optimieren, doch einen guten Plan dafür zu entwickeln, ist nicht immer einfach. Deshalb nutzen operativ ausgereifte DevOps-Teams Metriken, um wertvolle Einblicke in ihre Arbeit zu gewinnen, ihre Kapazitäten zu verbessern und den kulturellen Wandel voranzutreiben.
Gute Daten ermöglichen es Managern, schnelle Entscheidungen mit Zuversicht und minimalem Risiko zu treffen. Sie sehen die tatsächlichen (nicht wahrgenommenen) Ergebnisse dieser Entscheidungen. Das hilft ihnen, ihre zukünftige Ausrichtung zu bestimmen und für eine zufriedenere, gesündere und produktivere Teamdynamik zu sorgen. Die Umstellung auf datenbasierte Ideen erfordert jedoch mehr als nur eine verstärkte Überwachung. Sie erfordert einen Kulturwandel.
Hier skizzieren wir die wichtigsten Kennzahlen, die Sie überwachen sollten, und sprechen darüber, wie diese die Kultur und Leistung Ihres Teams beeinflussen können.
Nutzen Sie die Reaktionszeit, um eine Kultur der Höchstleistungen zu etablieren
Die Reaktionszeit (auch Zeit bis zur Bestätigung genannt) hängt maßgeblich von Ihren einzelnen Teammitgliedern ab. Incident-Responder haben zwar nicht immer die Kontrolle über die Ursache eines bestimmten Vorfalls, aber sie bestimmen stets, wie schnell sie den Vorfall bestätigen und reagieren. Machen Sie Ihre Teammitglieder für ihre Reaktionszeit verantwortlich, indem Sie interne Ziele festlegen und hohe Erwartungen wecken.
Sie können ein Reaktionszeitziel mit IT Operations Management-Software wie PagerDuty durchsetzen, indem Sie Eskalations-Timeout Wenn Sie festlegen, dass alle Vorfälle innerhalb von fünf Minuten beantwortet werden sollen, legen Sie das Timeout auf fünf Minuten fest, um sicherzustellen, dass die nächste Person benachrichtigt wird. Durch die Verfolgung Ihrer Eskalationen erhalten Sie außerdem wertvolle Daten über Ihr Team.
Erwartungen mit Eskalationen managen
Für die meisten Organisationen, die IT-Operations-Management-Software einsetzen, ist eine Eskalation eine Ausnahme – ein Zeichen dafür, dass ein Mitarbeiter nicht rechtzeitig zu einem Vorfall gelangen konnte oder ihm die nötigen Tools oder Fähigkeiten fehlten. Obwohl Eskalationsrichtlinien ein notwendiger und wertvoller Bestandteil des Vorfallmanagements sind, sollten Teams grundsätzlich versuchen, die Anzahl der Eskalationen zu reduzieren. Bewerten Sie die Leistung Ihres Teams, indem Sie die Anzahl der eskalierten Vorfälle im Laufe der Zeit verfolgen. Anhand dieser Daten können Sie feststellen, ob Ihr Ziel angepasst werden muss.
Es gibt Situationen, in denen eine Eskalation zum Standard gehört. Beispielsweise könnten Sie ein NOC, ein First-Tier-Supportteam oder sogar ein automatisches Fehlerbehebungstool einsetzen, das eingehende Vorfälle anhand ihres Inhalts sortiert oder eskaliert. In diesem Fall sollten Sie nachverfolgen, welche Arten von Warnungen eskaliert werden sollten und welche Zahlen für diese Warnungen üblich sind.
Kampfalarmmüdigkeit mit Rohdaten der Vorfallszählung
Mit dem Wachstum Ihres Unternehmens steigt auch die Anzahl der Vorfälle. Mit zunehmender Effizienz und Erfahrung Ihres Teams sollten die Vorfälle pro Responder sinken oder zumindest konstant bleiben. IT Operations Management für DevOps kann Ihrem Team helfen, schneller ans Ziel zu kommen, indem es minderwertige Warnmeldungen aussortiert, gängige Fehlerbehebungen automatisiert und Runbooks erstellt.
Dadurch wird sichergestellt, dass jedes Teammitglied seine Zeit optimal auf die Bearbeitung wichtiger Warnmeldungen und die Entwicklung neuer Funktionen für Ihr Produkt konzentriert, anstatt sich in Alarmmüdigkeit .
Die Rohanzahl der Vorfälle kann Ihnen auch dabei helfen, festzustellen, ob die Vorfalllast Ihres Teams besser oder schlechter ist als der Organisationsdurchschnitt. Wenn Sie die Anzahl der Vorfälle nach Team oder Service aufschlüsseln, können Sie Ihre Zahlen in einen Kontext setzen.
Messen Sie die Betriebsbereitschaft anhand der mittleren Zeit bis zur Problemlösung
Die Zeit bis zur Lösung ist der höchste Standard, mit dem Sie Ihr Team bewerten können. Wie lange braucht Ihr Team, um einen Vorfall zu lösen?
Jede Organisation hat einen anderen Ausgangswert für die TTR. Die Komplexität der Umgebung, die Organisation der Verantwortlichkeiten und sogar die Branche, in der sie tätig sind, können zu unterschiedlichen Standards für verschiedene Unternehmen beitragen. Ausfallzeiten sind jedoch kostspielig, sowohl in Form von Umsatzverlusten als auch von Kundenvertrauen. Daher ist es wichtig, die MTTR zu verfolgen, um sicherzustellen, dass Ihr Team den Herausforderungen eines schwerwiegenden Vorfalls insgesamt gewachsen ist.
Nutzen Sie diese Kennzahlen, um intelligente Veränderungen zu fördern
Denken Sie daran, dass Ihr Fokus auf Geschäftszielen liegt, nicht auf Zahlen. Ermutigen Sie Ihre Teammitglieder nicht, ihre Zahlen zu verbessern, ohne den Grund für die Messung dieser Kennzahlen aus den Augen zu verlieren.
Vermeiden Sie es außerdem, die Vergangenheit zu sehr zu analysieren. Kennzahlen messen, was bereits geschehen ist. Sie können zwar viel über die bisherige Leistung Ihres Teams aussagen, sollten aber als Werkzeug für eine bessere Zukunft und nicht als Mittel zur Schuldzuweisung genutzt werden.
Kennzahlen sind ein Mittel zum Zweck. Mehr Informationen als nötig helfen Ihnen nicht, Ihr Team zu verbessern und Ihr Unternehmen weiterzuentwickeln. Der Fokus auf die nächsten Schritte ist der Schlüssel, um Kennzahlen für kulturelle Veränderungen zu nutzen.
