- PagerDuty /
- Der Blog /
- Alarmierung /
- Die menschliche Seite der Bereitschaft: 5 Lektionen zum Umgang mit Stress, Angst und dem Leben während der Bereitschaft
Der Blog
Die menschliche Seite der Bereitschaft: 5 Lektionen zum Umgang mit Stress, Angst und dem Leben während der Bereitschaft
Im DevOps-Bereich sprechen wir viel über den Bereitschaftsprozess – aber wie steht es um die menschliche Seite der Bereitschaft? Wie kann man beispielsweise Stress und Angst während einer Schicht effektiv bewältigen? Wie kann man mit Lebenssituationen umgehen, die die Bereitschaft erschweren – beispielsweise wenn man während der Bereitschaft für die Kinderbetreuung verantwortlich ist? Und wie kann eine empathische Teamkultur dazu beitragen, Burnout und Fluktuation zu verhindern?
Im November und Dezember 2021 trafen sich Bereitschaftsingenieure aus neun Teams bei PagerDuty , um über die menschliche Seite der Bereitschaft zu diskutieren. Hier sind die fünf wichtigsten Erkenntnisse aus diesen Sitzungen:
- Empathie im Team ist entscheidend
- Schauen Sie nicht den ganzen Tag auf Diagramme
- Postmortem-Analysen können stressig sein und viel Arbeit erfordern
- Warnungen mit geringer Dringlichkeit reduzieren den Lärm in der Nacht
- Wochenlange Bereitschaft kann zum Burnout führen
Bevor wir uns auf die einzelnen wichtigen Erkenntnisse konzentrieren, schauen wir uns einige Kennzahlen der Teams an, mit denen wir gesprochen haben.
In Zahlen
Hier sind die wichtigsten Datenpunkte für die Teams, die an den Sitzungen zur „menschlichen Seite der Rufbereitschaft“ teilgenommen haben:
- Wie groß ist Ihre Bereitschaftsrotation? Die durchschnittliche Bereitschaftsstärke betrug 5 Techniker.
- Haben Sie einen zweiten Bereitschaftsdienst? 60 % der Teams sagten „Ja“.
- Wie häufig haben Sie Rufbereitschaft? Die durchschnittliche Rufbereitschaftshäufigkeit betrug alle 3,5 Wochen.
- Wie lange dauert Ihre Rufbereitschaft? Die durchschnittliche Schichtlänge betrug eine Woche – mehrere Teams teilten diese auf Wochentage/Wochenenden auf.
- Wie viel Zeit verbringen Sie pro Woche in der Rufbereitschaft (Median)? Die durchschnittliche Bereitschaftszeit pro Woche betrug 4 Stunden. Bei zwei der neun Teams verbrachte der Bereitschaftstechniker die meiste Zeit seiner Arbeitszeit mit der Lösung von Bereitschaftsproblemen.
Wir haben die Bereitschaftsstunden in diesem Histogramm dargestellt. Wie Sie sehen, waren 55 % der befragten Teams 0–5 Stunden pro Woche in Bereitschaft, 22 % der Teams waren 5–10 Stunden in Bereitschaft, 11 % waren 30–35 Stunden in Bereitschaft und 11 % waren 40 Stunden in Bereitschaft:
Histogramm: Bereitschaftsstunden nach Team
Nachdem wir nun einige Einzelheiten zu unserer Fokusgruppe mitgeteilt haben, wollen wir uns nun die einzelnen Lektionen genauer ansehen.
Lektion 1: Empathie im Team ist entscheidend
Die Teamkultur ist alles: Sie bildet die Grundlage für die Schaffung eines sicheren Umfelds. Die Einführung von Normen, die (mit Worten und Taten) bekräftigen, dass es in Ordnung ist, während der Bereitschaftswoche um Überschreibungen zu bitten, ist ein entscheidender Teil der Festlegung des Tons für die Bereitschaftserfahrung Ihres Teams. Kulturelle Veränderungen passieren nicht über Nacht, aber sie können im Laufe der Zeit entwickelt und geformt werden. Während dieser kulturelle Wandel in Ihrem Team stattfindet, ist es wichtig, ihn als Teil der Teamkultur aktiv zu fördern, und zwar auf die Art und Weise, die für das Team am sinnvollsten ist. Nachdem Sie beispielsweise um eine Überschreibung gebeten haben, können Sie Ihrem Kollegen während einer Team-Retrospektive danken, um positive Verstärkung zu bewirken. Wenn Ihr Team seine Normen dokumentiert hat, können Sie auch vorschlagen, dass dort „es in Ordnung ist, um Überschreibungen zu bitten“ hinzugefügt wird. Darüber hinaus ist es als Kollege oder Manager wichtig, sich nach dem Bereitschaftstechniker zu erkundigen, insbesondere nach größeren Vorfällen. Dies gilt insbesondere, wenn es sich um den ersten größeren Vorfall einer Person handelt.
Am wichtigsten ist vielleicht, dass Team und Manager Einfühlungsvermögen in die individuelle Lebenssituation jedes Bereitschaftstechnikers zeigen müssen. Haustiere, Kinder oder ältere Eltern können die Verwaltung der Bereitschaft beispielsweise erschweren. Darüber hinaus kann ein belastendes Lebensereignis wie der Tod eines geliebten Menschen den Stress, den man während der Bereitschaft empfindet, noch verstärken. In solchen Situationen ist es wichtig, proaktiv darauf hinzuweisen, dass ein Techniker für einen besonders schwierigen Zeitraum vielleicht nicht Bereitschaft leisten sollte.
Lektion 2: Beobachten Sie nicht den ganzen Tag Diagramme
Denken Sie daran, dass Bereitschaft nicht bedeutet, dass Sie den ganzen Tag über alles im Auge behalten müssen. Sie müssen darauf vertrauen können, dass Sie per Pager benachrichtigt werden, wenn etwas schiefgeht. Sie müssen loslassen, was Sie nicht kontrollieren können, und wachsam sein, was Sie kontrollieren können. Verlassen Sie sich auf eine Team-Ops-Überprüfungssitzung, um zwischen den Schichten eine Übergabe vorzunehmen, damit Sie auf Ihre Schicht vorbereitet sind. Und denken Sie daran, dass Vorfälle mit geringer Dringlichkeit keine Push-Benachrichtigungen benötigen – Sie müssen Ihren Stresspegel deswegen nicht erhöhen.
Wenn Sie während Ihres Bereitschaftsdienstes Zeit haben, konzentrieren Sie sich darauf, die Bereitschaftssituation für den nächsten Bereitschaftstechniker zu verbessern. Wenn beispielsweise ein bestimmtes Problem immer wieder auftritt (z. B. Festplatten, die voll sind, Protokolle, die rotiert werden müssen, laute Warnungen), nehmen Sie sich eine Aufgabe vor, die das Problem langfristig behebt.
Lektion 3: Postmortem-Analysen können stressig sein und viel Arbeit erfordern
Größere Vorfälle, die eine koordinierte Reaktion mehrerer Teams erfordern, können sehr stressig sein, und die zusätzliche Arbeitsbelastung durch Post-Mortem-Analysen kann noch mehr Stress verursachen. Es ist eine Sache, den Vorfall selbst zu bewältigen, aber eine ganz andere, wenn danach noch eine weitere Woche voller Stress ansteht. Wenn die Ressourcen es zulassen, kann es hilfreich sein, eine Arbeitsvereinbarung zu treffen, damit die Post-Mortem-Analyse von jemandem durchgeführt wird, der außer der primäre Helfer bei dem Vorfall. Darüber hinaus kann es hilfreich sein, den damit verbundenen Stress anzuerkennen und nach der Lösung des Vorfalls Zeit zum Entspannen einzuräumen. Dies könnte bedeuten, dem Bereitschaftstechniker eine „Abkühlphase“ zu geben, in der er mehr Flexibilität bei seiner Arbeitszeit hat und die Möglichkeit hat, in anderen Bereichen seines Lebens aufzuholen.
Lektion 4: Warnungen mit geringer Dringlichkeit reduzieren den Lärm in der Nacht
Wenn keine unmittelbare Gefahr besteht, kann ein Alarm mit niedriger Dringlichkeit konfiguriert werden, um sicherzustellen, dass der diensthabende Techniker nicht angepiept wird, während er schläft. Damit dies effektiv funktioniert, muss das Team die Konfiguration von Alarmen mit niedriger Dringlichkeit mit der Einarbeitung von diensthabenden Technikern kombinieren, damit ihre Alarmeinstellungen sicherstellen, dass sie nicht durch Alarme mit niedriger Dringlichkeit gestört werden. Eine effektive Einarbeitung von diensthabenden Technikern sollte die Einrichtung von Benutzerbenachrichtigungseinstellungen umfassen und als Kontrollpunkt dienen, um sicherzustellen, dass die Einstellungen eines neuen Mitarbeiters korrekt sind, bevor er in PagerDuty in Rotation versetzt wird.
Lektion 5: Wochenlange Bereitschaft kann zum Burnout führen
Eine ganze Woche Bereitschaftsdienst zu leisten, kann eine mentale Belastung sein, da Sie nicht die ganze Woche über völlig arbeitsfrei sind. Dies gilt auch, wenn Sie während Ihrer Schicht nicht angepiept werden, da Sie trotzdem damit rechnen, angepiept zu werden. Die optimale Dauer des Bereitschaftsdienstes zu finden, ist schwierig – es hängt von mehreren Faktoren ab, darunter:
- Die Präferenzen der Bereitschaftsingenieure im Team. Dies kann durch eine Umfrage ermittelt werden, die an das Team gesendet wird, um ihre Gedanken zur Bereitschaftsplanung zu sammeln.
- Wie sich Bereitschaftstechniker nach ihrer Schicht fühlen. Dies kann im Laufe der Zeit anhand einer „Yelp-Bewertung“ von 1 (schlechteste) bis 5 (beste) für Bereitschaftstechniker am Ende der Schicht verfolgt werden.
- Wie laut die Dienste des Teams sind. Mehr Lärm bedeutet mehr Stress, in diesem Fall wäre eine kürzere Rufbereitschaft wünschenswert.
Anstatt einer Woche Rufbereitschaft können Sie auch Schichten an Werktagen und am Wochenende, Schichten während der Geschäftszeiten und außerhalb der Geschäftszeiten oder kürzere Schichten von zwei, zwei oder drei Tagen pro Woche in Betracht ziehen.
Best Practices für Bereitschaftsteams
Bereitschaftsdienst kann stressig sein, aber eine empathische Teamkultur und Bereitschaftsdienst-Rotationsplan die am besten zu den Vorlieben des Teams passt, trägt wesentlich dazu bei, Burnout zu reduzieren. Möchten Sie mehr über bewährte Vorgehensweisen bei der Bereitschaft erfahren und wie Sie eine empathische Teamkultur entwickeln können? Schauen Sie sich unsere Best Practices für Bereitschaftsteams Führung.
Credits
- Vielen Dank an Amy Wood, Ashwin Jiwane, Charlotte Sarfati, Chelsea Vandermeer, Hunter Watson, Japa Swadia, Katherine ChengLi, KP Singh, Liam Stewart, Marcos Wright-Kuhns, Mandi Walls, Possum Nuada, Quintessence Anx, Roma Shah, Russ Smith, Todd Whitney, Tom Graft und Vivian Chan für Ihre Beiträge zu diesen Diskussionen und Blog-Posts.