Der Blog

5 Anzeichen dafür, dass Sie Ihren IT-Bereitschaftsplan ändern müssen

von Vivian Au 31. Oktober 2013 | 4 Minuten Lesezeit

on call rotation Da unsere Erster Best Practices-Beitrag zum Bereitschaftsdienst Im März 2011 blieben die Methoden der Bereitschaftsplanung weitgehend unverändert. Viele Teams beginnen damit, E-Mail-Benachrichtigungen an das gesamte Team zu senden, bevor sich jemand freiwillig meldet, um den Vorfall zu beheben. Bei diesem Modell bearbeiten einige hochmotivierte Teammitglieder einen unverhältnismäßig großen Teil der Vorfälle, während neue Mitarbeiter keine Gelegenheit haben, zu lernen, wie sie diese beheben können.

Das Schlimmste daran ist, dass jeder ständig in Bereitschaft ist. Wenn Ihr Team wächst und die Verantwortlichkeiten aufgeteilt werden, ist ein Bereitschaftsrotationssystem erforderlich. Die Implementierung ist jedoch nicht einfach: Ihre Teammitglieder sind möglicherweise in verschiedenen Städten stationiert, die Dienstpläne ändern sich, und jeder Ingenieur hat seine eigene bevorzugte Benachrichtigungsmethode. Sie benötigen ein System, das flexibel genug ist, um diese Probleme zu lösen, und robust genug, um zuverlässig zu funktionieren.

Der aktuelle Stand der Bereitschaftsplanung

Heutzutage nutzen Unternehmen verschiedene Methoden zur Bereitschaftsplanung. Manche sind ausgefeilter als andere, doch jede hat ihre eigenen Einschränkungen.

1. Ungerechte Belastung durch Bereitschaftsdienste

Eine einfache und gängige Bereitschaftslösung ist die Verwendung eines einzelnen Telefons oder Pagers, der an den nächsten Bereitschaftstechniker weitergegeben wird. Obwohl dies veraltet klingen mag, haben viele Organisationen, mit denen wir gesprochen haben, diese Methode bereits eingesetzt. Wenn Ihr Team über verschiedene Städte verteilt ist, können einige Mitglieder nicht teilnehmen, wenn sie sich außerhalb der Reichweite befinden. Dies stellt eine ungerechtfertigte Belastung für einige Ihrer Teamkollegen dar.

2. Verzögerte Reaktionszeit

Eine weitere einfache, aber arbeitsintensive Möglichkeit ist die Besetzung eines rund um die Uhr besetzten Network Operations Centers (NOC). Dabei werden Mitarbeiter bezahlt, die rund um die Uhr die Messdaten überwachen und Probleme selbst identifizieren. Tritt ein Problem auf, müssen sie die entsprechenden Kontakte in einem Verzeichnis suchen und das Bereitschaftspersonal benachrichtigen, um die Situation zu lösen. Es wäre für Ihr NOC-Team deutlich einfacher, ein Bereitschaftssystem zentral zu verwalten, das die richtige Bereitschaftsperson direkt benachrichtigt und so die durchschnittliche Reaktionszeit verkürzt.

3. Alarmmüdigkeit

Manche Unternehmen vereinfachen es und verschicken E-Mail-Rundschreiben an ihr gesamtes Team. In diesem Modell ist das Team, das Bereitschaftsdienst hat, rund um die Uhr für die Überwachung seiner E-Mails verantwortlich; alle anderen auf der E-Mail-Liste müssen die Benachrichtigungen manuell löschen. Dies erzeugt Spam und verringert das Gefühl der Dringlichkeit beim Empfang von Benachrichtigungen.

4. Warnungen gehen verloren

Eine anspruchsvollere Option ist die Automatisierung der E-Mail-Adresse für Warnmeldungen in Ihrem Überwachungstool. Sie könnten beispielsweise den Bereitschaftsplan in Google Kalender einrichten und ein Skript verwenden, das den Kalender abfragt. Das Skript ruft die E-Mail-Adresse des Bereitschaftspersonals ab und aktualisiert das Überwachungstool bei Änderungen. Diese Lösung unterstützt jedoch nur die einstufige Bereitschaftsplanung. Eskalationsszenarien, bei denen der erste Alarm vom Haupttechniker übersehen wird und der zweite Bereitschaftsmitarbeiter benachrichtigt werden muss, sind nicht möglich.

5. Keine zentrale Quelle für Bereitschaftspläne

Einige Überwachungstools unterstützen die Bereitschaftsplanung nativ über CSV-Uploads, allerdings mit eingeschränkter Flexibilität. Oftmals sind Ihre Auswahlmöglichkeiten auf tägliche (im Gegensatz zu stündlichen) Rotationen oder einfache Zeitpläne beschränkt. Komplexere Bereitschaftsplanungen, wie z. B. Follow-the-Sun-Pläne, sind nicht möglich. Viele Unternehmen nutzen mehrere Überwachungstools für ihre Website, Server, Datenbanken usw. Die Einrichtung und Verwaltung mehrerer Überwachungstools nur für die Bereitschaftsplanung ist mühsam.

Wenn Sie unter einem der oben genannten Probleme leiden, brauchen Sie dringend eine Lösung. Es ist an der Zeit, sich an ein Incident Management-Tool zu wenden, um Ihre Probleme mit der Bereitschaftsplanung zu lindern und Ihre psychische Gesundheit zu erhalten. Seien Sie nicht schüchtern, wenn Sie diese Beschwerden spüren. Wir haben diese Symptome selbst erlebt und deshalb die PagerDuty Heilung.