Der Blog

Beschleunigung der Vorfallreaktion durch Runbook-Automatisierung

von PagerDuty 10. August 2021 | 4 Minuten Lesezeit

Die globale Pandemie ist geschätzt die digitale Transformation um mindestens sieben Jahre beschleunigt zu haben – und es gibt keine Anzeichen für ein Ende. Tatsächlich investieren Unternehmen sogar noch mehr in softwaregesteuerte Erfahrungen. Eine aktuelle Gartner Vorhersage weist darauf hin, dass die weltweiten IT-Ausgaben im Jahr 2021 um 8,4 % auf 4,1 Billionen US-Dollar steigen werden, wobei ein Großteil dieser Ausgaben für unternehmenskritische, kundenorientierte Dienste bestimmt ist.

Die wichtigste Erkenntnis ist, dass Online-Umsatz und Wettbewerb nie größer waren und die digitalen Dienste eines Unternehmens rund um die Uhr verfügbar sein müssen. Erfahrung ist alles und Verfügbarkeit ist Geld. Digitale Vorfälle sind jedoch unvermeidlich. Daher wird die Schnelligkeit, mit der Unternehmen ein Problem beheben und die Auswirkungen auf das Endergebnis und das Kundenerlebnis minimieren können, zum entscheidenden Differenzierungsmerkmal.

Heute sind viele ITOps- und DevOps-Teams immer noch auf manuelle und reaktive Prozesse zur Reaktion auf Vorfälle . Da IT-Umgebungen jedoch immer komplexer werden, ist dieser Ansatz nicht mehr tragfähig. Teams müssen eine Möglichkeit finden, die Reaktion auf Vorfälle zu optimieren und die Dienste ständig verfügbar zu halten, und das gelingt ihnen durch Automatisierung.

Ein moderner Ansatz zur Reaktion auf Vorfälle

Wenn man sich auf manuelle und reaktive Reaktion auf Vorfälle verlässt, erhöht sich die mittlere Zeit bis zur Erkennung und Lösung (MTTA/MTTR) und es werden wertvolle Arbeitsstunden verschwendet. In der Vergangenheit wurde das Problem mit mehr Einsatzkräften angegangen, was oft dazu führte, dass Dutzende, wenn nicht Hunderte von Teammitgliedern an einer gemeinsamen Telefonkonferenz teilnahmen. Dies liegt daran, dass die Einsatzkräfte nicht mit den Informationen ausgestattet sind, die sie zum Handeln im Falle eines Vorfalls benötigen. Sie müssen in der Lage sein, eine Reihe von Fragen schnell zu beantworten, um einem Vorfall auf den Grund zu gehen und ihn zu beheben. Fragen wie: Was hat sich in der Umgebung geändert? Wem gehört dieser Dienst? Und welche Signale enthalten die Hinweise?

In jeder Organisation gibt es Tools, Skripte und manuelle Befehle, die Teams verwenden, um diese Fragen zu beantworten. Diese Workflows existieren jedoch oft nur in den Köpfen einiger Fachexperten oder erfordern manuelle Eingriffe zur Ausführung. Auch wenn IT-Service-Management-Lösungen (ITSM) eine Rolle bei der Verwaltung nicht dringender, in die Warteschlange gestellter Arbeiten gespielt haben, sind diese Tools nicht für die dringende Echtzeitarbeit einer ständig verfügbaren Welt ausgelegt.

Diese traditionellen Ansätze sind repräsentativ für Organisationen, deren Ansatz für digitale Abläufe noch nicht ausgereift ist. Die gute Nachricht für Führungskräfte, die mit dem Schutz von Erfahrungen und dem Endergebnis betraut sind, ist, dass es eine Möglichkeit gibt, die Erzählung zu ändern und Beschleunigung der operativen Reife : Runbook-Automatisierung.

Der Weg zu kürzeren Vorfällen und weniger Eskalationen

Bei der Runbook-Automatisierung werden alle oben genannten Skripte, Tools, API-Aufrufe oder manuellen Verfahren in Runbooks dokumentiert. Dies sind die Methoden, die Teams verwenden, um sich wiederholende Aufgaben zu erledigen und Vorfälle zu lösen – beispielsweise Server neu zu starten, Artefakte zu kopieren, Dateien zu bearbeiten usw. Runbook-Automatisierung standardisiert die Reaktion auf Vorfälle, indem diese Methoden erfasst und automatisiert werden und ihre Delegierung und Ausführung durch jeden ermöglicht wird.

Mit Runbook Automation können Einsatzkräfte automatisierte Workflows für Diagnose- und Behebungsmaßnahmen ausführen. Durch die direkte Lösung bekannter Probleme reduzieren sie die Anzahl der eskalierten Vorfälle und beschleunigen die Lösung erheblich. Um diese Vorteile zu realisieren und von einem reaktiven zu einem präventiven Ansatz zu gelangen, sind jedoch ein kultureller und plattformbezogener Wandel erforderlich. Wie das Bild (Abb. 1) zeigt, ist das Erreichen der Reife digitaler Abläufe, um Runbook Automation zu ermöglichen, eine mehrstufige Entwicklung.

Abb. 1

Um sich erfolgreich weiterzuentwickeln, sollten Unternehmen klein anfangen, damit sie die Automatisierungskapazitäten verbessern können, während sie lernen und mehr Vorteile erzielen. Dies erfordert einen progressiven „Kriech-, Geh-, Lauf“-Ansatz (Abb. 2).

  • Kriechen : Automatisieren Sie einfache, einstufige Aktionen, die keinen Einfluss auf die Leistung oder Verfügbarkeit des Dienstes haben und nur wenig Verarbeitung erfordern.
  • Gehen : Automatisieren Sie mehrstufige Sequenzen, die tiefergehende Diagnosen ermöglichen und viele häufige oder sogar wiederkehrende Probleme beheben.
  • Laufen : Automatisieren Sie komplexe Aktionen, die die Leistung oder Verfügbarkeit erheblich beeinträchtigen können und normalerweise für viele Schritte privilegierten Zugriff zwischen mehreren Systemen erfordern.

Abb. 2

Wir unterstützen Organisationen auf diesem Weg mit unseren Rundeck von PagerDuty Lösung. Rundeck erweitert die bestehende Reaktion auf Vorfälle mit Runbook Automation. Es macht vorhandene Automatisierung, Skripte und Befehle sicherer, überprüfbarer und einfacher auszuführen. Mit Rundeck als zentralem Hub, der über PagerDuty ausgeführt wird, können Tools und Infrastruktur verbunden und Aufgaben, die zur Lösung von Vorfällen erforderlich sind, sicher per Selfservice an die Einsatzkräfte delegiert werden.

Die vereinte Leistung von Rundeck und PagerDuty

Die gemeinsame Nutzung von Rundeck und PagerDuty bietet Unternehmen eine leistungsstarke Möglichkeit, MTTA und MTTR weiter zu verbessern, den Umsatz zu sichern, die betriebliche Produktivität zu steigern und Burnout zu reduzieren. Die kombinierte Leistung der beiden ermöglicht die Lösung von Vorfällen innerhalb von Minuten (Abb. 3). Wenn Sie mehr darüber erfahren möchten, wie Sie mit Runbook Automation beginnen können, laden Sie unser neues eBook herunter Hier .

Abb. 3.

Um mehr über Rundeck von PagerDuty zu erfahren und eine Demo zu vereinbaren, besuchen Sie: https://www.rundeck.com/see-demo .