Der Blog

Demokratisieren Sie die Automatisierungsfunktionen Ihres Teams mit PagerDuty®-Automatisierungsaktionen

von Joseph Mandros 4. April 2022 | 5 Minuten Lesezeit

Seien wir ehrlich. Zwischenfälle können teuer werden— Wirklich teuer. Aber die hohen Kosten von Vorfällen in einer Produktionsumgebung sind nicht immer auf einen beeinträchtigten Service oder eine negative Kundenerfahrung zurückzuführen. Laut den Antwortdaten von PagerDuty über 50 % der Dauer eines Vorfalls verbringen die Ersthelfer in der Untersuchungs- und Mobilisierungsphase (was wir „Triage“ nennen) – mit anderen Worten: Herausfinden, was möglicherweise schiefgelaufen ist, und die richtige Person anrufen, um das Problem zu beheben.

Mit der obigen Statistik im Hinterkopf ist es klar, dass die Schattenkosten Ihres Vorfalllebenszyklus die Kosten Ihrer Mitarbeiter sind Zeit — der Techniker, der den Vorfall entdeckt hat, der Bereitschaftstechniker, der auf das Problem reagiert und die Grundursache ermittelt hat, und jeder andere Fachexperte, der in den Vorfalllebenszyklus eingebunden wird. Und wenn man dann noch manuelle Prozesse in den gesamten Reaktionszeitplan einfließen lässt, kann es teuer werden. Sehr teuer.

Tatsache ist, dass die Zeit Ihrer Entwicklerorganisation genauso wertvoll und wichtig ist wie das Endergebnis des Unternehmens. Und da die Entwicklung von Diensten und Anwendungen immer komplexer wird, wird die „gesparte Zeit“ zu einer noch wichtigeren Kennzahl, die verfolgt, quantifiziert und kontinuierlich verbessert werden muss. Wenn Sie einen Weg finden, verschiedene Aspekte des Vorfallreaktionsprozesses zu automatisieren, können Sie Ihrem Team Zeit sparen und die Effizienz auf ganzer Linie steigern. Wie können Sie das tun, fragen Sie sich? Geben Sie ein PagerDuty ® Automatisierungsaktionen (früher PagerDuty Rundeck-Aktionen) .

PagerDuty ® Automatisierungsaktionen

PagerDuty ® Das Add-on „Automation Actions“ verbindet Ihre Ersthelfer direkt in PagerDuty mit der Korrekturautomatisierung. Anstatt bei Beginn eines Vorfalls Eskalationen an Spezialisten weiterzuleiten, können die Helfer Vorfälle mithilfe einer sicher delegierten Automatisierung selbst sortieren und lösen. Dadurch verkürzen die Teams die MTTR, verringern die Unterbrechungen für Spezialisten und können Vorfälle schnell diagnostizieren und beheben.

PagerDuty ® Automatisierungsaktionen verbindet automatisierte Diagnose und Behebung mit dem Incident-Response-Workflow. Automatisierte Diagnose sind eine Reihe von Aktionen für Produktionsdienste, die Ihre Einsatzkräfte automatisch aufrufen können, wenn ein Vorfall eintritt. Anstatt den Vorfall an Experten weiterleiten zu müssen, die gängige Tests manuell durchführen, können Einsatzkräfte diese Automatisierung sicher und geschützt selbst aus PagerDuty heraus aufrufen und Antworten in Echtzeit an Ihre Vorfallzeitleiste senden sehen.

Ausführen bestimmter Aktionen wie Dienstneustarts, Diagnosen und mehr

Mithilfe dieser Diagnosetests können Einsatzkräfte den Vorfall effizienter an den richtigen Spezialisten zur Lösung weiterleiten, anstatt eine große Gruppe einzubeziehen oder die typische Einsatzleiter hinaufzustufen. Die Spezialisten können die Ergebnisse dieser allgemeinen Diagnosen sehen und sofort loslegen.

Darüber hinaus können Teams diese Aktionen auch aufrufen und gemeinsam an dem Vorfall arbeiten direkt aus ihrer Slack-Instanz . Dadurch entfällt die Notwendigkeit, über ein Terminal auf einen Dienst zuzugreifen und zwischen Fenstern zu wechseln. Dadurch können Vorfälle schneller und effizienter gelöst werden – und eskaliert gleichzeitig weniger Fälle an Spezialisten. Wenn Sie die automatisierte Diagnose ausgereifter nutzen, können Sie sie für Dinge wie die automatische Behebung und Auslösung mithilfe von Event Intelligence verwenden.

PagerDuty ® Mithilfe von Automatisierungsaktionen lassen sich vier Hauptproblembereiche im Reaktionsprozess einer Organisation lösen:

  • Isoliertes Fachwissen. Die Ersthelfer kennen nicht die genetische Zusammensetzung jeder einzelnen Anwendung oder jedes einzelnen Dienstes in der Umgebung einer Organisation.
  • Ständige Unterbrechungen bei der Arbeit mit Spezialisten . Die Helfer leiten den Fall an den Techniker weiter, denken ist der Spezialist für diese Anwendung oder diesen Dienst. Dadurch raubt er der Innovation Zeit und verzögert die Lösungsfindung.
  • Wiederholte und manuelle Diagnoseschritte. Die ersten Schritte bei einem Vorfall sind oft dieselben. Diese manuellen Schritte müssen ausgeführt werden, bevor Sie mit der Lösung des Vorfalls beginnen können.
  • Komplexe und weitläufige Produktionsumgebungen. Zu wissen, auf welche Systeme zugegriffen werden muss und welche Maßnahmen zu ergreifen sind, kann einige Zeit in Anspruch nehmen. Darüber hinaus hat nicht jeder Responder die Berechtigung, auf bestimmte Produktionssysteme zuzugreifen, was den Eskalationsprozess oft schwierig und zeitaufwändig macht.

PagerDuty ® Automatisierungsaktionen lösen die oben genannten Probleme durch:

  • Delegieren der Automatisierung an Teams. Stellen Sie Ersthelfern automatisierte Verfahren zur Verfügung, die normalerweise von Spezialisten aufgerufen werden.
  • Schnellere Lösung von Vorfällen mit weniger Eskalationen. Durch die Automatisierung gängiger Anfragen und Vorgänge müssen die Teams weniger Zeit damit verbringen, herauszufinden, an wen sie das Problem eskalieren müssen, und haben mehr Zeit für die Problembehebung.
  • Auslösen einer vom Menschen unterstützten/selbstheilenden Automatisierung. Rufen Sie Diagnosemaßnahmen auf, bevor die Antwortenden überhaupt angepiept werden, mit PagerDuty's Ereignisorchestrierung .
  • Sicheres Aufrufen der Automatisierung unter Berücksichtigung der Sicherheit. Den Helfern werden nur die Aktionen angezeigt, die sie für die betroffenen Systeme bei einem Vorfall ausführen dürfen. Außerdem werden sämtliche Aktionen protokolliert, um eine starke Sicherheitslage aufrechtzuerhalten.

 

Um das oben Gesagte in wenigen Stichpunkten zusammenzufassen: PagerDuty ® Automatisierungsaktionen helfen Teams:

  • Verringern Reaktionszeiten um bis zu 30 Minuten und MTTR um bis zu 25 %
  • Reduzieren die Anzahl der Vorfälle, die nach oben eskaliert werden
  • Verteilen Fachkompetenz in allen Reaktionsteams
  • Auslösen menschliche Unterstützung und Selbstheilung der Automatisierung, bevor die Einsatzkräfte überhaupt angepiept werden
  • Aufrufen sichere Automatisierung hinter Firewalls und VPCs
  • Einsetzen automatisierte Aktionen anstelle manueller Verfahren
  • Bereichern Vorfalldokumentation für reibungslosere Post-Mortem-Prozesse und reduzierten Bedieneraufwand

Um mehr über das PagerDuty Automatisierungsportfolio zu erfahren, Besuchen Sie unseren Automatisierungs-Hub Wenn Sie mehr erfahren möchten über PagerDuty Automatisierungsaktionen und wie es Ihrem Team helfen kann, Zeit und Geld zu sparen, Kontaktieren Sie Ihren Account Manager oder Erfahren Sie noch heute mehr.