• PagerDuty
    /
  • Der Blog
    /
  • AIOps
    /
  • Was ist Event-Orchestrierung? 7 Möglichkeiten, diese leistungsstarke neue Funktion von PagerDuty zu nutzen, um Lärm zu reduzieren und manuelle Arbeit noch heute zu automatisieren

Der Blog

Was ist Event-Orchestrierung? 7 Möglichkeiten, diese leistungsstarke neue Funktion von PagerDuty zu nutzen, um Lärm zu reduzieren und manuelle Arbeit noch heute zu automatisieren

von Vivian Chan 2. August 2022 | 9 Minuten Lesezeit

Beschäftigt sich Ihr Team mit zu viel Lärm? Fühlen Sie sich unwohl, wenn Sie daran denken, wie viele Regeln Sie zur Bewältigung Ihrer Event-Verarbeitungsanforderungen angelegt haben? Deshalb haben wir Ereignisorchestrierung Anfang des Jahres wurde es eingeführt, um Teams dabei zu helfen, den manuellen Arbeitsaufwand im Eventmanagement zu reduzieren. Event Orchestration ist die nächste Weiterentwicklung unseres Event Rules-Funktionssatzes, der dabei hilft, Ereignisse bei der Aufnahme zu routen, anzureichern und zu modifizieren, um Störungen zu beseitigen und Prozesse zu automatisieren.

Wir haben Event Rules optimiert, um komplexere, benutzerdefinierte Logik und anspruchsvollere Funktionen zur bedingten Ereignisverarbeitung zu ermöglichen. Wir haben sogar unsere eigene Bedingungssprache geschrieben ( PagerDuty -Bedingungssprache oder PCL, ausgesprochen „Pickle“), um dies zu ermöglichen – wie wir es gebaut haben, erfahren Sie in der Summit-Sitzung „PCL 101“ von Staff Engineer Barry Kim. Hier .

Ereignisorchestrierung ist jetzt die beste Möglichkeit für Benutzer, Regelmengen zu reduzieren, die Rauschunterdrückung zu verbessern und gut verständliche manuelle Arbeit effektiver zu automatisieren. Wir haben kürzlich angekündigt, dass wir unsere Ressourcen für die Entwicklung einer robusten und zuverlässigen ereignisgesteuerten Anreicherungs- und Automatisierungserfahrung für unsere Kunden einsetzen werden. Daher werden wir Anfang nächsten Jahres alle Event Rules abschaffen und alle Kunden auf Event Orchestration migrieren. Weitere Informationen hierzu und zu den verschiedenen Migrationsoptionen , wir haben alles in diesem Knowledge Base-Artikel .

In diesem Blog erkläre ich, wie sich Event Orchestration von Event Rules unterscheidet und gehe auf sieben gängige Anwendungsfälle für Event Orchestration ein, die unserer Erfahrung nach für unsere Kunden die größte Wirkung haben.

Was ist Event-Orchestrierung? Und worin besteht der Unterschied zu Event-Regeln?

Ereignisorchestrierung ist ein direktes Upgrade von Event Rules. Basic Event Orchestrations können dieselben grundlegenden Ereignisverarbeitungsaktionen wie Event Rules ausführen und bieten zusätzlich die Vorteile einer verbesserten Benutzeroberfläche, besserer Regelerstellung, APIs und Terraform-Unterstützung sowie erweiterter Bedingungen. Für Kunden mit dem Event Intelligence-Add-on oder Digital Operations-Plänen bieten Advanced Event Orchestrations noch mehr Funktionalität, darunter kontextbezogene Bedingungen, Webhooks, Benachrichtigungen über pausierte Vorfälle, Regelverschachtelung und eine direkte Integration mit Automatisierungsaktionen.

Nachfolgend sind einige der wichtigsten Punkte aufgeführt, in denen die Event-Orchestrierung den Event-Regeln überlegen ist:

  • Benutzerfreundlicher: Architektonisch profitiert Event Orchestration vom moderneren Ansatz von PagerDuty für die Frontend-Entwicklung, indem es React als zentralen Frontend-Stack nutzt. Dies ermöglicht Kunden eine verzögerungsfreiere Navigation innerhalb ihrer Regeln und bietet künftige Verbesserungen der Barrierefreiheit.
  • Komplexere Ereignisverarbeitung: Dank der von Event Orchestration unterstützten Bedingungssprache und der Möglichkeit, Regeln zu verschachteln, können Kunden mit Event Orchestration komplexe Ereignisverarbeitungsaktionen mit einem Bruchteil des Konfigurationsaufwands durchführen. Was früher mit zehn Ereignisregeln möglich war, lässt sich jetzt mit einer einzigen Event Orchestration-Regel erreichen.
  • Robustere Unterstützung für die Automatisierung: Benutzer können Webhooks mit benutzerdefinierten Headern oder Automatisierungsaktionen auslösen.
  • Präzisere Ereignisverarbeitung: Durch die Verschachtelung von Regeln können Benutzer Automatisierungen mit einem hohen Maß an Präzision ausführen, da Kunden jeden bekannten Fehlerstart für ihre Systeme detailliert auflisten und die Automatisierung für jedes System zuverlässig bereitstellen können.

Was sind die häufigsten Anwendungsfälle für Event Orchestration?

Mit all diesen zusätzlichen Funktionen wird hoffentlich deutlich, dass Event Orchestration das Potenzial hat, die Erfahrung Ihres Teams im Rahmen der Reaktion auf größere und kleinere Vorfälle deutlich zu verbessern. Aber wo sollten die Leute anfangen?

Eine der beliebtesten Sessions in unserer On-Demand-Videobibliothek auf dem Summit 2022 war „7 Möglichkeiten, Event Orchestration zu nutzen, um Störgeräusche zu reduzieren und häufiger zu automatisieren“. In der Session erläutert Professional Services Consultant Eddie Willits zusammen mit Senior Product Manager Frank Emery Event Orchestration und die häufigsten Anwendungsfälle, in denen Kunden die leistungsstarke neue Funktion nutzen. Ich habe sie unten zusammengefasst, aber wenn Sie audiovisuell lernen, können Sie sich auch die folgenden ansehen: schnelle 20-minütige Sitzung .

Hier sind die 7 häufigsten Anwendungsfälle für Event Orchestration heute:

1) Unterdrückung

Das Problem mit Lärm ist, dass er sehr ablenkt. Besonders ärgerlich ist er, wenn es sich nicht lohnt, die Arbeit zu unterbrechen, um ihn anzusehen. Klassische Beispiele hierfür sind Ereignisse aus einer Staging-Umgebung oder unkritische Entwicklungsereignisse, die nach Feierabend gesendet werden. Wie können Sie sicherstellen, dass Ihr Team nur an den wichtigen Vorfällen arbeitet?

Die Ereignisorchestrierung unterstützt Teams dabei, sich auf kritische Ereignisse zu konzentrieren, indem sie die Einsatzkräfte nur mit den wichtigsten, zeitkritischen Alarmen unterbricht. Sie können eine Orchestrierung entwerfen, die nach einem bestimmten Signaltyp mit niedriger Priorität sucht, und eine Orchestrierung konfigurieren, die die Pause Incident Notification von PagerDuty aufruft, um irrelevante, wenig wertvolle oder störende Ereignisse automatisch zu reduzieren oder ganz zu unterdrücken. Anstatt Zeit mit der Bestätigung störender Ereignisse zu verbringen, können sich die Einsatzkräfte auf kritische Alarme konzentrieren, die das Geschäft betreffen.

2) Automatisierte Wartungsfenster

Wie oft denken Sie: „Heute Nacht führe ich Wartungsarbeiten durch! Wie stelle ich sicher, dass die Servicebesitzer nicht geweckt werden?“

Die Event-Orchestrierung unterstützt diesen Anwendungsfall durch die Erstellung benutzerdefinierter Logik, die wiederkehrende oder geplante Regelbedingungen berücksichtigt. Kunden können festlegen, wann alle Warnmeldungen unterdrückt oder umgeleitet werden sollen, um ein laufendes oder geplantes Wartungsfenster zu unterstützen. Sie können sogar noch spezifischer vorgehen als mit einem pauschalen Wartungsfenster pro Dienst, indem Sie Regeln einrichten, die unterschiedliche Behandlungsmethoden für Warnmeldungen durch das Überwachungstool vorsehen. Ein Beispiel hierfür, das unsere Kunden gerne nutzen, ist die Konfiguration einer Orchestrierung, die den Schweregrad nach Feierabend für produktionsumgebungsspezifische Ereignisse anpasst, die mit Bereitschafts- und Ruhezeiten zusammenfallen.

HINWEIS: Wir werden oft gefragt, was mit den Warnmeldungen passiert, wenn sie in den Wartungsmodus versetzt werden. Ereignisse, die in PagerDuty eingehen, sind immer zur Referenz sichtbar, auch wenn sie unterdrückt wurden. Sie finden sie im Menü „Warnmeldungen“.

3) Kontrolle von Alarmstürmen

Niemand möchte mit einem Alarmsturm konfrontiert werden. Doch es gibt sie. Die Frage ist, wie Sie die Erfahrung Ihres Teams bei einem Teil- oder Vollausfall so steuern können, dass die Störungen minimal bleiben und sich das Team auf die wichtigste Aufgabe konzentrieren kann: die Behebung des Problems.

Mit Event Orchestration können Kunden schwellenwertbasierte Regeln verwenden, um das Verhalten bei der Vorfallerstellung während einer Alarmflut zu steuern. Sie können schwellenwertspezifische Regeln konfigurieren, um Aktionen auszulösen, die bis zu einem bestimmten Schwellenwert oder nach dessen Überschreiten ausgeführt werden. Dies ermöglicht Ihnen noch mehr Präzision bei der Ereignisanreicherung, -weiterleitung oder -gruppierung im Verhältnis zum Ereignisaufkommen.

4) Routing und Anreicherung

Bei der Fehlerbehebung müssen Einsatzkräfte schnell verstehen, was während eines Ausfalls passiert ist. Wie können Sie diese Informationen bei einem Vorfall besser hervorheben, damit die Einsatzkräfte keine Zeit mit der Suche verschwenden?

Event Orchestration kann Kunden mit einer automatisierten Methode bei der Standardisierung von Vorfalldaten unterstützen, indem:

  • Überschreiben fehlerhafter Felder
  • Ersetzen von Feldern basierend auf bekannten Anwendungsfällen
  • Aktualisierung der Schwere/Priorität/Dringlichkeit
  • Anpassen des Vorfallerstellungsverhaltens (E-Mail-Integration)

Sie könnten beispielsweise eine Orchestrierung einrichten, bei der jedes Mal, wenn ein Ereignis die Nutzlast „Reaktionszeit ist hoch“ enthält und über 1000 ms liegt, der Vorfall sofort als Priorität 1 gekennzeichnet wird.

5) Bereitstellung von Runbooks

Jedes Mal, wenn jemand neu in Ihr Team eintritt, insbesondere wenn es sich um einen Junior handelt, dauert es eine Weile, ihn in die spezifischen Ansätze Ihrer Incident-Response-Prozesse einzuarbeiten. Selbst bei bekannten, häufigen Vorfällen braucht es Zeit, den Umgang damit zu erklären und zu schulen. Eine der einfachsten Automatisierungsformen, die unsere Kunden zur Lösung dieses Problems anwenden, besteht darin, die Lösungswege in Runbooks zu dokumentieren. Diese können dann als bewährte Methode zur Bewältigung wiederkehrender Probleme weitergegeben werden.

Mit Event Orchestration können Sie ganz einfach Notizen hinzufügen, die Links zu Runbooks oder Lösungsanweisungen für bekannte Probleme enthalten. So ist das Runbook während der Priorisierung des Vorfalls und der Anzeige der Warnmeldungen leicht zugänglich. Durch die Einbindung dieser verwertbaren Informationen während der Ereignisverarbeitung können L1-Responder häufig auftretende, gut verständliche Probleme problemlos lösen, ohne sie an leitende Ingenieure weiterleiten zu müssen.

6) Aktualisierung der Aufzeichnungssysteme

Kunden, die spezielle ITSM-Tools für größere und kleinere Vorfälle verwenden, werden daran interessiert sein, wie sie ihr Aufzeichnungssystem mit ihren PagerDuty Vorfällen synchron halten können.

Mit Event Orchestration-Webhooks können Benutzer sicherstellen, dass bei der Erfassung von Vorfällen die angeschlossenen Systeme aktualisiert werden. Spezifische Regeln enthalten Webhooks, die Payloads an diese Systeme senden und Datensätze mit aktuellen Event-Payload-Informationen erstellen. Wir haben dies bereits bei Jira, ServiceNow und selbst entwickelten CMDB-Systemen beobachtet. Erfahren Sie mehr über die Integration von PagerDuty in ITSM-Lösungen. Hier .

7) Automatisierte Diagnose und Behebung

Jeder möchte seine Betriebsprozesse automatisieren. Das ist nicht verwunderlich: Mit Vorfällen sind viele manuelle Schritte verbunden. Es kann jedoch schwierig sein zu wissen, wo und wie man anfangen soll.

Automatisierte Diagnosen sind eine risikoarme und zugleich wertvolle Möglichkeit, die MTTR-Zeit zu verkürzen. Denken Sie an all die Diagnosen, die Sie zu Beginn einer Untersuchung durchführen müssten – und stellen Sie sich vor, diese wären bereits abgeschlossen, wenn Ihr Einsatzleiter den Vorfall bekäme.

Event Orchestration vereinfacht die Integration von Automatisierungstools über Webhooks. Darüber hinaus ist eine native Integration mit PagerDuty Automation Actions integriert, die automatisierte Diagnosen und Fehlerbehebungen direkt auf der PagerDuty -Plattform auslösen kann. Dies verkürzt die Gesamtzeit bis zur Problemlösung, da die Diagnoseergebnisse direkt in die Vorfalldetails einfließen und dem Responder zur Überprüfung zur Verfügung stehen.

Erfahren Sie mehr über Event Orchestration

Lesen Sie mehr über Ereignisorchestrierung oder schauen Sie sich einige unserer Videos auf Youtube an, darunter Ereignisorchestrierung in Terraform Und Spaß und Mathematik hinter der Event-Orchestrierung .

Weitere Informationen zur Erweiterung der Event Orchestration auf mehrere Dienste finden Sie unter dieser Blog über Global Event Orchestration oder nehmen Sie Unsere Produkttour .