• PagerDuty
    /
  • Blog
    /
  • Produkt
    /
  • Reduzieren Sie die mittlere Reparaturzeit (MTTR) und heben Sie die Automatisierung mit PagerDuty Global Event Orchestration auf ein neues Niveau.

Blog

Reduzieren Sie die mittlere Reparaturzeit (MTTR) und heben Sie die Automatisierung mit PagerDuty Global Event Orchestration auf ein neues Niveau.

von Hannah Culver 18. April 2023 | 5 Minuten Lesezeit

Die globale Ereignisorchestrierung von PagerDuty ist ab sofort allgemein verfügbar. Die leistungsstarke Entscheidungs-Engine der globalen Ereignisorchestrierung reichert Ereignisse an, steuert deren Weiterleitung und löst basierend auf den Ereignisdaten automatische Fehlerbehebungsmaßnahmen aus. Teams können diese Funktionalität für alle oder einzelne Dienste innerhalb von PagerDuty nutzen. Diese Funktion ist eine kontinuierliche Investition in die Ereignisorchestrierung und unterstreicht PagerDutys Engagement, Kunden erstklassige Automatisierungsfunktionen zu bieten.

Kunden unseres Early-Access-Programms profitieren bereits von der globalen Ereignisorchestrierung und loben die verkürzte mittlere Reparaturzeit (MTTR) sowie die verbesserte Standardisierung der Reaktion auf Sicherheitsvorfälle im großen Maßstab. Kiril Yurovnik, Technical Lead bei Riskified, erklärt: „Angesichts der steigenden Anzahl von Ereignissen ist die Minimierung von Störungen und Arbeitsaufwand unerlässlich, insbesondere da Unternehmen in der aktuellen Wirtschaftslage ihre IT-Prozesse optimieren wollen. Wir nutzen die globale Ereignisorchestrierung von PagerDuty im Rahmen des Early-Access-Programms und erzielen damit hervorragende Ergebnisse. Riskified konnte die Störungsreduzierung, insbesondere in Nicht-Produktionsumgebungen, skalieren und unserem Team so wertvolle Zeit für die Entwicklung zukunftsweisender Innovationen sparen.“

Was sind globale Event-Orchestrierungen?

Globale Event-Orchestrierung ist wie Service-Event-Orchestrierung Es ermöglicht Benutzern, komplexe Regeln zu definieren, die festlegen, was mit einem Ereignis während der Verarbeitung geschieht. Der Unterschied besteht darin, dass Global Event Orchestration Ereignisse bereits bei der Erfassung anreichert. Sobald die Daten normalisiert sind, wird das Ereignis anhand verschiedener Kriterien an einen Dienst weitergeleitet. Dadurch wird sichergestellt, dass den Einsatzkräften die bestmöglichen Ereignisdaten für den Beginn des Reaktionsprozesses zur Verfügung stehen.

Global Event Orchestration verfügt über drei Schlüsselkomponenten, die es für die Skalierung der Reaktion auf Sicherheitsvorfälle erfolgreich machen.

Globale Orchestrierungsregeln Benutzer können Aktionen auf Ereignisse in verschiedenen Diensten anwenden. Teams können Regeln erstellen, die Ereignisdaten dienstübergreifend verarbeiten und die verarbeiteten Daten zur Verbesserung des Ereignis-Routings nutzen. Dies ermöglicht es Organisationen, die automatische Fehlerbehebung zu etablieren und zu optimieren. Dadurch ist die Beteiligung eines Mitarbeiters an der Behebung eines Vorfalls nicht mehr erforderlich. Zudem wird der Wirkungsbereich eines Vorfalls durch intelligenteres Routing reduziert.

Erweitertes Integrationsschlüsselmanagement Der Verwaltungsaufwand für Integrationsschlüssel verschiedener Überwachungstools wird reduziert. Benutzer können Integrationsschlüssel in einer einzigen Ereignisorchestrierung kombinieren. Noch besser: Die verbesserte Verwaltung von Integrationsschlüsseln ist jetzt für alle PagerDuty Tarife verfügbar.

Zusätzliche APIs Sie ermöglichen die Verwaltung in großem Umfang. Teams können REST-APIs für die Verwaltung von Ereignisquellen und globalen Orchestrierungsregeln nutzen. Beide APIs unterstützen Terraform. Diese APIs ergänzen die REST-APIs für die Ereignis- und Dienstorchestrierung.

„Die Nutzung der globalen Ereignisorchestrierung von PagerDuty war entscheidend, um die Effizienz und Skalierbarkeit unserer Ereignisweiterleitungsprozesse zu gewährleisten und so IT-Betrieb und -Kosten zu optimieren“, so Brian Long, Cloud Infrastructure Engineer bei Hyland. „Mithilfe der globalen Ereignisorchestrierung kann unser Unternehmen den Status ‚aufgelöst‘ in unseren Benachrichtigungen erkennen und als Lösung ausführen. Dadurch reduziert sich die Anzahl der Stellen, an denen diese Bedingungen konfiguriert werden müssen, um mindestens den Faktor drei. So gewinnen wir Zeit für Innovationen statt für Konfigurationen.“

Wie kann Global Event Orchestration meinem Team helfen?

Mit Global Event Orchestration sehen Teams Folgendes:

  • Kodifizierte Prozesse zur Reaktion auf Zwischenfälle: Demokratisierung und Verbreitung bewährter Reaktionsverfahren bei Sicherheitsvorfällen über verteilte Teams hinweg
  • Weniger Vorfälle: Nutzen Sie kontextbezogene Ereignisdaten aus allen Diensten Ihres Ökosystems, um die Unterdrückungsgenauigkeit zu verbessern.
  • Schnellere Auflösung: Automatisierung teamübergreifend anwenden und automatisierte Diagnostik in großem Umfang durch standardisierte Anreicherung und Datennormalisierung ermöglichen.

Die Nutzung von Global Event Orchestration durch die Teams kann je nach Organisationsstruktur variieren. Die Funktionen sind auf zwei verschiedene Teamtypen abgestimmt: ITOps-, SRE- und NOC-Teams sowie Entwicklerteams.

ITOps-Teams wird in der Lage sein, die Funktionen zur Ereignisnormalisierung zu nutzen und sicherzustellen, dass alle eingehenden Ereignisse gleich aussehen.

SRE-Teams Die Automatisierung lässt sich über alle oder einzelne Dienste innerhalb eines technischen Ökosystems hinweg erstellen und erweitern. Dadurch wird die Skalierung und Standardisierung der Automatisierung in einem Unternehmen einfacher denn je.

Für L1-Reaktionsteams wie NOCs Die globale Ereignisorchestrierung unterstützt sie bei der Bewältigung der massiven Flut eingehender Ereignisse. Ereignisse können an das NOC weitergeleitet werden, wenn sie bestimmte Kriterien erfüllen. Während das Ereignis verschiedene Regelebenen und verschachtelte Regeln durchläuft, kann die Automatisierung Diagnoseinformationen an den L1-Responder liefern. Ist die Lösung für einen Vorfall bekannt, können Unternehmen eine automatische Fehlerbehebung einrichten.

Entwicklerteams Dadurch werden weniger Vorfälle auftreten und diese schneller behoben. Dank automatischer Fehlerbehebung können Vorfälle gelöst werden, bevor sie die Dienste erreichen, für die die Entwicklerteams im Bereitschaftsdienst sind. Detaillierte Routing-Kriterien verhindern zudem, dass Vorfälle zwischen verschiedenen Teams hin- und hergeschoben werden. Sollten die Automatisierung, das NOC oder die L1-Supportmitarbeiter das Problem nicht lösen können, wird der Vorfall an den Fachexperten (SME) weitergeleitet. Bis der SME mit der Bearbeitung des Vorfalls beginnt, liegen bereits Diagnoseinformationen vor, was die Lösungszeit verkürzt.

Wie kann ich heute damit beginnen?

Global Event Orchestration ist generell für alle PagerDuty AIOps-Kunden verfügbar. Um es in Aktion zu sehen, Besucht uns auf Twitch! Freitag, 14. April.

PagerDuty AIOps unterstützt Teams dabei, weniger Vorfälle zu erleben, diese schneller zu beheben und die Produktivität zu steigern – ohne langwierige Implementierungen oder aufwendige laufende Wartung. Um PagerDuty AIOps zu testen, können Sie eine Testversion anfordern. Hier oder nehmen unsere Produktvorstellung Wenn Sie mit dem Vertrieb sprechen möchten, kontaktieren Sie uns bitte über dieses Formular Die

Um mehr über Global Event Orchestration zu erfahren, registrieren Sie sich hier. Webinar Wenn Sie als PagerDuty AIOps-Kunde Ihre erste globale Ereignisorchestrierung erstellen möchten, ist dies der richtige Weg. Wissensdatenbankartikel kann Ihnen zeigen, wie Sie anfangen können.