Der Blog

Wie die PagerDuty Operations Cloud eine Rolle in Ihrer Digital Operational Resilience Act (DORA)-Strategie spielen kann

von Lee Fredericks 26. Juni 2024 | 8 Minuten Lesezeit

Seit ich geschrieben habe DORA gegen DORA! Viele Leute haben mich gefragt, ob ich praktische Ratschläge dazu geben könnte, wie die PagerDuty Operations Cloud Unternehmen der Finanzdienstleistungsbranche (FSI) dabei helfen kann, ihren Verpflichtungen gemäß DORA nachzukommen. Lassen Sie mich das jetzt versuchen.

Haftungsausschluss: Bitte beachten Sie, dass PagerDuty zwar einige wirklich nützliche Puzzleteile liefern kann, ich aber keineswegs behaupte, dass Sie durch die Einführung von PagerDuty Operations Cloud sofort DORA-Konformität erreichen können. Ich behaupte vielmehr, dass Sie in Kombination mit einer gut durchdachten Strategie, etwas Beratung und mehr als nur einem Hauch PagerDuty Power der DORA-Konformität deutlich näher kommen können.

Wenn wir mit unseren Kunden über betriebliche Belastbarkeit sprechen, kommen drei häufige Themen zur Sprache:

  1. Die Teams verbringen nicht genügend Zeit mit präventivem Design.
  2. Erkenntnisse aus vergangenen Vorfällen werden nicht genutzt.
  3. Aufgrund von Störungen und fehlenden Echtzeitsystemen ist die Lösung von Vorfällen langsam.

Ein proaktiver Ansatz bei Ihrer DORA-Planung und -Strategie hilft Ihnen, einige dieser Probleme zu lösen. Sehen wir uns die Kernpfeiler von DORA an und sehen wir, wo PagerDuty helfen kann. Für unser britisches Publikum werde ich hervorheben, wo meiner Meinung nach ein bestimmter Punkt auch für die britischen Vorschriften relevant ist (z. B. FCA PS21/3/PRA PS6/21).

  1. Robustes IKT-Risikomanagement

Im Rahmen des IKT-Risikomanagements schreibt DORA die Einrichtung starker Incident-Management-Prozesse . Dies ist eigentlich der Daseinszweck von PagerDuty, also werde ich versuchen, mich kurz zu fassen.

    • Überwachung und Alarmierung : Die AIOps-Funktionen der PagerDuty Operations Cloud basieren auf unserem grundlegenden Datenmodell und wurden anhand von über einem Jahrzehnt Kundendaten trainiert. Sie können zur Rauschreduzierung eingesetzt werden, indem Ereignisse aus einer Vielzahl von IT-Systemen und Tools zusammengeführt und aggregiert werden. Mit über 700 sofort einsatzbereite Integrationen PagerDuty kann so konfiguriert werden, dass es Ereignisse und Warnungen aus verschiedenen Quellen empfängt, z. B. aus Cloud- und Netzwerküberwachungstools, SIEM-Systemen (Security Information and Event Management) und Änderungsmanagement-Tools. Dies ermöglicht die frühzeitige Erkennung potenzieller Probleme, die sich zu größeren Problemen ausweiten könnten.
    • Alarmweiterleitung, Alarmierung und Eskalation PagerDuty ermöglicht es Unternehmen, Benachrichtigungsprotokolle für verschiedene Arten von Vorfällen basierend auf Dringlichkeit und Schweregrad zu definieren. PagerDuty arbeitet nach einem servicebasierten Modell – basierend auf den identifizierten wichtigen Geschäftsdiensten (IBS) aus den PRA-Vorschriften – und leitet Warnmeldungen direkt an die am besten geeigneten Teams und Personen mit der nötigen Expertise zur Bewältigung der Situation weiter. Dies reduziert die mittlere Zeit bis zur Wiederherstellung des Dienstes (MTTR) drastisch. Es ist außerdem möglich, diese IBSs zu visualisieren und ihre vor- und nachgelagerten Abhängigkeiten im Servicediagramm anzuzeigen.
    • PagerDuty Automatisierung, Workflow-Automatisierung und Vorfall-Workflows PagerDuty bietet Tools zur Erstellung standardisierter Workflows für die Bearbeitung von Vorfällen. Diese Workflows können automatisierte Schritte zur Fehlerbehebung, Diagnose und Lösung von Vorfällen umfassen und so einen konsistenten, wiederholbaren Ansatz für das Management von IKT-Risiken im gesamten Unternehmen fördern.
  1. Management, Klassifizierung und Meldung von IKT-bezogenen Vorfällen:

DORA schreibt die Meldung von Betriebsvorfällen vor, die erhebliche oder potenzielle Auswirkungen auf die Erbringung von Finanzdienstleistungen haben. Dies erfordert die Festlegung klarer Verfahren zur Identifizierung, Meldung und Analyse solcher Vorfälle.

    • Unveränderlicher zentraler Vorfalldatensatz PagerDuty erstellt ein zeitgestempeltes Protokoll aller Aktivitäten und Lösungsschritte im Zusammenhang mit einem Vorfall. Diese zentrale Aufzeichnung bietet einen klaren Prüfpfad für alle Vorfälle und vereinfacht die Einhaltung der DORA-Berichtspflichten.
    • Automatisiertes Reporting PagerDuty umfasst eine Reihe sofort einsatzbereiter Dashboards und Analyseberichte, ermöglicht aber auch die Integration externer Systeme und ermöglicht so die automatisierte Meldung schwerwiegender Vorfälle an die zuständigen Behörden anhand vordefinierter Kriterien. PagerDuty bietet außerdem Vorlagen für Statusaktualisierungen und webbasierte Statusseiten – direkt verknüpft mit Important Business Services (PRA) – für eine sofortige Massenkommunikation mit Stakeholdern und Kunden.
  1. Digitale Tests zur Betriebsstabilität:

DORA und die britischen Vorschriften verlangen von Finanzdienstleistern ausdrücklich, ihre IKT-Systeme und Notfallpläne regelmäßig zu testen, um Schwachstellen in ihrer operativen Belastbarkeit zu identifizieren. Diese Tests sollten auch die regelmäßige Simulation verschiedener Störszenarien umfassen.

    • Vorfallsimulation : Üben, üben, üben! Die Automatisierungsfunktionen von PagerDuty können genutzt werden, um einen simulierten Vorfall zu initiieren. Alternativ können Unternehmen eine Maschine oder Anwendung manuell deaktivieren oder einen PagerDuty Testvorfall erstellen, um einen Ausfall auszulösen und anschließend ihre Reaktionsverfahren zu üben. Dies hilft, Schwachstellen und Verbesserungspotenziale im Vorfallreaktionsplan zu identifizieren. PagerDuty führt solche Simulationen wöchentlich in seinen eigenen Systemen durch (sogenannter „Failure Friday“!). Natürlich geht operative Resilienz über die Technologie hinaus und umfasst auch Menschen und Prozesse. Wir haben das PagerDuty Vorfallreaktionsverfahren – einschließlich Rollen und Verantwortlichkeiten – als Open Source freigegeben, und Sie können es gerne kopieren und nach Ihren Wünschen anpassen ( response.pagerduty.com ).
    • PagerDuty ermöglicht betriebliche Ausfallsicherheit : Während eines Vorfalls – real oder simuliert – helfen die Kernfunktionen der PagerDuty Operations Cloud (AIOPs, PagerDuty Automation und Incident Response) in Kombination mit den Incident-Response-Prozessen und -Schulungen eines Unternehmens den Unternehmen, die mittlere Zeit bis zur Bestätigung (MTTA) und Lösung (MTTR) des Vorfalls zu verkürzen und so Störungen zu minimieren.
    • Analyse nach dem Test (Nachbesprechungen oder Post-Mortem-Analysen) : Die GenAI-Funktionalität von PagerDuty (im Early Access) erleichtert die Erstellung solcher Berichte und ermöglicht es Unternehmen, die Lösungszeiten von Vorfällen und die Teamzusammenarbeit während Testszenarien zu analysieren. Diese Daten sind von unschätzbarem Wert für die Verfeinerung des Incident-Response-Plans und die Verbesserung der Geschwindigkeit und Effizienz operativer Resilienzprozesse.
    • Automatisierte Notfallwiederherstellung (DR) Resiliente Unternehmen nutzen PagerDuty Automation, um die Bereitstellung und das Failover von Disaster-Recovery-Umgebungen sowie einzelner oder mehrerer Anwendungen zu automatisieren. Tests sind entscheidend, um sicherzustellen, dass diese Prozesse bei Bedarf schnell und zuverlässig ausgeführt werden können und so den Business-Continuity-Plan eines Unternehmens unterstützen.
  1. IKT-Risikomanagement für Drittparteien:

Unternehmen müssen strenge Maßnahmen ergreifen, um die Risiken zu bewerten und zu managen, die mit der Bereitstellung von IKT-Diensten durch kritische Drittanbieter (CTTPs) verbunden sind.

    • Überwachung der Incident-Response-Praktiken : Wenn ein CTTP auch die PagerDuty Operations Cloud verwendet, kann das Finanzinstitut Zugriff auf PagerDuty -Berichte anfordern, die Einblicke in die Incident-Response-Praktiken des CTTP, seine Reaktionsfähigkeit auf Vorfälle und seine allgemeine Betriebsstabilität geben.
    • Klassifizierung und Prüfung : Die PagerDuty Operations Cloud wurde verwendet, um Vorfälle basierend auf dem Ursprung des Problems durch einen Drittanbieter zu klassifizieren. Darüber hinaus wurde PagerDuty Automation verwendet, um Tests mit CTTPs durchzuführen und deren Verfügbarkeit und Robustheit sicherzustellen.
  1. Informationsaustausch, Führung von Aufzeichnungen und Dokumentation:

Sowohl gemäß DORA als auch gemäß den britischen Vorschriften müssen Finanzdienstleister eine umfassende Dokumentation ihrer IKT-Risikomanagementaktivitäten, Vorfallberichte und Testergebnisse führen. Diese Dokumentation ist entscheidend, um bei möglichen Audits die Einhaltung dieser Vorschriften nachzuweisen. Darüber hinaus fördert DORA den Informationsaustausch zwischen Finanzinstituten und Behörden über Cyberbedrohungen und -vorfälle. Dieser kollaborative Ansatz zielt darauf ab, die allgemeine Bereitschaft und Reaktionsfähigkeit des Finanzsektors zu verbessern.

    • Zentralisiertes Repository PagerDuty ist ein „Aktionssystem“ und dient, wie bereits erwähnt, als unveränderliches zentrales Repository für Vorfalldaten, einschließlich zeitgestempelter Aktivitätsdetails, Kommunikationsprotokolle und Lösungsschritte, die während der Hitze eines Vorfalls gesammelt wurden. PagerDuty kann außerdem in das vom Unternehmen gewählte „System of Record“ – ITSM- und ITOps-Tools – integriert werden und hält es automatisch auf dem neuesten Stand. Dies vereinfacht und verbessert die Dokumentation und demonstriert einen dokumentierten, wiederholbaren und konsistenten Ansatz für das Vorfallmanagement.
    • Berichterstellung und Analyse : Wie bereits erwähnt, bietet PagerDuty Analyse- und Berichtsfunktionen, mit denen Berichte zu Vorfalltrends, Lösungszeiten und Teamleistung erstellt werden können. Diese Berichte liefern datenbasierte Erkenntnisse, die gezielte technische Sanierungsmaßnahmen vorantreiben und laufende Bemühungen zur Verbesserung der betrieblichen Belastbarkeit aufzeigen.
    • Statusseiten : Der Informationsaustausch erfolgt automatisch und mühelos, wenn Unternehmen die webbasierten Statusseiten von PagerDuty verwenden, die mit Vorfällen verknüpft sind, die wichtige Geschäftsdienste betreffen, und direkt von diesen gespeist werden.

Abschluss

Aus dem oben Gesagten geht hoffentlich klar hervor, dass die PagerDuty Operations Cloud in hohem Maße auf die Kernpfeiler von DORA und den britischen Vorschriften anwendbar ist:

Die PagerDuty Operations Cloud bietet ein nahezu Echtzeit-Aktionssystem, das Ihnen hilft, Ihr Problem schnellstmöglich zu lösen und gleichzeitig Ihre ITSM- und Dokumentationstools zu aktualisieren. Es reduziert den Aufwand für Operations- und NOC-Teams und ermöglicht ihnen, von reaktiver Brandbekämpfung zu proaktiver Problemlösung überzugehen. Es kann Probleme automatisch beheben, um die Lösungszeiten zu verkürzen, und liefert wertvolle Analysen und Berichte nach Vorfällen, die Ihnen helfen, Ihre Prozesse zu verbessern.

Abschließend sei noch ein wichtiger Punkt erwähnt: Die Aufsichtsbehörden für Finanzdienstleistungen möchten vor allem sehen, dass Unternehmen über ihre Strategie zur operativen Resilienz nachdenken, diese dokumentieren und in sie investieren. Die Investition in und der Einsatz von PagerDuty sind ein klares Zeichen dafür, dass Finanzdienstleister die operative Resilienz ernst nehmen.

Wenn Sie weitere Einzelheiten oder Informationen wünschen, bitte melden .