Blog

Comment le PagerDuty Operations Cloud peut contribuer à votre stratégie DORA (Digital Operational Resilience Act)

par Lee Fredricks 26 juin 2024 | 8 minutes de lecture

Depuis que j'ai écrit DORA contre DORA ! Plusieurs personnes m'ont demandé des conseils plus pratiques sur la manière dont PagerDuty Operations Cloud peut aider les entreprises du secteur des services financiers (ISF) à respecter leurs obligations au titre de la DORA. Je vais essayer de vous donner des conseils pratiques.

Clause de non-responsabilité: Veuillez noter que même si PagerDuty peut apporter des éléments très utiles, je ne suggère en aucun cas que vous puissiez atteindre instantanément la conformité DORA en adoptant simplement PagerDuty Operations Cloud. Je suggère plutôt qu'avec une stratégie bien pensée, un peu de conseil et une bonne dose de PagerDuty , vous pouvez vous rapprocher considérablement de la conformité DORA.

Lorsque nous parlons de résilience opérationnelle avec nos clients, trois thèmes communs reviennent :

  1. Les équipes ne consacrent pas suffisamment de temps à la conception préventive.
  2. Les leçons tirées des incidents passés ne sont pas exploitées.
  3. La résolution des incidents est lente en raison du bruit et du manque de systèmes en temps réel.

Une approche proactive de votre planification et de votre stratégie DORA vous aidera à résoudre certains de ces problèmes. Examinons les piliers fondamentaux de DORA et voyons comment PagerDuty peut vous aider. Pour notre public britannique, je soulignerai les points qui me semblent pertinents pour la réglementation britannique (par exemple, FCA PS21/3/PRA PS6/21).

  1. Gestion robuste des risques liés aux TIC

Dans le cadre de la gestion des risques liés aux TIC, la DORA exige la mise en place de systèmes processus de gestion des incidents C'est vraiment la raison d'être de PagerDuty, donc je vais essayer d'être succinct.

    • Surveillance et alerte Les fonctionnalités AIOps du PagerDuty Operations Cloud s'appuient sur notre modèle de données fondamental et sont basées sur plus de dix ans de données clients. Elles permettent de réduire le bruit en collectant et en agrégeant les événements provenant d'une multitude de systèmes et d'outils informatiques. plus de 700 intégrations prêtes à l'emploi PagerDuty peut être configuré pour recevoir des événements et des alertes provenant de diverses sources, telles que des outils de surveillance cloud et réseau, des systèmes de gestion des informations et des événements de sécurité (SIEM) et des outils de gestion des changements. Cela permet de détecter rapidement les problèmes potentiels susceptibles de se transformer en problèmes plus graves.
    • Routage des alertes, appel et escalade PagerDuty permet aux entreprises de définir des protocoles de notification pour différents types d'incidents, en fonction de leur urgence et de leur gravité. PagerDuty fonctionne selon un modèle basé sur les services (par exemple, les services métier importants (SMI) identifiés par la réglementation PRA)) et achemine les alertes directement aux équipes et aux personnes les plus compétentes, disposant de l'expertise nécessaire pour gérer la situation. Cela réduit considérablement le délai moyen de rétablissement (MTTR) du service. Il est également possible de visualiser ces SMI et leurs dépendances en amont et en aval dans le graphique de service.
    • Automatisation de PagerDuty , automatisation des flux de travail et flux de travail des incidents PagerDuty propose des outils permettant de créer des workflows standardisés pour la gestion des incidents. Ces workflows peuvent inclure des étapes automatisées de dépannage, de diagnostic et de résolution des incidents, favorisant ainsi une approche cohérente et reproductible de la gestion des risques informatiques au sein de l'organisation.
  1. Gestion, classification et signalement des incidents liés aux TIC :

La DORA impose le signalement des incidents opérationnels ayant un impact significatif ou potentiel sur la prestation des services financiers. Cela nécessite la mise en place de procédures claires pour identifier, signaler et analyser ces incidents.

    • Registre centralisé et immuable des incidents PagerDuty fournit un journal horodaté de toutes les activités et étapes de résolution liées à un incident. Cet enregistrement centralisé fournit une piste d'audit claire pour tous les incidents, simplifiant ainsi le respect des exigences de reporting de la DORA.
    • Rapports automatisés PagerDuty inclut une suite de tableaux de bord et de rapports analytiques prêts à l'emploi, et permet également l'intégration avec des systèmes externes, permettant potentiellement le signalement automatisé des incidents majeurs aux autorités compétentes selon des critères prédéfinis. PagerDuty fournit également des modèles de mise à jour de statut et des pages de statut web, directement associées et liées aux Services d'Entreprise Importants (PRA), pour une communication de masse immédiate aux parties prenantes et aux clients.
  1. Tests de résilience opérationnelle numérique :

La DORA et la réglementation britannique exigent explicitement des institutions financières qu'elles testent régulièrement leurs systèmes informatiques et leurs plans de réponse aux incidents afin d'identifier les vulnérabilités de leur résilience opérationnelle. Ces tests doivent inclure des simulations régulières de divers scénarios perturbateurs.

    • Simulation d'incident Pratiquez, pratiquez, pratiquez ! Les fonctionnalités d'automatisation de PagerDuty peuvent servir à déclencher une simulation d'incident. Les entreprises peuvent également désactiver manuellement une machine ou une application, ou créer un incident test PagerDuty pour déclencher une panne, puis s'entraîner à leurs procédures de réponse. Cela permet d'identifier les faiblesses et les points à améliorer du plan de réponse aux incidents. PagerDuty , en tant qu'entreprise, effectue de telles simulations dans ses propres systèmes chaque semaine (appelé « Failure Friday » !). Bien entendu, la résilience opérationnelle va au-delà de la technologie et englobe les personnes et les processus. Nous avons publié en open source la procédure de réponse aux incidents de PagerDuty , y compris les rôles et responsabilités, et vous êtes libre d'en prendre une copie et de la personnaliser à votre guise. response.pagerduty.com ).
    • PagerDuty permet la résilience opérationnelle :Lors d'un incident, réel ou simulé, les fonctionnalités principales du PagerDuty Operations Cloud (AIOP, PagerDuty Automation et Incident Response) combinées aux processus et à la formation en matière de réponse aux incidents d'une entreprise aideront les entreprises à réduire le temps moyen de reconnaissance (MTTA) et de résolution (MTTR) de l'incident et donc à minimiser les perturbations.
    • Analyse post-test (examens post-incident ou post-mortem) La fonctionnalité GenAI de PagerDuty (en accès anticipé) facilite la création de tels rapports, permettant aux entreprises d'analyser les délais de résolution des incidents et la collaboration des équipes lors des scénarios de test. Ces données sont précieuses pour affiner le plan de réponse aux incidents et améliorer la rapidité et l'efficacité des processus de résilience opérationnelle.
    • Réponse automatisée à la reprise après sinistre (DR) Les entreprises résilientes utilisent PagerDuty Automation pour automatiser le provisionnement et le basculement des environnements de reprise après sinistre et d'une ou plusieurs applications. Les tests sont essentiels pour garantir l'exécution rapide et fiable de ces processus en cas de besoin et ainsi contribuer au plan de continuité d'activité de l'entreprise.
  1. Gestion des risques liés aux tiers liés aux TIC :

Les entreprises doivent mettre en œuvre des mesures rigoureuses pour évaluer et gérer les risques associés aux fournisseurs tiers critiques (CTTP) fournissant des services TIC.

    • Surveillance des pratiques de réponse aux incidents :Si un CTTP utilise également PagerDuty Operations Cloud, l'institution financière peut demander l'accès aux rapports PagerDuty qui donneront un aperçu des pratiques de réponse aux incidents du CTTP, de leur réactivité aux incidents et de leur résilience opérationnelle globale.
    • Classification et tests PagerDuty Operations Cloud a été utilisé pour classer les incidents en fonction de leur origine. De plus, PagerDuty Automation a été utilisé pour tester les CTTP afin de garantir leur disponibilité et leur robustesse.
  1. Partage d’informations, tenue de registres et documentation :

Conformément aux réglementations DORA et britannique, les institutions financières doivent conserver une documentation complète de leurs activités de gestion des risques informatiques, des rapports d'incidents et des résultats de tests. Cette documentation sera essentielle pour démontrer leur conformité à ces réglementations lors d'éventuels audits. De plus, DORA encourage le partage d'informations entre les institutions financières et les autorités concernant les cybermenaces et les incidents. Cette approche collaborative vise à améliorer la préparation et les capacités de réaction globales du secteur financier.

    • Dépôt centralisé PagerDuty est un système d'action et, comme mentionné précédemment, sert de référentiel centralisé et immuable pour les données d'incident, notamment les détails horodatés des activités, les journaux de communication et les étapes de résolution, toutes collectées au plus fort d'un incident. PagerDuty peut également s'intégrer au système d'enregistrement choisi par l'entreprise (outils ITSM et ITOps) et le maintenir automatiquement à jour. Cela simplifie et améliore la tenue des registres et démontre une approche documentée, reproductible et cohérente de la gestion des incidents.
    • Rapports et analyses Comme mentionné précédemment, PagerDuty offre des fonctionnalités d'analyse et de reporting permettant de générer des rapports sur les tendances des incidents, les délais de résolution et les performances des équipes. Ces rapports fournissent des informations basées sur les données, permettant de cibler les efforts de remédiation technique et de démontrer les efforts continus visant à améliorer la résilience opérationnelle.
    • Pages d'état :Le partage d'informations est automatique et sans effort si les entreprises utilisent les pages d'état Web de PagerDuty, qui sont liées et alimentées directement par les incidents affectant les services commerciaux importants.

Conclusion

Il ressort clairement de ce qui précède que le PagerDuty Operations Cloud est parfaitement applicable aux piliers fondamentaux de DORA et des réglementations britanniques :

PagerDuty Operations Cloud offre un système d'action en temps quasi réel conçu pour vous aider à résoudre vos problèmes au plus vite, tout en mettant à jour vos outils ITSM et de documentation. Il simplifie la gestion des opérations et des opérations réseau, leur permettant de passer d'une gestion réactive des incidents à une approche proactive de la résolution des problèmes. Il peut automatiser la résolution des problèmes pour réduire les délais et fournit des analyses et des rapports post-incident précieux pour vous aider à apprendre et à améliorer vos processus.

Enfin, un point essentiel mérite d'être souligné. Plus que tout, les régulateurs des services financiers souhaitent que les entreprises réfléchissent à leur stratégie de résilience opérationnelle, la documentent et y investissent. L'investissement et le déploiement de PagerDuty témoignent clairement de l'importance que les institutions financières accordent à la résilience opérationnelle.

Si vous souhaitez des détails ou des informations supplémentaires, s'il vous plaît contactez-nous .