• PagerDuty
    /
  • Blog
    /
  • AIOps
    /
  • Die 3 wichtigsten Probleme bei der Reaktion auf Sicherheitsvorfälle, bei deren Lösung AIOps Ihre Teams unterstützen kann.

Blog

Die 3 wichtigsten Probleme bei der Reaktion auf Sicherheitsvorfälle, bei deren Lösung AIOps Ihre Teams unterstützen kann.

von Hannah Culver 20. April 2023 | 5 Minuten Lesezeit

Mehr Daten um der Daten willen helfen niemandem. Was Organisationen brauchen, sind mehr Informationen – verwertbare Erkenntnisse. Angesichts der Datenflut aus eingehenden Ereignis- und Warnmeldungen fehlt Teams die Zeit, jede einzelne Meldung zu prüfen. Sie haben Schwierigkeiten, diese Daten zu analysieren und zu konsolidieren, um die nächsten Schritte zur Behebung eines Vorfalls zu ermitteln. Die Aufbereitung dieser Daten, um sie während der Reaktion auf Vorfälle nutzbarer und hilfreicher zu machen, führt oft zu einer eintönigen Abfolge manueller, sich wiederholender Aufgaben bei jedem Vorfall und kostet somit wertvolle Zeit. Kein Wunder also, dass Teams zunehmend auf AIOps und Automatisierung setzen. AIOps AIOps hilft Teams, Daten in Informationen umzuwandeln und den manuellen Aufwand zu reduzieren. Wir stellen drei Möglichkeiten vor, wie AIOps Teams dabei unterstützt, Herausforderungen zu meistern und Kundenbeeinträchtigungen zu minimieren.

Lärmreduzierung für weniger Zwischenfälle

Nicht jede Benachrichtigung sollte zu einem Zwischenfall führen. Doch in vielen Organisationen ist genau das der Fall. Selbst wenn nur ein Problem auftritt, erhalten Sie möglicherweise Dutzende oder Hunderte von Benachrichtigungen zum selben Thema. Das lenkt ab und überlastet die Einsatzkräfte. Die Beseitigung dieser Flut an Benachrichtigungen sollte Ihre oberste Priorität sein, denn dadurch:

  • Dadurch gewinnen die Einsatzkräfte Zeit zurück, da sie nicht mehr zwischen Wichtigem und Unwichtigem filtern müssen.
  • Die kognitive Belastung der Einsatzkräfte wird verringert. Sie müssen nicht mehr 63 verschiedene Alarme gleichzeitig verarbeiten, sondern können sich auf den jeweils relevanten konzentrieren. Dies reduziert die Rufbereitschaftsangst.
  • Es reduziert Ablenkungen, die Einsatzkräfte während eines Einsatzes behindern. Dadurch können sich die Einsatzkräfte schneller auf die Behebung des Problems konzentrieren.

Um die Anzahl der eingehenden Benachrichtigungen zu reduzieren, analysieren Sie die häufigsten Vorfälle. Welche davon sind identisch? Überprüfen Sie Ihre Benachrichtigungen und gruppieren Sie sie anhand der Ereignisdaten Ihrer Überwachungstools. Welche Benachrichtigungen sind am häufigsten? Nutzen Sie diese Gelegenheit, um Ihre Überwachungstools so zu optimieren, dass sie Ihnen nur die relevantesten Informationen senden. Beachten Sie, dass dies regelmäßige Wartung erfordert. Überwachungstools können schnell unübersichtlich werden, insbesondere wenn die Daten von verschiedenen Anbietern stammen. Überprüfen Sie Ihre Tools daher immer dann, wenn Sie einen Anstieg der Benachrichtigungen feststellen.

PagerDuty AIOps vereinfacht die Reduzierung von Alarmfluten in einem einzigen Tool. Benutzer können PagerDuty so konfigurieren, dass Ereignisse aus diesen unterschiedlichen Signalen erfasst und dedupliziert werden. Anschließend gruppiert PagerDuty AIOps die Ereignisse in einen bestehenden Vorfall. Dadurch wird die Erstellung eines neuen Vorfalls verhindert. Teams haben Zugriff auf Ereignisdaten in Form von Alarmen ohne zusätzliche Benachrichtigungen. Das Ergebnis: Teams können Alarmfluten besser bewältigen, indem sie sich auf das Wesentliche konzentrieren.

Kontext gewinnen für eine bessere Triage

Technisch gesehen sind alle Informationen, die Einsatzkräfte zur Bewältigung eines Vorfalls benötigen, vorhanden. Sie sind jedoch in zahlreichen, voneinander unabhängigen Datenströmen verstreut. Menschen allein können diese Daten nicht in prägnante, handlungsrelevante Erkenntnisse umwandeln. Das bedeutet, dass Teams viel Zeit mit der Suche nach Antworten auf Fragen verbringen, die sie mithilfe von maschinellem Lernen (ML) finden könnten. ML kann sowohl historische Ereignisdaten als auch menschliche Interaktionen analysieren und die analysierten Daten anschließend in handlungsrelevante Erkenntnisse übersetzen. Mit ML können Teams wichtige Fragen beantworten wie:

  • Wo sollte mein Team zuerst suchen?
  • Arbeiten auch andere Teams an demselben Problem?
  • Handelt es sich um einen häufigen Vorfall oder um etwas völlig Neues?
  • Haben wir das schon einmal erlebt? Wie wurde das Problem gelöst?
  • Gab es vor diesem Vorfall relevante Änderungen?

Doch die Entwicklung eigener ML-Lösungen kann eine gewaltige Aufgabe sein. Sie erfordert Zeit und Ressourcen wie beispielsweise Personal. Viele Organisationen entscheiden sich daher dafür, Zusammenarbeit mit einem Anbieter stattdessen.

Die ML-Algorithmen von PagerDuty AIOps helfen dabei, wichtige Informationen aufzudecken, wie zum Beispiel:

  • Wahrscheinlicher Ursprung: ermittelt die wahrscheinliche Ursache auf Grundlage früherer Vorfälle, die Ihren Service beeinträchtigt haben.
  • Ähnliche Vorfälle: Teilen Sie uns mit, wenn ein aktueller Vorfall Ihren Service beeinträchtigt.
  • Ausreißerereignisse: ob dieses Ereignis häufig, selten oder eine absolute Ausnahme darstellt.
  • Vergangene Vorfälle: Schauen Sie sich die Details des Vorfalls an und sehen Sie, wie die Einsatzkräfte in der Vergangenheit damit umgegangen sind.
  • Veränderungskorrelation: Verbindet sich mit Ihren Änderungsintegrationen, um Änderungen an Ihrem Service anzuzeigen, und nutzt dann maschinelles Lernen, um Muster zwischen Änderungsereignissen und Vorfällen zu korrelieren.

Jedes Mal, wenn diese Informationen Ihrem Team automatisch zur Verfügung stehen, ohne dass Sie manuell danach suchen müssen, können Sie den Vorfall schneller beheben. Die dadurch verkürzte mittlere Reparaturzeit (MTTR) gibt Ihnen mehr Zeit, sich auf wertschöpfende Initiativen zu konzentrieren.

Selbstheilung durch die Entwicklung von Selbstheilungsmechanismen

Eine Möglichkeit, den Aufwand für die Fehlerbehebung zu reduzieren, ist die Automatisierung. Dabei können Sie Probleme selbstständig beheben, bevor sie überhaupt zu einem Einsatz führen. Das Problem ist gelöst, bevor ein Einsatzkraft benötigt wird. So kann jemand nachts durchschlafen, anstatt auf Benachrichtigungen reagieren zu müssen. Diese Vorgehensweise mag zunächst abschreckend wirken. Tatsächlich ist es aber so, dass die Selbstheilung einfacher ist als erwartet, wenn man klein anfängt und sich auf die einfachsten Lösungen konzentriert.

Sie können gut verstandene Problemlösungsszenarien identifizieren, deren Bearbeitung Sie automatisieren können. Dies können Szenarien sein, die Ihr Team als häufig einstuft oder deren Lösung unkompliziert ist. Teams können dann Automatisierungen erstellen, um diese Fälle ohne menschliches Eingreifen zu lösen. Sobald diese Automatisierung Wirkung zeigt, gewinnen Ihre Teams Zeit für neue Automatisierungsinitiativen.

PagerDuty Event-Orchestrierung Unterstützt Teams bei der Automatisierung des gesamten technischen Ökosystems. Die Ereignisorchestrierung reichert Ereignisse an, leitet sie weiter und initiiert anschließend die automatische Fehlerbehebung. Mit dieser Funktion können Benutzer über Webhooks Maßnahmen zur Behebung bekannter Vorfälle auslösen. Bei komplexeren Problemen, bei denen eine automatische Behebung nicht möglich ist, können Teams die Automatisierung auch zur Diagnose nutzen. Dies baut auf den ersten Informationen auf, die den Einsatzkräften bei der ersten Sichtung des Vorfalls vorliegen.

Sie möchten mit AIOps beginnen?

AIOps kann Teams dabei helfen, weniger Vorfälle zu erleben und diese schneller zu beheben. PagerDuty unterstützt Sie dabei und bietet mit PagerDuty AIOps noch weitere Vorteile. Erleben Sie PagerDuty AIOps in Aktion. Antrag auf eine Verhandlung oder unsere Produktvorstellung Sind Sie auf der Suche nach AIOps? Lesen Sie unseren Artikel Käuferleitfaden Die