Blog

Automatisieren Sie das Management schwerwiegender Vorfälle Schritt für Schritt für eine bessere und schnellere Reaktion

von Hannah Culver 1. Februar 2024 | 6 Minuten Lesezeit

Unternehmen, die im Markt erfolgreich sein und herausragende Kundenerlebnisse bieten wollen, müssen ihr Versprechen eines außergewöhnlichen Service einlösen – das bedeutet weniger Unterbrechungen und schnellere Problemlösung. Dies lässt sich erreichen, indem man den gesamten Incident-Management-Prozess für schwerwiegende Vorfälle automatisiert und menschliche Unterstützung dort einbezieht, wo sie sinnvoll ist.

Lassen Sie uns einige Schritte im Incident-Management durchgehen, die sich für eine Automatisierung eignen, um sofortige Vorteile zu erzielen, entweder um die Notwendigkeit menschlicher Eingriffe zu beseitigen oder um diese in kritischen Momenten zu unterstützen.

Bevor man es merkt, passiert ein Vorfall.

Bevor Einsatzkräfte von einem Vorfall erfahren, bietet sich die hervorragende Möglichkeit, Maschinen durch ereignisgesteuerte Automatisierung einen Großteil der Arbeit abnehmen zu lassen. Die ereignisgesteuerte Automatisierung beginnt auf Ereignisebene, sobald Daten aus vertrauenswürdigen Quellen wie Überwachungstools erfasst werden. Ab diesem Zeitpunkt kann die Automatisierung verschiedene Maßnahmen ergreifen, um ein effizientes Vorfallmanagement mit möglichst geringen Beeinträchtigungen für Fachexperten zu gewährleisten. Dazu gehören unter anderem:

  • Reduzierung des Vorfallaufkommens: Wenn Einsatzkräfte zu einem Problem gerufen werden müssen, kann es störend und ablenkend sein, mehrfach wegen desselben Problems alarmiert zu werden. Dies erschwert nicht nur die Konzentration, sondern verlängert auch die Reaktionszeit. Durch den Einsatz von KI und Automatisierung, um Alarme für zusammenhängende Probleme zu einem gemeinsamen Vorfall zusammenzufassen, wird diese Informationsflut reduziert, sodass sich die Einsatzkräfte auf das eigentliche Problem konzentrieren können.
  • Reduzierung der Ereignislautstärke für ein besseres Signal-Rausch-Verhältnis: Doppelte, informative oder kurzlebige Ereignisse können die Einsatzkräfte überfordern und es ihnen erschweren, Wichtiges von Unwichtigem zu unterscheiden. Durch die Reduzierung der Informationsflut wird sichergestellt, dass nur die wichtigsten Ereignisse erfasst werden.
  • Kontextualisierung von Ereignisdaten: Ereignisse können je nach betroffenen Diensten sehr unterschiedlich aussehen und enthalten nicht immer hilfreiche, leicht verständliche Informationen für die Einsatzkräfte. Mithilfe von Automatisierung lassen sich diese Ereignisse mit wichtigen Informationen anreichern und unternehmensweit standardisieren, sodass alle Einsatzkräfte den Kontext verstehen. Darüber hinaus können Unternehmen benutzerdefinierte Felder verwenden, um noch mehr Kontext hinzuzufügen, beispielsweise indem sie Vorfälle anhand der eingehenden Daten sofort als „schwerwiegend“ oder „Produktionsstörung“ kennzeichnen. Diese Funktionalität ist bereits verfügbar in [Version einfügen]. Früher Zugriff Die
  • Bereitstellung eines automatischen Diagnosekontexts: Die Durchführung von Diagnosen ist oft eine manuelle Aufgabe, die Einsatzkräfte bei jedem Vorfall erledigen. Wir müssen dafür jedoch keine Kapazitäten verschwenden. Stattdessen kann die Diagnose automatisiert werden und die Daten liefern, bevor ein Einsatzkraft den Vorfall überhaupt untersucht.
  • Automatische Fehlerbehebung: Laut unseren Kunden lassen sich rund 15 % der Vorfälle komplett ohne menschliches Eingreifen lösen. Diese bekannten Probleme können vollständig automatisiert behoben werden, was Zeit spart und die Auswirkungen auf die Kunden minimiert. In vielen Fällen arbeitet die Automatisierung so schnell, dass die meisten Kunden den Vorfall gar nicht bemerken.

Nachdem die Automatisierung diese Aufgaben erledigt hat, werden die verbleibenden, nicht lösbaren Vorfälle zur Priorisierung an den zuständigen Fachexperten – oft den Serviceverantwortlichen – weitergeleitet.

Während der Triage

Die Triage ist die Phase, in der die Einsatzkräfte versuchen, die Fehlerursache zu ermitteln. Da Systeme jedoch komplex sind und die Antwort oft nicht einfach ist, kann dieser Prozess viel Zeit und geistige Kapazität in Anspruch nehmen. Währenddessen warten die Kunden darauf, dass der Service wieder normal funktioniert. Es ist wichtig, dass die Einsatzkräfte ihr Fachwissen gezielt einsetzen, um das Problem zu lokalisieren, anstatt Dokumente und Fehlerberichte zu durchforsten oder andere Fachexperten um Rat zu fragen. Dank maschinellem Lernen und automatisierter Diagnose sind viele dieser Grundlagen bereits vorhanden, sobald die Einsatzkräfte ihren Arbeitsplatz erreichen.

Maschinelles Lernen kann den Einsatzkräften Systemkontexte aufzeigen, wie zum Beispiel den wahrscheinlichen Ursprung des Vorfalls, andere Teams, die das gleiche Problem haben, frühere Vorfälle und deren Lösung, Änderungsereignisse und vieles mehr.

Mit diesen Informationen können Einsatzkräfte schnell handeln und sich ohne mühsame Informationsbeschaffung ein umfassendes Bild von Vorfällen verschaffen. Dadurch wird der Zugang zu Informationen für alle Einsatzkräfte demokratisiert, unabhängig davon, ob sie bereits seit zehn Jahren in der Organisation tätig sind und das System in- und auswendig kennen oder erst kürzlich angefangen haben.

Während an einer Lösung gearbeitet wird

Die Erarbeitung einer konkreten Problemlösung ist der wichtigste Teil der Reaktion, bei dem KMUs benötigt werden. Automatisierung dient hierbei als Unterstützung: Sie beantwortet Fragen mithilfe von KI und optimiert die Arbeitsabläufe des Reaktionsteams, um alles strukturiert und zielgerichtet zu gestalten. Lassen Sie uns die einzelnen Punkte genauer betrachten.

GenAI hat für viele Unternehmen die Arbeitswelt revolutioniert. Entscheidend ist jedoch die Art der Anwendung. Ein wichtiger Faktor ist die Möglichkeit, Fragen zu stellen und mit der KI zu interagieren, um schnell die gewünschten Antworten zu erhalten. Mit GenAI-Chatbots zur Unterstützung des Incident-Managements können Sie die Kapazitäten Ihres Teams schonen, indem Sie Fragen zum System stellen. So erhalten Sie einen Ausgangspunkt, eine Einschätzung der Auswirkungen und vieles mehr.

Kombiniert mit einem KI-Copilot Incident-Workflows können ebenfalls einen entscheidenden Unterschied machen. Einsatzkräfte haben nicht nur Antworten auf wichtige Fragen sofort zur Hand, sondern wissen auch, was als Nächstes zu tun ist, und mühsame Schritte wie das Einrichten von Kommunikationskanälen, das Verfassen von Statusberichten und vieles mehr werden ihnen abgenommen.

Bei der internen und externen Kommunikation

Apropos Updates: Kommunikation ist ein zentraler Bestandteil des Incident-Managements, kann aber in der Hektik eines Vorfalls leicht vernachlässigt werden. Effektive Kommunikation umfasst die interne Kommunikation mit wichtigen Stakeholdern, die externe Kommunikation mit Kunden und die Kommunikation mit anderen Systemen wie Ihrem ITSM. Es ist wichtig, Automatisierung und KI-gestützte Technologien gemeinsam einzusetzen, um alle Eventualitäten abzudecken und zielgruppengerechte Kommunikationsmaßnahmen zu erstellen.

Einsatzkräfte können dies auf verschiedene Weise erreichen:

  • Benutzerdefinierte Felder : Schreiben Sie Aktualisierungen zurück in Ihr ITSM-System und aktualisieren Sie den Vorfall mit allen relevanten ITSM-Daten, damit alle Teams, ob IT oder Entwickler, auf dem gleichen Stand sind.
  • Vorlagen für Statusaktualisierungen: Nutzen Sie GenAI, um Updates zu erstellen und diese automatisch an wichtige interne Stakeholder auf Basis vordefinierter Gruppen zu veröffentlichen.
  • Statusseiten: Kunden automatisch darüber informieren, was sie von den Reaktionsmaßnahmen erwarten können, und benachrichtigen, wenn ein Vorfall abgeschlossen ist.

Die Kommunikation während des gesamten Vorfalls trägt dazu bei, Vertrauen aufzubauen und zu erhalten. Einsatzkräfte müssen möglicherweise eine erste Eingangsbestätigung, regelmäßige Statusberichte und schließlich eine Abschlussmeldung versenden. Die Automatisierung durch Vorfall-Workflows sorgt dafür, dass alle Beteiligten stets auf dem Laufenden bleiben und niemand vom Eingang bis zur Lösung des Vorfalls außen vor bleibt.

Nutzung von KI und Automatisierung

Der Einsatz von KI und Automatisierung im gesamten Vorfallslebenszyklus kann die Erfahrung für Einsatzkräfte, Beteiligte und Kunden verbessern. Es ist wichtig, diese neuen Arbeitsweisen einzuführen und technologisch auf dem neuesten Stand zu bleiben. Es ist jedoch unwahrscheinlich, dass Maschinen neuartige Probleme in absehbarer Zeit selbstständig lösen können. Daher ist es entscheidend, einen strategischen Partner an seiner Seite zu haben, der Unternehmen dabei unterstützt, KI und Automatisierung optimal zu nutzen. Wenn Sie erfahren möchten, was PagerDuty für Sie tun kann, Probieren Sie uns noch heute aus! Die