Verantwortung für die Reaktion auf Sicherheitsvorfälle übernehmen: Es geht um kontinuierliche Verbesserungen.
Kürzlich habe ich Trainingsmaterial für unseren bevorstehenden Kurs zum Thema „ Verantwortung für die Reaktion auf Vorfälle übernehmen“ bei PagerDuty Universität und ich hörte mir die Aufzeichnungen von Einsatzanrufen aus vielen Jahren PagerDuty -Geschichte an. Mehrere Stunden, in denen ich meine Kollegen in doppelter Geschwindigkeit hörte, führten zu zwei Erkenntnissen: Erstens sollte ich meine Kopie von Weihnachten mit den Chipmunks Und zweitens erforderte die Weiterentwicklung unserer Vorfallsbearbeitungsprozesse Zeit, Mühe und Konzentration. Jedes Unternehmen, unabhängig von der Größe seiner Teams und seiner Infrastruktur, kann großartige Reaktionsprozess auf Vorfälle Aber das geschieht nicht zufällig und auch nicht über Nacht.
Vor vielen Jahren nutzte PagerDuty intern das zwar einfache, aber umständliche Verfahren, alle mit einem allgemeinen Alarm zu alarmieren und sie in eine Telefonkonferenz einzubinden. Das führte zu großem Chaos, selbst bei erfahrenen Mitarbeitern im operativen Bereich. Aufgaben wurden unkoordiniert erledigt, es herrschte oft Unklarheit über die Auswirkungen auf die Kunden usw.
Eines der ersten Dinge, die wir verbessern wollten, war die Überarbeitung der Sprache im Gespräch, wenn jemand Informationen gab oder eine Anfrage an eine andere Person richtete. Wir nahmen uns die Zeit, ein gemeinsames Vokabular zu entwickeln, mit Formulierungen wie „ Gibt es irgendwelche gewichtigen Einwände? Wir begannen daher, die Reaktionszeit bei Störungen zu verkürzen und die Beeinträchtigung der Kunden zu minimieren.
Als nächstes ergab sich eine weitere große Verbesserung, als wir mit der Verwendung begannen Rollen im Stil eines Einsatzführungssystems . Vorab vereinbaren, wer sich um das Problem kümmert (Fachexperten) und wer den Prozess der Bewältigung des Vorfalls selbst übernimmt (Einsatzleiter und damit verbundene Personen).
Dadurch konnten wir die erste Reaktion auf die unbedingt notwendigen Ingenieure beschränken. Vorbei sind die Zeiten der Verwirrung und der Frage „Was ist los?“, die sich in die Leitung einschalteten. Im Laufe der Zeit haben wir eigene Lösungen entwickelt. Anti-Muster bei der Reaktion auf Zwischenfälle wie beispielsweise das Entfernen von störenden und nicht beitragenden Personen aus dem Gespräch, selbst wenn es sich um den CEO handelt.
Ein Großteil der Informationen zu „Betrieb“ oder „Standortzuverlässigkeit“ wird über implizites Wissen weitergegeben, oder mündliches Geschichtenerzählen Einen gut vorbereiteten, umfassenden und humanen Prozess zur Reaktion auf Sicherheitsvorfälle zu entwickeln, sollte nicht so schwierig sein. Unternehmen sollten nicht jeden Aspekt einer erfolgreichen Reaktion auf Sicherheitsvorfälle selbst erarbeiten müssen. Um sich jedoch insgesamt zu verbessern, muss jeder diesem Bereich besondere Aufmerksamkeit widmen.