Blog

Skalierung des Vorfallmanagements

von Patrick O'Fallon 28. März 2017 | 4 Minuten Lesezeit

Vorfallmanagement ist von entscheidender Bedeutung für den Erfolg jedes modernen ITOps-Team Ähnlich wie bei der Expansion eines Unternehmens kann auch die Skalierung des Incident-Managements zu Wachstumsschmerzen führen. Mit dem Wachstum der Geräte-, Anwendungs- und Systemlandschaft – die jeweils eigene Anforderungen stellt – … Überwachung Genauso verhält es sich auch mit dem Alarmaufkommen und der Komplexität des Bereitschaftsdienstes. Bei einer steigenden Anzahl von Ingenieuren im Team kann es schwierig sein, neue Benachrichtigungsrichtlinien und Regelungen für den Betrieb außerhalb der regulären Arbeitszeiten einzuführen und umzusetzen, um die Effizienz des Teams und eine faire Lastverteilung zu gewährleisten. Und der Drang hin zu Hybridmodelle der IT Und bimodale IT-Umgebungen Dies kann auch das Incident-Management erschweren. Mit einigen bewährten Techniken lässt sich dies jedoch skalieren. Vorfallmanagement auf geplante, überlegte, organisierte und effektive Weise.

Lassen Sie sich nicht von Ihrer sich verändernden ITOps-Umgebung ausbremsen.

Um das Problem zu verstehen, betrachten wir zunächst ein Beispiel, bei dem die Skalierung zu einem ernsthaften Problem wird.

Sie haben Ihren Incident-Management-Prozess endlich optimiert, nur um kurz darauf zu erfahren, dass Ihr Unternehmen ein neues Geschäft übernommen hat. Nun übernimmt Ihr Ops-Team zusätzlich zu Ihren bisherigen Aufgaben auch die IT-Betreuung der neuen Umgebung. Auf den ersten Blick erscheint Ihnen das perfekte Szenario: Sie können einfach dieselben Tools und Methoden auf diese völlig neue Infrastruktur anwenden.

Die Realität ist jedoch selten perfekt – das neue Unternehmen nutzt möglicherweise einen anderen Technologie-Stack und andere Überwachungstools für das Vorfallmanagement und Methoden. Obwohl dieses Szenario unglaublich entmutigend ist, ähnelt es sehr jedem Wachstumsszenario – sei es der Ausbau Ihres IT-Teams oder Einführung agilerer Methoden und bimodale ITOps-Strukturen. Unabhängig vom jeweiligen Skalierungsszenario finden Sie unten einige Ideen für Organisationen, die ihre Überwachung, ihr Incident-Management und ihr Team skalieren möchten.

Identifizieren Sie die wichtigsten Skalenbereiche.

Implementieren Sie neue Hardware, Software oder Services? Gibt es neue Komplexitäten in Ihrer zukünftigen IT-Betriebsumgebung? Ist Ihr Entwicklerteam gewachsen? Haben Sie eine Anwendung übernommen, in der Codefehler gemeldet werden müssen? In jedem Fall müssen Sie die Bereiche identifizieren, in denen Ihr IT-Betriebsteam gezwungen ist, seine Abläufe zu skalieren.

Überwachungstools

Die flächendeckende Abdeckung Ihrer Monitoring-Tools in Ihrer gesamten Systemarchitektur ist für den Erfolg der Skalierung von entscheidender Bedeutung. Um sich dieser Veränderung anzupassen, sollten Sie keine Scheu davor haben, mehrere oder völlig neue Monitoring-Systeme außerhalb Ihrer aktuellen Architektur zu implementieren. Ziel dieser Systeme ist es, … vollständige Stack-Sichtbarkeit Und in vielen Fällen erfordert dies Implementierung verschiedener Überwachungstools um unterschiedliche und neue Systeme angemessen zu überwachen. Um jedoch eine organisierte Skalierung wirklich zu unterstützen, muss es eine Möglichkeit geben, normalisieren Duplikate entfernen, korrelieren und gewinnen Umsetzbare Erkenntnisse aus all diesen Daten Alle von diesen Überwachungstools generierten Ereignisse müssen zentralisiert in einem einzigen Hub Von dort aus können sie priorisiert und an den richtigen Bereitschaftstechniker weitergeleitet werden.

Geräuschreduzierung

Sobald die Überwachung eingerichtet ist, besteht das Ziel darin, die Daten für eine effektive Störungsbehebung zu verstehen. Die Anpassung des Routing-Verhaltens Ihrer Überwachungstools und die Konfiguration geeigneter Schwellenwerte sind ein wichtiger nächster Schritt, um sicherzustellen, dass Ihr Team keine Probleme hat. Alarmmüdigkeit Sobald Sie neue Tools implementiert haben, ist es entscheidend, diese Daten zu aggregieren und nicht relevante Warnmeldungen aus den Paging-Benachrichtigungen eines gemeinsamen Incident-Management-Systems auszublenden oder herauszufiltern, um zu helfen. den Lärm reduzieren und die Sichtbarkeit von Vorfällen in Ihrer gesamten Systemarchitektur zu verbessern.

Vorfallmanagement

Eine umfassende Plattform für das Vorfallmanagement Es hilft Ihnen, Daten aus all Ihren Tools zu integrieren und mit Ihrem Unternehmen zu wachsen. Es vereint nicht nur Ihre verschiedenen Überwachungsalarme in einem gemeinsamen System, sondern unterstützt auch das Wachstum Ihres Entwicklerteams, ohne dabei Unklarheiten im Ressourcenmanagement zu verursachen. Darüber hinaus fördert es mehr Verantwortlichkeit und eine besser organisierte Zusammenarbeit. Zusätzlich können Sie mithilfe von Vorfallanalysen Ihrem Vorgesetzten zeigen, wie effektiv Ihr ITOps-Team Ausfälle managt und behebt.

Umfang und Komplexität werden nicht verschwinden.

Die IT-Betriebswelt entwickelt sich rasant, doch eines ist klar: IT-Teams sind angehalten, ihre Abläufe in nahezu allen Bereichen zu skalieren. Herkömmliche IT-Betriebsumgebungen werden zunehmend durch hybride und agile Architekturen und Frameworks ersetzt. Nutzer fordern kontinuierlich schnelleren und zuverlässigeren Datenzugriff über verschiedene Geräte hinweg. Daher benötigen IT-Betriebsteams einen Skalierungsplan. Angesichts der zunehmenden Folgen von Ausfallzeiten ist ein effektives Incident-Management unerlässlich geworden.