- PagerDuty /
- Der Blog /
- ITOps und moderne Betriebsabläufe /
- Vorfallmanagement für ITOps-Teams: Lernen, zu zentralisieren
Der Blog
Vorfallmanagement für ITOps-Teams: Lernen, zu zentralisieren
Kann ITOps Teams das Vorfallmanagement zentralisieren? Wenn Sie im ITOps-Bereich arbeiten, lautet Ihre erste Antwort auf diese Frage möglicherweise ein klares „Nein“.
Schließlich umfasst das Aufgabenspektrum von ITOps so breit gefächert und vielfältig, dass es beim Incident Management nahezu unmöglich erscheint, alle Aufgaben unter einen Hut zu bringen. Von der Serveradministration über die Bereitstellung von Desktop-PCs bis hin zum Helpdesk-Support – ganz zu schweigen von der Abwicklung von Einkäufen und der Verwaltung unabhängiger Auftragnehmer – ITOps-Teams übernehmen alles.
Das unterscheidet ITOps deutlich von den meisten anderen Bereichen eines Unternehmens. In der Programmierabteilung können Sie Ihre Entwicklungs- und Fehlermanagementprozesse mithilfe eines Code-Repositorys zentralisieren. Im Vertrieb verwalten Sie Produkte und Kundenkontakte über eine zentrale Plattform wie Salesforce. Anders verhält es sich bei ITOps, da es so viele verschiedene Aufgaben abdeckt.
Wir möchten Ihnen zeigen, dass zentralisiertes Vorfallmanagement für ITOps kein Wunschtraum bleiben muss. ITOps übernimmt zwar so viele unterschiedliche Aufgaben, dass es keine universelle Plattform für die Überwachung und Reaktion auf Probleme gibt. Dennoch können Sie das Vorfallmanagement in Ihrer gesamten Infrastruktur zentralisieren.
Wie erreichen Sie das? Mit einem Vorfallmanagement-Tool, das sich in alle Bereiche Ihres ITOps-Workflows integrieren lässt.
Optimale Nutzung Ihrer Überwachungsdienste
Lassen Sie uns anhand eines einfachen Beispiels zeigen, wie Ihr ITOps-Team das Vorfallmanagement zentralisieren kann – auch wenn ITOps selbst nicht so zentralisiert ist.
Als ITOps-Experte in einem kleinen oder mittleren Unternehmen müssen Sie wahrscheinlich drei Hauptinfrastrukturtypen im Auge behalten. Der erste Teil sind Ihre lokalen Server, die Sie beispielsweise zum Hosten einer lokalen Dateifreigabe oder zum Bereitstellen von Websites nutzen. Der zweite Teil ist Ihre öffentliche Cloud, in der Sie Datensicherungen durchführen. Der dritte Teil sind lokale Workstations, die betriebsbereit gehalten und mit Ihren lokalen und Cloud-Servern verbunden werden müssen.
Die Planung des Incident Managements für jeden Teil dieser Infrastruktur ist knifflig. Manche Überwachungssysteme behaupten zwar, Bare-Metal-Server, Cloud-Infrastrukturen und PCs gleichermaßen gut unterstützen zu können. Doch selbst wenn das zutrifft, sind sie wahrscheinlich auf keinen dieser Bereiche spezialisiert. Sie bieten lediglich allgemeine Überwachung ohne erweiterte Funktionen für bestimmte Infrastrukturtypen.
Aus diesem Grund empfiehlt es sich, eine Kombination von Überwachungsdiensten zu nutzen, die auf die verschiedenen Bereiche Ihrer Infrastruktur zugeschnitten sind. Für Ihre Cloud profitieren Sie wahrscheinlich am meisten von einem Cloud-zentrierten Überwachungssystem, wie zum Beispiel AWS CloudWatch . SolarWinds könnte für Ihre lokalen Geräte und Ihr lokales Netzwerk nützlich sein. Und Sie könnten etwas wie Splunk um alle Protokolldaten zu analysieren, die Ihre vielen Geräte ausspucken.
Ein Tool für das Vorfallmanagement, das alle Probleme löst
Jede der genannten Überwachungsplattformen verfügt über ein Warn- oder Benachrichtigungssystem, das jedoch möglicherweise nicht die erforderliche Zuverlässigkeit bietet. Selbst wenn dies der Fall wäre, möchte kein ITOps-Team gleichzeitig Warnmeldungen von mehreren verschiedenen Plattformen – in unterschiedlichen Formaten und mit unterschiedlichen Inhalten – erhalten. Unter diesen Bedingungen wäre es äußerst schwierig sicherzustellen, dass die richtigen Warnmeldungen die richtigen Personen zur richtigen Zeit erreichen.
Die gute Nachricht für ITOps-Experten: Das Vorfallmanagement muss nicht so verwirrend und unorganisiert sein. Selbst wenn Sie mehrere Überwachungssysteme für die verschiedenen Bereiche Ihres Betriebs einsetzen, können Sie den Empfang aller Warnmeldungen zentralisieren.
Ebenso wichtig ist, dass Sie die Verteilung der Benachrichtigungen an Ihr Team zentralisieren können. Beispielsweise können einige Ihrer Überwachungsdienste möglicherweise keine SMS-Benachrichtigungen versenden. Wenn Sie diese Dienste mit einer zentralen Vorfallmanagement-Plattform verknüpfen, die Benachrichtigungen in das gewünschte Format übersetzt, können Sie sie bei Bedarf an die Telefone Ihrer Administratoren weiterleiten.
Nicht zuletzt können Sie mit einer zentralisierten Incident-Management-Lösung redundante Warnmeldungen vermeiden. Bei einer Netzwerküberlastung kann es zu Benachrichtigungen nicht nur vom Dienst kommen, der Ihre Netzwerk-Switches überwacht, sondern auch vom Monitoring-Stack auf Ihren Servern, der eine fehlerhafte Verbindung erkennt.
Mehrere Warnmeldungen, die auf dasselbe Kernproblem zurückzuführen sind, sorgen für Verwirrung in Ihrem Team und verlängern die Reaktionszeit. Zentralisiertes Vorfallmanagement hingegen stellt sicher, dass das Team Benachrichtigungen pro Vorfall erhält, nicht pro Überwachungssystem. Das reduziert den Informationsfluss und zeigt sofort, was los ist.
Normalerweise scheint das Hinzufügen eines weiteren Tools zu Ihrem ITOps-Workflow nur zu einer Aufblähung zu führen. Das mag in vielen Kontexten zutreffen. Aber im Falle des Incident Managements ist die Implementierung einer Lösung, wie PagerDuty, Durch die Zentralisierung von Benachrichtigungen kann Ihr ITOps-Team den Nutzen der bereits vorhandenen Überwachungstools deutlich steigern.