Der Blog

Optimierung des Vorfallmanagements für hybride Infrastrukturen

von Christopher Tozzi 15. Juni 2016 | 4 Minuten Lesezeit

Wir schreiben das Jahr 2016 und Ihre Infrastruktur ist wahrscheinlich hybrid. Das bedeutet, dass Ihre Incident-Management-Lösungen auch für hybride Umgebungen bereit sein müssen. Wenn Sie nur lokale Server verwalten müssten und keine virtuellen Netzwerke oder Mikrodienste im Spiel wären, wäre das Vorfallmanagement viel einfacher.

Doch dann würden Sie in der Vergangenheit leben und Windows Server 2003 wäre der neueste große Renner im IT-Betrieb.

Heutzutage ist fast die gesamte Infrastruktur auf die eine oder andere Weise hybrid. Lokale Server und Geräte verschmelzen nahtlos mit öffentlichen und/oder privaten Cloud-Diensten. Die Vernetzung wird von der physischen Ebene abstrahiert. Der Speicher wird skaliert und auf viele Server verteilt, manchmal sogar zwischen Rechenzentren.

Was also soll ein Administrator tun? Die kurze Antwort lautet: Er muss eine hybridfähige Vorfallmanagementlösung einführen. Die ausführliche Antwort finden Sie weiter unten. Dort gebe ich Tipps zur Optimierung des Vorfallmanagements für die heutigen Hybridinfrastrukturen.

Herausforderungen beim Vorfallmanagement bei hybrider Infrastruktur

Lassen Sie uns zunächst die besonderen Herausforderungen skizzieren, die eine hybride Infrastruktur für das Vorfallmanagement mit sich bringt.

  • Ihr Vorfallmanagementteam hat nicht immer physischen Zugriff auf die gesamte Infrastruktur. Wenn sich Ihre Infrastruktur über mehrere Rechenzentren erstreckt und/oder Clouds umfasst, ist es möglich, dass sich ein Administrator an einem Standort nicht am selben Ort befindet wie das Gerät, das einen Alarm auslöst.
  • Sie haben nicht die vollständige Kontrolle über die gesamte Infrastruktur. Öffentliche oder private Clouds könnten auf den Servern anderer Personen gehostet werden (über die Sie nur eingeschränkte Kontrolle haben).
  • Physische Geräte werden von der Infrastruktur abstrahiert. Dadurch wird es schwieriger zu erkennen, ob Warnmeldungen durch Software- oder Hardwareprobleme oder beides verursacht werden. Die Ursache von Warnmeldungen über Dateisystemprobleme auf einem virtuellen Server könnte beispielsweise eine fehlerhafte Festplattenhardware auf dem Host, Software-Dateisystemfehler auf dem Gast oder eine Kombination dieser Ursachen sein.
  • Ihre Infrastruktur ist nicht endlich. Die Skalierung erfolgt ständig, da neue Geräte hinzugefügt oder entfernt werden, der Speicher erweitert wird, Container hoch- und heruntergefahren werden usw.

Die Herausforderungen des Vorfallmanagements mit einer hybriden Infrastruktur lösen

Nachdem wir uns nun mit den Herausforderungen befasst haben, finden Sie hier einige Vorschläge, die Sie bei der Planung einer Vorfallmanagementstrategie für hybride Infrastrukturen berücksichtigen sollten:

  • Einführung eines Vorfallmanagements Plattform (wie PagerDuty) Das Ist intelligent genug, um Warnmeldungen je nach Problemquelle weiterzuleiten. Auf diese Weise erreicht eine in einem Rechenzentrum generierte Warnmeldung garantiert die Administratoren, die die Kontrolle über dieses Rechenzentrum haben, und nicht ein Team an einem anderen Standort.
  • Bereitstellen eines n Vorfallmanagement-Plattform, die flexibles Monitoring und Alarmierung Konfigurationen und lässt sich problemlos in Ihre bestehende Umgebung integrieren Damit meine ich, dass Sie in der Lage sein sollten, unterschiedliche Tools in unterschiedliche Teile Ihrer Infrastruktur zu integrieren, je nachdem, was für den jeweiligen Teil am besten funktioniert. In Ihren öffentlichen Cloud-Servern möchten Sie möglicherweise verwenden AWS CloudWatch , Und Nagios kann Ihre lokalen Server verwalten. Snort oder OSSEC könnten Netzwerkereignisse überwachen. PagerDuty zum Beispiel hat Über 150 sofort einsatzbereite Integrationen , das in Ihre vorhandene Hybrid-Infrastruktur integriert werden kann.
  • Senden Sie alle Warnungen an die Zentralhub . Wenn du haben Wenn Sie mehrere Überwachungsplattformen nutzen, möchten Sie sicherstellen, dass die Warnmeldungen gemeinsam in einer Gruppe oder einem Cluster betrachtet werden. Sonst werden sie schwer zu handhaben und der Versuch, eine Verbindung zwischen möglicherweise verwandten Problemen herzustellen, ist unmöglich . A Plattform wie PagerDuty löst dieses Problem durch die Bereitstellung einer zentralisierter Hub zum Empfangen und Normalisieren aller verschiedenen Alarme aus Ihrem Hybride Infrastruktur.
  • Stellen Sie sicher, dass Ihre Incident-Management-Lösung skalierbar ist. Da die Größe Ihrer Infrastruktur nicht konstant ist, benötigen Sie eine Plattform das eine wechselnde Menge an Warnmeldungen empfangen und speichern kann.
  • Seien Sie anbieterunabhängig. Incident-Management-Lösungen, die nur bestimmte Betriebssysteme oder Dienstanbieter unterstützen, funktionieren nicht für hybride Infrastrukturen. Hybride Umgebungen bestehen normalerweise aus unterschiedlichen Hardware- und Softwarekomponenten und werden von Administratoren verwaltet, die Teile schnell austauschen möchten. Ein Lösung wie PagerDuty ist für diesen Zweck ebenfalls praktisch, da es sich in anbieterspezifische Überwachungssoftware integrieren lässt und die Warnmeldungen dann für die Verwendung über eine flexible, integrierte Vorfallmanagementschnittstelle übersetzt.

Einige der von mir beschriebenen Herausforderungen erscheinen Ihrem Unternehmen im Moment vielleicht nicht so wichtig. Das ist in Ordnung – einige Umgebungen sind noch nicht so hybrid wie andere.

Der Trend geht jedoch eindeutig in Richtung hybrider Infrastrukturen. Je früher Sie Ihre Incident-Management-Lösungen an diese Zukunft anpassen, desto besser sind Sie für die vollständige Migration in hybride Umgebungen gerüstet, ohne dass dies Ihre Fähigkeit zur Überwachung Ihrer Infrastruktur beeinträchtigt.