Der Blog

DevOps-Monitoring ist eine Multitool-Angelegenheit

von Twain Taylor 17. August 2016 | 4 Minuten Lesezeit

Überwachungstools sollen das Leben erleichtern für DevOps Team und die Wahl des richtigen DevOps-Überwachungstools können den entscheidenden Unterschied für effiziente Arbeitsabläufe und zufriedenere Endbenutzer ausmachen.

DevOps-Überwachungstools gibt es in allen Größen und Formen

Das übliche Überwachungs-Toolkit für die meisten DevOps-Teams umfasst (ist aber nicht beschränkt auf):

  • ein Tool zur Infrastrukturüberwachung
  • ein Tool zur Anwendungsleistungsüberwachung (APM)
  • ein Protokollanalysetool

Lassen Sie uns in jede Ebene eintauchen und sehen, wo sie in Ihren DevOps-Überwachungsprozess passen.


Infrastruktur- und Netzwerküberwachung

Diese Tools überwachen die gesamte Infrastruktur und das Netzwerk, einschließlich Server, Router und Switches. Tools zur Infrastrukturüberwachung helfen, Probleme der IT-Infrastruktur zu erkennen und zu beheben, bevor sie kritische Geschäftsprozesse beeinträchtigen. Sie unterstützen Sie bei der Planung von Upgrades, bevor veraltete Systeme Ausfälle verursachen. Tools zur Infrastruktur- und Netzwerküberwachung stellen außerdem sicher, dass wartungsbedingte Ausfälle die Benutzer nur minimal beeinträchtigen.

Durch die Überwachung der Infrastrukturintegrität erhalten Sie einen Eindruck vom Zustand der darauf laufenden Anwendungen. Diese Tools überwachen die Anwendung jedoch nicht als komplettes Servicepaket. In diesem Sinne verfolgen sie einen traditionellen Überwachungsansatz, der für moderne Cloud-Anwendungen nicht optimal geeignet ist.
Beispiel: Nagios , Zabbix

Überwachung der Anwendungsleistung

Tools zur Anwendungsleistungsüberwachung überwachen, wie der Name schon sagt, die Leistung Ihrer Anwendung. Sie bieten Einblick in das Verhalten Ihrer Anwendung, erkennen Probleme, die sich auf Benutzer auswirken, und helfen, diese schnell zu beheben. Sie überwachen den gesamten Anwendungsfluss und erstellen Traces mit Details auf Codeebene. APM-Tools enthalten umfassende Diagnosefunktionen, mit denen Sie die genaue Codezeile finden, die möglicherweise zu Leistungseinbußen oder -ausfällen führt.

APM-Tools tragen zwar zur Leistungssteigerung bei und verhindern Latenzen und Ausfallzeiten, es gibt jedoch viele Probleme, die eine umfassendere Fehlerbehebung erfordern, als APM leisten kann. Diese Probleme erfordern die Indizierung und Suche in Protokolldateien. Leider analysieren APM-Tools keine Protokolldateien und können keine Sicherheitsangriffe erkennen. Für diese Art der Analyse benötigen Sie ein Protokollanalysetool.
Beispiel: Neues Relikt , AppDynamics

Protokollanalyse

Protokollanalysetools bieten eine skalierbare und zuverlässige Möglichkeit zum Speichern und Indizieren Ihrer Protokolldateien. Sie können Dateien schnell durchsuchen, detaillierte Analysen auf Basis der Protokolldaten erstellen und anhand der Protokolldatei Sicherheitsverletzungen und Cyberangriffe überwachen. Sie bieten jedoch keine umfassende Überwachung der Anwendungsleistung und können keine Spuren auf Codeebene aufdecken.
Beispiel: Splunk , Elastischer Stapel

 

Keines dieser Tools ist für eine End-to-End-Überwachung gedacht. Wenn Sie sich bei einem Vorfall ausschließlich auf eines dieser Tools verlassen, fehlt Ihnen immer ein Schlüsselelement für die Lösung.


Überwachungstools erfordern noch mehr Überwachung

Selbst wenn Sie alle diese Tools zur Überwachung einsetzen, kann es im Falle eines Vorfalls chaotisch werden. Die Warnmeldungen all dieser Tools liefern viele sich überschneidende Daten. Das bedeutet, dass Sie hektisch zwischen den Tools hin- und herspringen müssen, was sowohl bei Ihren Teams als auch bei Ihren Kunden für viel Frust sorgt. Ihre MTTRs verlängern sich, da Sie mit einer Datenflut aus Ihrem gesamten Toolset konfrontiert sind. Vereinfachen Sie Ihr Monitoring mit Incident Management.

Sie benötigen eine Vorfallmanagement-Plattform

ES , und insbesondere DevOps-Teams, haben längst erkannt, dass Monitoring eine Kombination aus erstklassigen, eng miteinander integrierten Tools erfordert. Angesichts all dieser Überwachungstools, die manchmal widersprüchliche Informationen und eine überwältigende Menge an Warnmeldungen liefern, benötigen Sie eine zentrale Anlaufstelle, um sie alle zu verwalten und eine Zusammenfassung des jeweiligen Vorfalls bereitzustellen. Eine Vorfallmanagement-Plattform wie PagerDuty ist entscheidend, um bei einem Vorfall Ordnung in das Chaos zu bringen.

Incident-Management-Tools heben das Signal aus dem Rauschen hervor, indem sie Warnungen mit niedriger Priorität unterdrücken und Warnungen mit hoher Priorität zur richtigen Zeit an die richtigen Personen weiterleiten. Durch die nahtlose Integration in nahezu jedes andere Überwachungssystem bieten Incident-Management-Tools Ihnen echtes End-to-End-Monitoring, das jedes DevOps-Team benötigt. Dank ausgereifter Benachrichtigungsoptionen ermöglichen Incident-Management-Lösungen wie PagerDuty Ihrem Team die Wahl der Benachrichtigungsart. Darüber hinaus können diese Prozesse automatisiert werden, was Ihrem Team viel Zeit spart und die Gesamt-MTTR verkürzt.

Alle Ihre Überwachungstools bieten einzigartige Funktionen, die jedoch bei unzureichender Verwaltung für viel Verwirrung sorgen. Auch wenn Sie möglicherweise nie ein universelles Überwachungstool für DevOps haben, können Sie mit der Möglichkeit, alle Ihre Überwachungstools zentral zu verwalten und die empfangenen Daten mit einer Plattform wie PagerDuty zu filtern, der Perfektion schon sehr nahe kommen.