Der Blog

Optimieren Sie die Triage mit Warnmeldungen und Unterdrückung

von Sean Higgins 22. November 2016 | 4 Minuten Lesezeit

Als zentrale Drehscheibe DevOps Und IT-Betrieb Viele Unternehmen verlassen sich auf PagerDuty , um sich über unerwartetes Verhalten einer Komponente ihrer IT-Infrastruktur zu informieren. Wenn Sie PagerDuty bereits verwendet haben, hatten Sie wahrscheinlich schon mit mehreren Vorfällen im Zusammenhang mit einem einzigen Problem zu kämpfen, für die Sie jeweils benachrichtigt wurden. Dies ist typischerweise der Fall, wenn Sie redundante Überwachungssysteme konfiguriert haben oder wenn ein einzelner Ausfallpunkt oder eine Leistungsminderung einen Dominoeffekt verursacht, bei dem mehrere Tools gleichzeitig Warnungen auslösen.

Um diesem Problem zu begegnen, haben wir unser Datenmodell grundlegend überarbeitet. Wir haben das Konzept einer Warnung in PagerDuty neu definiert: als Objekt, das den Status des Überwachungstools verfolgt. Die Verwendung von Warnungen in PagerDuty bildet die Grundlage für zwei spannende neue Funktionen: Alarm-Triage und -Unterdrückung.

Einführung der Alert Triage

Mit der Verfügbarkeit des neuen Warnmeldungs-Triage Mit dieser Funktion können Sie verwandte Warnmeldungen in einem einzigen Vorfallobjekt gruppieren, was ein echtes End-to-End-Vorfallmanagement ermöglicht. Die Antwortenden werden nicht mehr auf einzelne, isolierte Symptome aufmerksam gemacht. Stattdessen konzentrieren sich die Lösungs-Workflows nun auf ein Vorfallobjekt, das tatsächlich ein reales, servicebeeinträchtigendes Problem oder einen Ausfall darstellt. Diese Funktion definiert die intelligente Triage und Interaktion von Kunden mit den Daten ihrer Systeme neu, um Störungen zu reduzieren, die funktionsübergreifende Zusammenarbeit zu verbessern und die Lösungszeiten zu verkürzen.

Alarme werden bei neuen PagerDuty -Diensten automatisch aktiviert, und Sie können die neuen Funktionen zur Alarmtriage sofort nutzen. Für bestehende Dienste, bei denen die Konfiguration sinnvoll ist, klicken Sie einfach auf „Dienst bearbeiten“ und aktivieren Sie die Option „Alarme und Vorfälle erstellen“.

incident-behavior

Wenn ein Dienst so konfiguriert ist, Erstellen von Warnungen und Vorfällen , erstellen alle umsetzbaren Warnungen einen übergeordneten Vorfall. Um verwandte Warnungen in einem einzigen Vorfall zusammenzufassen, wählen Sie zwei oder mehr Vorfälle in der Vorfallliste aus, drücken Sie „Zusammenführen“ und wählen Sie den Vorfall aus, in dem alles zusammengeführt werden soll.

merge-incidents

Wenn Sie mehrere Vorfälle zusammenführen, können Sie die Vorfallzusammenfassung problemlos bearbeiten, um das jeweilige Problem genau wiederzugeben, sodass die Helfer sich schnell einarbeiten können.

merge-incidents-summary

Vorteile der Alarmtriage

Wenn es darum geht, einen reibungsloseren Workflow zur Vorfallslösung zu ermöglichen, bietet Alert Triage viele großartige Vorteile.

seamless-incident-resolution-workflow

  • Zentralisieren Sie wichtige Warninformationen Anstatt mehrere Warnmeldungen unabhängig voneinander und ohne Korrelation und Konsolidierung zu bearbeiten, können die Einsatzkräfte jetzt einen einzelnen Vorfall untersuchen, um sich schnell einen Überblick zu verschaffen.
  • Alle betroffenen Dienste anzeigen – Identifizieren Sie schnell alle Dienste, die vom Vorfall betroffen sind.
  • Optimieren Sie die funktionsübergreifende Übergabe – Dies ist besonders wertvoll für NOC- und First-Level-Responder, da sie jetzt für die Neuzuweisung nur mit einem einzigen Objekt interagieren müssen, anstatt einzelne Warnungen manuell neu zuzuweisen oder zu eskalieren.
  • Reduzieren Sie die Alarmmüdigkeit – Die Helfer werden jetzt nur noch bei einem einzigen Vorfall mit dem gesamten konsolidierten Alarmkontext benachrichtigt, anstatt mehrere Male von isolierten Tools, die redundante Alarme senden.
  • Richten Sie ein Einsatzkommando für eine bessere Zusammenarbeit ein – Reaktions-Workflows wie die Mobilisierung und Konferenzschaltung von Einsatzkräften konzentrieren sich jetzt auf das erweiterte Vorfallobjekt mit allen relevanten Zusammenhängen, was die Kommunikation optimiert.
  • Nutzen Sie Massenaktionen für erhöhte Geschwindigkeit – Wenn für einen übergeordneten Vorfall eine Aktion ausgeführt wird, wird diese automatisch auf alle untergeordneten Warnungen angewendet und umgekehrt.

Die Nutzung von Warnmeldungen und der neuen Warnmeldungs-Triage-Funktion ist ein wichtiger Baustein für die Optimierung von PagerDuty und steht allen Kunden kostenlos zur Verfügung. Wir empfehlen Ihnen dringend, die folgenden Support-Artikel zu lesen, um mehr zu erfahren:

Zögern Sie nicht, uns zu kontaktieren support@pagerduty.com Wenn Sie Fragen oder Feedback haben, beantworten wir diese gerne. Wir hoffen, dass Sie und Ihre Teams mit Alert Triage die Vorteile einer optimierten Reaktion auf Vorfälle nutzen können.