- PagerDuty /
- Blog /
- Bewährte Verfahren und Erkenntnisse /
- Intelligente Alarmgruppierung trainieren
Blog
Intelligente Alarmgruppierung trainieren
Komplexe Vorfälle sind sowohl anstrengend als auch alltäglich. In diesem Fall bezeichne ich Vorfälle als „komplex“, die mehrere, voneinander unabhängige Benachrichtigungen in Ihrer Alarmmanagement-Plattform umfassen. Möglicherweise sind diese Vorfälle logisch getrennt, weil die zugrunde liegenden Systeme oder Dienste als weniger eng miteinander verknüpft angesehen wurden, als sich in der Realität herausstellte. Oder vielleicht hat das Verhalten, auf das die Benachrichtigungen hinweisen, mehrere potenzielle Ursachen, was die Zuordnung von Vorfällen erschwert.
Unser Standardverhalten
Standardmäßig werden Titel mit ähnlichem Text gruppiert. Es ist wichtig zu verstehen, dass zwischen „textuell ähnlich“ und der logischen Gruppierung von Warnmeldungen durch unser Gehirn ein Unterschied besteht. Ein Beispiel: Meldungen wie „Die Speicherauslastung auf dem Host ist hoch (> 90 %“ und „Die Speicherauslastung des Hosts ist hoch (> 95 Diese Meldungen würden wahrscheinlich gruppiert, da sie sich nur durch ein einziges Wort unterscheiden (das hervorgehobene Perzentil). Nehmen wir hingegen an, Sie hätten Warnmeldungen wie „Speicherauslastung hoch (>X%) auf Server $NAME in Region $REGION“. Diese Meldungen klingen für uns ähnlich, da sie einem Muster folgen, enthalten aber zu viele unterschiedliche Wörter, als dass die intelligente Warnmeldungsgruppierung sie standardmäßig korrekt gruppieren könnte. Im nächsten Beitrag erkläre ich ausführlich, wie Sie Titel erstellen, die die intelligente Warnmeldungsgruppierung standardmäßig besser erkennt. Dieser Absatz soll Ihnen lediglich den Einstieg erleichtern.
Genauigkeit durch Zusammenführen verbessern
Das Ziel der Standardeinstellungen ist es, Ihnen einen Ausgangspunkt zu bieten. Sobald Sie die intelligente Alarmgruppierung regelmäßig nutzen, werden Sie das Verhalten wahrscheinlich an Ihre spezifischen Umgebungen anpassen müssen. Wichtig ist zunächst, dass das maschinelle Lernen ausschließlich mit dem Titelfeld trainiert wird. In unserem nächsten Beitrag beschreibe ich genauer, wie Sie die Titel Ihrer Vorfälle für die Verwendung mit dieser Funktion optimieren können. Außerdem ist zu wissen, dass die intelligente Alarmgruppierung Zusammenführungen nutzt, um Muster zu verstärken oder neu zu lernen. Um eine zu aggressive Mustererkennung zu vermeiden, ändert die intelligente Alarmgruppierung ihr Verhalten nach 5–10 Zusammenführungen.
Wie man Vorfälle zusammenführt
Es gibt mehrere Möglichkeiten, Vorfälle zusammenzuführen. Eine davon ist, dass nach Auswahl eines oder mehrerer Vorfälle in der PagerDuty Benutzeroberfläche die Schaltfläche „Vorfälle zusammenführen“ erscheint.
Hier wird eine Liste der aktiven Vorfälle angezeigt:

Ich habe das oberste Kästchen neben „Status“ ausgewählt, um alle zum Zusammenführen auszuwählen:

Sobald die Vorfälle ausgewählt sind, erscheint ein Dialogfeld, in dem Sie aufgefordert werden, den Vorfall auszuwählen, mit dem die Vorfälle zusammengeführt werden sollen. In diesem Fall habe ich den aktuellsten ausgewählt:

Zur Verdeutlichung habe ich den Titel des Vorfalls geändert, um zu zeigen, dass die Vorfälle zusammengeführt wurden. Das Ergebnis sieht wie folgt aus:

Wichtig zu wissen ist, dass beim Zusammenführen von Vorfällen der übergeordnete Vorfall ungelöst bleibt, die zusammengeführten Vorfälle jedoch alle gelöst werden. Das sieht folgendermaßen aus:

Die andere Möglichkeit zum Zusammenführen von Vorfällen besteht darin, den Vorfall zu öffnen und die Option „Mit einem anderen Vorfall zusammenführen“ aus dem Dropdown-Menü „Mehr“ auszuwählen:

Bei dieser Methode werden die Vorfälle nicht automatisch in einer Dropdown-Liste angezeigt. Sie müssen daher die Vorfallnummer kennen und auf „Vorfall suchen“ klicken:

Weitere Informationen zum Zusammenführen von Vorfällen finden Sie in unserer Supportdokumentation zu diesem Thema Wichtig: Derzeit können keine Vorfälle wieder zusammengeführt werden – führen Sie die Zusammenführung daher mit Bedacht durch!
Falls Warnmeldungen getrennt werden müssen
Es kann vorkommen, dass Sie Warnmeldungen aus fälschlicherweise zusammengeführten Vorfällen verschieben müssen, sei es durch Gruppierung oder den oben beschriebenen manuellen Prozess. Wichtig ist hierbei, dass Sie die Warnmeldungen nicht in die ursprünglichen Quellvorfälle zurückverschieben können. Der Grund dafür ist, dass Vorfälle beim Zusammenführen als abgeschlossen gelten und Warnmeldungen nicht in einen abgeschlossenen Vorfall verschoben werden können.
Stattdessen müssen Sie einen neuen Vorfall erstellen und die gewünschten Benachrichtigungen dorthin verschieben, da Benachrichtigungen nicht in einen abgeschlossenen Vorfall verschoben werden können. Benutzer können manuell einen neuen Vorfall über die blaue Schaltfläche „Neuer Vorfall“ in der Benutzeroberfläche erstellen. Weitere Informationen dazu finden Sie in unserer Dokumentation. Supportdokumentation zur Erstellung/Verwaltung von Incidents Die
Wichtigste Erkenntnisse und wie es von hier aus weitergeht
Dieser Beitrag war ganz schön umfangreich! Was du dir merken solltest:
- Die intelligente Alarmgruppierung verwendet das Titelfeld des Vorfalls, um zu bestimmen, welche Vorfälle gruppiert werden sollen.
- Durch das Zusammenführen von Vorfällen, die gruppiert werden sollen, können Sie das Zuordnungsverhalten manuell ändern.
- Es sind 5-10 Zusammenführungen erforderlich, damit die intelligente Alarmgruppierung ihr Standardverhalten ändert.
- Seien Sie beim Zusammenführen von Vorfällen vorsichtig, da Zusammenführungen nicht direkt aufgehoben werden können. Sie müssen einen neuen Vorfall erstellen und die Benachrichtigungen gegebenenfalls dorthin verschieben.
In diesem Beitrag habe ich erwähnt, dass die intelligente Alarmgruppierung das Titelfeld verwendet, um zu bestimmen, welche Vorfälle zusammengeführt oder getrennt werden. In unserem nächsten Beitrag erkläre ich, wie Sie dies beim Erstellen Ihrer Vorfallstitel nutzen können.
Alle Beiträge dieser Reihe werden das verwenden ei-architecture-series tag Bitte werfen Sie unbedingt auch einen Blick auf die anderen Beiträge dieser Serie.