- PagerDuty /
- Blog /
- Vorfallmanagement und Reaktion /
- Zusammenfassung der intelligenten Alarmgruppen-Serie
Blog
Zusammenfassung der intelligenten Alarmgruppen-Serie
Mitverfasst von Chris Bonnell, PagerDuty Data Scientist VI
Willkommen zum letzten Beitrag unserer Reihe zur intelligenten Alarmgruppierung in der EI-Architektur. Ich hoffe, Ihnen hat die Reihe gefallen. Falls Sie einen Blick auf unsere vorherigen Beiträge werfen möchten, nutzen Sie bitte den Link. ei-Architektur-Serie Tag. Lasst uns einen Moment innehalten und alles Gelernte noch einmal zusammenfassen.
Wichtigste Erkenntnisse
Die Standardfunktionen für die intelligente Alarmgruppierung basieren auf abstrahierten Mustern im Incident-Management und nutzen Modelle des maschinellen Lernens. Das Tool kann daher viele fundierte Annahmen treffen, jedoch nicht in jeder Umgebung perfekte Übereinstimmungen erzielen. Um dies auszugleichen, können Sie die Gruppierung durch Zusammenführung, Titel und Service-Design optimieren.
Zusammenführungsverhalten
Vorfälle werden über einen Prozess gruppiert, der heißt Zusammenführung in der PagerDuty Anwendung. Generell können alle Vorfälle zusammengeführt werden. Die intelligente Alarmgruppierung analysiert insbesondere das Feld „Alarmtitel“, um zu bestimmen, ob ein einzelner Alarm zusammengeführt oder in einen neuen Vorfall ausgelagert werden soll, wie wir bereits erläutert haben. dieser Beitrag Falls Warnmeldungen fälschlicherweise zu einem gemeinsamen Vorfall zusammengefasst werden, können Sie Maßnahmen ergreifen, um sie zu trennen und an den richtigen Ort zu verschieben. Das Machine-Learning-Modell verstärkt das Verhalten mit jeder Iteration. Daher verbessert sich das zukünftige Verhalten, unabhängig davon, ob die Warnmeldungen beibehalten, zusammengeführt oder verschoben werden.
Alarmtitel
Da die intelligente Alarmgruppierung das Zusammenführungsverhalten auf dem Feld „Alarmtitel“ basiert, haben wir die Grundlagen von Alarmtiteln zusammen mit einigen allgemeinen Prinzipien des maschinellen Lernens behandelt in ein früherer Beitrag Daraus lassen sich drei wichtige Erkenntnisse gewinnen:
- Die Titel von Warnmeldungen sollten sowohl für Menschen als auch für maschinelles Lernen von Nutzen sein, wobei der Schwerpunkt auf maschinellem Lernen liegen sollte, da die übrigen Details des Vorfalls in der Beschreibung enthalten sein sollten.
- Da Maschinen keinen Kontext verstehen können, ist es wichtig, sich zunutze zu machen, was ein Computer als „einzigartig“ und was als „gemeinsam“ identifizieren kann.
- Da die Zeichenanzahl für den in Push-Benachrichtigungen angezeigten Teil des Alarmtitels begrenzt ist, sollte der für den Menschen verständliche Text eher weiter vorne im Titel stehen als weiter hinten.
Um genauer zu erfahren, wie diese implementiert werden können, werfen Sie bitte einen Blick auf den Abschnitt über maschinelles Lernen in diesem Beitrag sowie auf die Einführung in die Verarbeitung natürlicher Sprache für Texte Blogbeitrag im Towards Data Science Blog.
Service Design
Das letzte Konzept, das wir vorgestellt haben, war eine Diskussion über Service-Design Die Grundidee ist, dass ähnliche Warnmeldungen desselben Dienstes standardmäßig als stärker korreliert gelten als Warnmeldungen anderer Dienste. Hierzu gab es einiges zu sagen, denn die Granularität der Dienstdefinitionen bestimmt maßgeblich die Implementierung von „…“. Service In der PagerDuty -Anwendung gilt generell: Wenn Sie sich nicht sicher sind, ob zwei „Elemente“ als separate Dienste behandelt werden sollten, orientieren Sie sich am gewünschten Eskalationsweg. Gehören beide Elemente demselben Team oder denselben Personen an, wird die Eskalation weiterhin unterstützt, wenn sie in der PagerDuty -Anwendung als ein Dienst behandelt werden. Zusätzlich profitieren Sie von einer stärkeren Korrelation ihrer Warnmeldungen. Sind hingegen unterschiedliche Teams verantwortlich oder unterscheiden sie sich logisch so stark, dass eine stärkere Korrelation ihrer Warnmeldungen unerwünscht ist, definieren Sie sie als separate Dienste. Weitere Informationen zu Best Practices für die Definition und Zuständigkeit von Diensten finden Sie in unserer Dokumentation. Leitfaden für den Betrieb eines Full-Service-Eigentümers Die
Wie geht es von hier aus weiter?
Das war's! Vielen Dank, dass Sie sich die Zeit genommen haben, mehr über die optimale Nutzung der intelligenten Alarmgruppierung zu erfahren. Wenn Sie diese Beiträge später noch einmal nachschlagen möchten, speichern Sie sie bitte in Ihren Lesezeichen. ei-architecture-series tag Für weitere Gespräche besuchen Sie bitte unsere Website. Community-Foren Für ausführliche Fragen und Antworten wenden Sie sich bitte an unser Support-Team.