- PagerDuty /
- Der Blog /
- PagerDuty Universität /
- In 5 einfachen Schritten zur Ursache (Ursachenanalyse)
Der Blog
In 5 einfachen Schritten zur Ursache (Ursachenanalyse)
Was ist eines der ersten Dinge, die Sie tun sollten, wenn Ihnen über PagerDuty ein Vorfall zugewiesen wird? Wenn Sie sofort „Bestätigen!“ dachten, liegen Sie nicht falsch, aber danach geht es darum, das Problem so schnell und schmerzlos wie möglich. Der erste Schritt zur Lösung besteht darin, zu untersuchen, was den Vorfall überhaupt verursacht hat, damit Sie ihn leicht beheben können.
Die Ursachenanalyse* der PagerDuty Plattform umfasst eine Reihe von Funktionen, die Ihnen als Einsatzkräften möglichst viel Kontext und verwertbare Informationen liefern. Durch die Anzeige vergangener und verwandter Vorfälle sowie Einblicke in die Häufigkeit von Vorfällen erhalten Einsatzkräfte schnell das nötige Situationsbewusstsein, um die wahrscheinliche Ursache zu ermitteln, die Triage zu beschleunigen und letztendlich schneller zu lösen. Mögliche Ursprungspunkte basierend auf historischen Daten werden ebenfalls hervorgehoben, um den Kontext zu ergänzen.
Hier sind die fünf Stellen auf der Seite mit den Vorfalldetails, die Ihnen bei der Untersuchung der möglichen Grundursachen helfen:
- Ausreißervorfall
Wenn Sie einen Vorfall zum ersten Mal öffnen, suchen Sie nach dem Ausreißervorfall Klassifizierungsbezeichnung. Diese Bezeichnung befindet sich direkt unter dem Vorfallnamen und kann als „Häufig“, „Selten“ oder „Anomalie“ klassifiziert werden. Anhand dieser Klassifizierungsbezeichnung können Sie schnell erkennen, ob der Vorfall bereits aufgetreten ist und wie Sie aufgrund Ihrer bisherigen Erfahrungen darauf reagieren können. Bewegen Sie den Mauszeiger über die Bezeichnung, um die Definitionen zu lesen.
- Vergangene Vorfälle
Nachdem Sie die Häufigkeit ermittelt haben, mit der der Vorfall beim Dienst aufgetreten ist, navigieren Sie zum Vergangene Vorfälle weiter unten auf der Seite. Eine Heatmap zeigt an, wann sich in den letzten sechs Monaten ähnliche Vorfälle ereignet haben. Achten Sie auf Muster in den Farben – dunklere Farben bedeuten eine höhere Vorfalldichte – oder bewegen Sie den Mauszeiger über die Farben der Heatmap, um weitere Details zu den entsprechenden Vorfällen anzuzeigen. Darunter finden Sie Details zu den fünf häufigsten Vorfällen wie dem offenen Vorfall (sofern vorhanden!) sowie Informationen dazu, wann sie aufgetreten sind und wer den Vorfall zuletzt geändert hat. Hinweis: Diese Person ist eine großartige Ressource, wenn Sie sie zu ihren Maßnahmen befragen oder ihre Notizen zu dem Vorfall sehen möchten! Klicken Sie auf den verlinkten Titel, um die Seite mit den Vorfalldetails zu öffnen.
- Ähnliche Vorfälle
Eine weitere schnelle Informationsquelle ist die Ähnliche Vorfälle Registerkarte. Hier sehen Sie, ob es aktuell laufende Vorfälle gibt, die mit Ihrem Problem in Zusammenhang stehen könnten, und zwar über alle Dienste hinweg. Im Gegensatz dazu werden bei „Vergangene Vorfälle“ nur ähnliche Vorfälle im selben Dienst angezeigt. Wenn Sie den Umfang eines Vorfalls im gesamten Unternehmen kennen (ist er isoliert oder Teil eines größeren Problems?), können Sie die Auswirkungen besser einschätzen und schnell erkennen, mit wem Sie zusammenarbeiten müssen, um das Problem zu beheben.
- Mögliche Ursprünge
Starten Sie Ihre Triage-Bemühungen mit dem Mögliche Ursprünge Widget auf der Seite mit den Vorfalldetails. Dieses Widget berechnet den wahrscheinlichen Ursprungsprozentsatz basierend auf historischen Daten, z. B. ob der Vorfall direkt vor oder nach einem ähnlichen Ereignis wie dem aktuell offenen Vorfall aufgetreten ist.
- Änderungskorrelation
Und schließlich kann die Problemlösung erheblich beschleunigt werden, wenn Sie über alle Änderungen an Ihrer Infrastruktur oder Ihrem Code informiert sind, die den Vorfall verursacht haben könnten. Änderungskorrelation , angezeigt unter „Letzte Änderungen“ auf der Detailseite des Vorfalls, zeigt die drei letzten Änderungsereignisse an, die für einen Vorfall aufgrund der Zeit, der zugehörigen Dienste oder des maschinellen Lernens von PagerDuty am relevantesten sind. Die letzten Änderungsereignisse geben Aufschluss darüber, warum die Plattform das Ereignis angezeigt hat, sodass Sie mögliche Ursachen leicht eingrenzen können.
Wissenscheck! Richtig oder falsch: Die Auf der Registerkarte „Vergangene Vorfälle“ werden gelöste Vorfälle desselben Dienstes angezeigt, während unter „Verwandte Vorfälle“ nur offene Vorfälle anderer Dienste angezeigt werden. (Siehe Antwort unten auf der Seite.)
Wie ist es gelaufen? Denken Sie daran: Dies sind fünf Stellen, an denen Sie nachsehen können, um schnell einen Kontext zu erhalten und Ihre Triage-Bemühungen anzukurbeln.
Um Vorfälle schneller zu lösen und Ausfallzeiten weiter zu reduzieren, kombinieren Sie diese Funktionen zur Ursachenanalyse mit Funktionen zur Rauschunterdrückung und Ereignisorchestrierung. Zur Auffrischung besuchen Sie die Event Intelligence-Kurse der PagerDuty University und beweisen Sie anschließend Ihre Fähigkeit, intelligenter und nicht härter zu arbeiten, indem Sie die Event Intelligence-Zertifizierung abschließen!
Ressourcen für die nächsten Schritte:
Event Intelligence-Kurse finden Sie auf dem eLearning-Portal der PagerDuty University.
- Rauschunterdrückung
- Ereignisorchestrierung
- Ursachenanalyse
Informationen zur Event Intelligence-Zertifizierungsprüfung finden Sie unter diese Seite unter „Zertifizierung für Spezialprodukte“. Zur Feier des Starts dieser neuen Serie bieten wir eine kostenlose Registrierung für die Prüfung für 30 Tage an, also registrieren Sie sich jetzt!
*Fußnote: Obwohl wir diese Funktionskategorie als Ursachenanalyse bezeichnen, prognostiziert oder identifiziert PagerDuty keine Ursachen. Unsere Funktionen helfen vielmehr, den Kontext von Vorfällen zu schaffen, um eine schnellere Lösung zu ermöglichen. Bemerkenswert ist auch, dass in der Branche zunehmend von einer wahrscheinlichen oder unmittelbaren Ursache gesprochen wird, anstatt von einer einzigen wahren „Grundursache“ zu sprechen.
Antwort auf die Wissensüberprüfung: Falsch. Zwar ist die Aussage richtig, dass „Vergangene Vorfälle“ nur gelöste Vorfälle aus der Vergangenheit anzeigt, die sich auf demselben Dienst befunden haben, doch „Verwandte Vorfälle“ untersucht andere aktive Vorfälle – offene und kürzlich gelöste – über ALLE Dienste hinweg (einschließlich des Dienstes, auf dem sich Ihr aktueller Vorfall befindet), um festzustellen, ob Vorfälle mit Ihrem aktuellen Vorfall in Zusammenhang stehen.