- PagerDuty /
- Der Blog /
- Best Practices und Einblicke /
- Kontrollieren Sie Ausfallzeiten mit Best Practices zur Vorfallwarnung
Der Blog
Kontrollieren Sie Ausfallzeiten mit Best Practices zur Vorfallwarnung
Viele Lösungen bieten E-Mail-Benachrichtigungen an, um Kunden über Probleme zu informieren. E-Mail-Benachrichtigungen sind effektiv, wenn man den ganzen Tag vor seinem Posteingang sitzt, aber in der Realität ist das meist nicht der Fall. Verpasste Benachrichtigungen verlängern Ausfälle und beeinträchtigen Umsatz und Kundenbindung Ihres Unternehmens. Um schnell über Probleme informiert zu werden, haben sich Tausende von Kunden für PagerDuty entschieden, um effektiv über Vorfälle informiert zu werden. Dieser Beitrag erläutert die PagerDuty Benachrichtigungskonzepte und Best Practices zur Einrichtung, um die Betriebszeit zu erhöhen.
Nutzen Sie die Warnmeldungen
Jeder PagerDuty Benutzer können ihre Kontaktmethoden Und Benachrichtigungsregeln um benachrichtigt zu werden, wie Sie es wünschen. Wenn der primäre Bereitschaftstechniker Warnungen verpasst, können Warnungen an andere Teammitglieder gesendet werden, bis darauf reagiert wird, basierend auf Eskalationsrichtlinien.
- Kontaktmethoden sind die Möglichkeiten, wie wir Sie kontaktieren können, einschließlich Telefon – Mobiltelefon, Privat- und Arbeitstelefon – SMS, E-Mail und Push-Benachrichtigungen.
- Benachrichtigungsregeln sind die Kombinationen von Kontaktmethoden, über die wir Sie benachrichtigen sollen.
- Mithilfe von Eskalationsrichtlinien leiten wir Warnungen automatisch an eine andere Person oder ein anderes Team um, wenn sie vom primären Vorfallsbesitzer übersehen werden.
Wir empfehlen allen Benutzern, mindestens drei Kontaktmethoden und drei Benachrichtigungsregeln einzurichten, um sicherzustellen, dass sie keine Benachrichtigungen verpassen. Standardmäßig gibt es eine Benachrichtigungsregel, die den Vorfallsverantwortlichen sofort per E-Mail benachrichtigt, wenn ihm der Vorfall zugewiesen wird.
Tipp: Richten Sie je nach Art der Vorfälle, die in Ihrem System auftreten, Warnmeldungen basierend auf Ihren Ausfallkosten und den Service-Level-Agreements (SLAs) für Kunden ein.
Eskalationsrichtlinien sind Sicherheitsnetze für übersehene Vorfälle und leiten Warnmeldungen automatisch an bestimmte Benutzer oder Bereitschaftspläne um:
Wir empfehlen Eskalationsrichtlinien für jeden Vorfall. Bei Vorfällen mit hohem Schweregrad sollten Sie diese möglichst frühzeitig an eine andere Person weiterleiten, um eine schnelle Bearbeitung zu gewährleisten.
Notiz: Eskalationsrichtlinien haben Vorrang vor persönlichen Benachrichtigungsregeln. Jeder Benutzer sollte daher seine Benachrichtigungsregeln strenger gestalten als seine Eskalationsrichtlinien. Wenn Sie Probleme nach 30 Minuten eskalieren, sollten Sie alle Ihre persönlichen Benachrichtigungen innerhalb dieses Zeitraums abschließen. So stellen Sie sicher, dass Sie alle Benachrichtigungen erhalten und die Möglichkeit haben, zu reagieren, bevor die Benachrichtigung an ein anderes Teammitglied weitergeleitet wird.
Standard PagerDuty Sicherheitsnetze
Alarme können bestätigt, neu zugewiesen oder gelöst werden. Falls ein bestätigter Alarm vergessen wird, werden alle Dienste mit einer Standard-30-Minuten-Warnung Zeitüberschreitung bei der Vorfallbestätigung. Dadurch wird ein Vorfall in den Trigger-Status zurückgesetzt und die Alarme werden neu gestartet. Wenn ein Vorfall versehentlich offen gelassen wird, wird PagerDuty standardmäßig Vorfälle automatisch lösen die 4 Stunden geöffnet sind.
Reduzieren Sie die Alarmmüdigkeit
Nachdem Sie uns mitgeteilt haben, wie Sie bei Vorfällen kontaktiert werden möchten, hilft PagerDuty Ihnen, den Aufwand für Alarme zu verringern, indem Deduplizierung , Bündeln und Anhängen Warnungen. Vorfälle aus API-basierten Integrationen werden automatisch dedupliziert, gebündelt und angehängt. Mit E-Mail-basierten Integrationen können Sie spezifische Filter setzen, um die Alarmmüdigkeit zu reduzieren.
- Wenn dieselben Ereignisse an PagerDuty gesendet werden, werden sie dedupliziert und nur ein Vorfall in PagerDuty erstellt. Dadurch werden mehrere Warnungen für denselben Vorfall vermieden, und nur ein Vorfall löst Warnungen basierend auf den Benachrichtigungsregeln eines Benutzers aus.
- Wenn Ereignisse für denselben offenen Vorfall eingehen, werden sie an den offenen Vorfall angehängt und es wird keine neue Warnung gesendet.
- Wenn mehrere Vorfälle gleichzeitig ausgelöst und demselben Benutzer zugewiesen werden, erhält der Benutzer eine gebündelte Warnung, die ihn über diese Vorfälle informiert.
Bei einem Ausfall erschweren mehrere Warnmeldungen zum selben Problem die Suche nach der Ursache. Mit PagerDuty sparen Sie Zeit bei der Diagnose und können sich auf die Behebung konzentrieren. Diese drei Funktionen helfen Benutzern, kritische Probleme schneller zu erkennen. Mit PagerDuty reduzieren Sie die Anzahl der Warnmeldungen und verringern Ausfallzeiten.
Setzen Sie PagerDuty -Alarmierungskonzepte in die Tat um
1. Wenn PagerDuty eine Warnung von Ihrem Überwachungssystem empfängt, wird in PagerDuty ein Vorfall erstellt. Wenn mehrere Warnungen für dasselbe Problem vorliegen, werden diese von PagerDuty zu einem Vorfall zusammengefasst, um die Anzahl der Warnungen zu reduzieren.
2. Mehrere Bereitschaftsteams können mit PagerDuty verbunden werden. PagerDuty leitet Warnmeldungen an die richtige Bereitschaftsperson weiter, um das Problem zu beheben. Teams legen Eskalationsrichtlinien fest. um festzulegen, wer benachrichtigt werden soll, wenn die Hauptperson ihre Benachrichtigungen verpasst.
3. Sobald die primäre Bereitschaftsperson gefunden ist, werden Alarme in der von ihr gewählten Kombination gesendet. Basierend auf den Eskalationsrichtlinien des Teams wird der nächste Bereitschafts-Superheld zum Einsatz gerufen, wenn die primäre Person nicht antwortet.
4. Wenn Benutzer Warnungen erhalten, können sie den Vorfall per SMS oder Telefonanruf oder innerhalb der mobilen App oder der Web-Benutzeroberfläche bestätigen, lösen oder neu zuweisen.



