Der Blog

3 wichtige neue Funktionen – Teil 2: Die Nagios -> PagerDuty API

von Andrew Miklas 3. August 2010 | 2 Minuten Lesezeit

Dies ist der zweite Artikel einer dreiteiligen Serie über die neuesten Verbesserungen an PagerDuty. Schauen Sie sich unbedingt an Teil 1 Und Teil 3 .

Nagios Wir haben gerade eine Nagios API für PagerDuty. Wenn Sie Nagios zur Überwachung Ihrer Hosts verwenden, müssen Sie nicht mehr den E-Mail-Integrationsmechanismus von PagerDuty nutzen, um SMS und Anrufe von Ihrer Nagios-Installation zu empfangen. Stattdessen können Sie den E-Mail-Schritt komplett umgehen und Nagios Problem-, Bestätigungs- und Wiederherstellungsmeldungen direkt über eine HTTPS-API an PagerDuty übermitteln lassen.

Add a Nagios service

Der Hauptvorteil der API gegenüber der E-Mail-Integration besteht darin, dass PagerDuty Vorfälle nun automatisch schließen kann, sobald Nagios die Behebung des Problems meldet. Sie erhalten 30 Minuten nach der Problembehebung keinen Anruf mehr, weil Sie vergessen haben, den Vorfall in PagerDuty als erledigt zu markieren! Da die API es uns ermöglicht, zwischen PROBLEM- und RECOVERY-Meldungen zu unterscheiden, startet PagerDuty bei einer RECOVERY-Meldung nicht mehr fälschlicherweise den Alarmprozess.

Die Verwendung der neuen Nagios-API ist ganz einfach: Erstellen Sie einfach einen Nagios-Dienst in PagerDuty, kopieren Sie ein kleines Perl-Skript auf Ihren Nagios-Server und fügen Sie Ihrer Nagios-Konfiguration einen „Pseudo-Kontakt“ hinzu, der dem neuen Dienst entspricht. Eine Schritt-für-Schritt-Anleitung dazu finden Sie in unserer Nagios-Integrationshandbuch .

Wenn Sie Ihre Nagios-Installation auf die API umstellen, profitieren Sie von zahlreichen geplanten neuen PagerDuty -Funktionen. Eine Funktion, die wir gerade entwickeln, ist die Möglichkeit, dass PagerDuty E-Mail- und SMS-Benachrichtigungen versendet, sobald ein Vorfall behoben ist. So sehen Sie auf einen Blick, ob sich ein Problem von selbst gelöst hat, bevor Sie um 3 Uhr morgens aufstehen.

Eine weitere Funktion, die wir derzeit prüfen, ist die Möglichkeit, Nagios-Alarme verschiedenen PagerDuty Eskalationsrichtlinien basierend auf Nagios-Variablen wie HOSTGROUP und SERVICEGROUP zuzuordnen. Teilen Sie uns mit, ob dies für Sie nützlich ist – wir würden gerne wissen, ob Ihr Operations-Team dies nutzen würde.