- PagerDuty /
- Blog /
- Integrationen /
- Wie man die mittlere Reparaturzeit (MTTR) mit PagerDuty und Puppet Relay verkürzt
Blog
Wie man die mittlere Reparaturzeit (MTTR) mit PagerDuty und Puppet Relay verkürzt
Über Melissa Sussmann: Melissa Sussmann ist Technical Product Marketing Lead für Relay bei Puppet. Sie schreibt gerne über DevOps, Site Reliability, Open Source und Blockchain-Technologie.
DevOps- und SRE-Teams stehen unter enormem Druck, die mittlere Wiederherstellungszeit (MTTR) bei der Behebung von Störungen zu verkürzen. Angesichts der zunehmenden Verbreitung von Cloud-Diensten und der steigenden Komplexität von DevOps-Toolchains müssen Entwickler heute nicht nur deren Nutzung erlernen, sondern sie auch bei Störungen mitten in der Nacht beheben können. Das Problem: Viele Prozesse zur Reaktion auf Störungen sind nach wie vor manuell – es werden Runbooks und Ad-hoc-Skripte zusammengebastelt und die Reaktion der Mitarbeiter koordiniert. Dieser „digitale Klebebandansatz“ führt zu dem, was wir als „die …“ bezeichnen. DevOps-Müllhalde „was letztendlich die mittlere Reparaturzeit erhöht.“
Wie PagerDuty und Relay zusammenarbeiten
PagerDuty ist die branchenführende Plattform für digitales Betriebsmanagement, die zuverlässige Benachrichtigungen, automatische Eskalationen, Bereitschaftsplanung und weitere Funktionen bietet, um Teams dabei zu helfen, Infrastrukturprobleme schnell zu erkennen und zu beheben.
Relay von Puppet ist eine ereignisgesteuerte Automatisierungsplattform, die alle Tools und Technologien vereint, die DevOps-Ingenieure für die effektive Verwaltung einer Cloud-Umgebung benötigen. Im Gegensatz zu vielen bestehenden Workflow-Automatisierungstools kann Relay intelligent auf externe Signale reagieren, indem es ereignisbasierte Trigger mit einer leistungsstarken Workflow-Engine auf einer einzigen Plattform kombiniert.
Die neueste Integration von Relay und PagerDuty beseitigt die bisherigen „digitalen Flickwerk“-Probleme, indem sie wiederverwendbare, ereignisgesteuerte Workflows erstellt, um Vorfälle dank Relays ereignisbasiertem Automatisierungsansatz schneller zu bearbeiten. PagerDuty -Nutzer können nun:
- Alarmdaten anreichern: Mit dem neuen Änderungsereignisse Relay wurde auf dem PagerDuty Summit vorgestellt und erweitert Warnmeldungen um Diagnoseinformationen, um die Lösungszeit zu verkürzen, indem mehr Kontext zur Warnmeldung bereitgestellt wird.
- Automatisierte Vorfallskommunikation: Ob es um das Erstellen eines Slack-Kanals, das Aktualisieren eines Jira-Tickets oder das Benachrichtigen von Teammitgliedern geht – Relay stellt sicher, dass die Kommunikation zeitnah und aktuell ist.
- Automatische Behebungsabläufe auslösen: Durch das Melden von PagerDuty Vorfällen können Relay-Workflow-Läufe initiiert werden, um häufig auftretende Probleme sicher und schnell zu beheben.
Beispiel: Wie man Kommunikationspläne für Vorfälle automatisiert
Ein wichtiger Weg zur Reduzierung der mittleren Reparaturzeit (MTTR) ist die Formalisierung eines Kommunikationsplans für Vorfälle. Es ist entscheidend, dass Teams über einen soliden Plan zur Rollenverteilung und zur Einrichtung von Kommunikationskanälen verfügen, um die Reaktionszeit zu verkürzen. Relay kann diesen Workflow für Sie automatisieren, indem es den diensthabenden Mitarbeiter mit einer Nachricht kontaktiert, die den Inhalt des Vorfalls detailliert beschreibt.
Relay nutzt „Trigger“ und „Schritte“, um Aktionen zu automatisieren. Schritte sind wiederverwendbar, modular und kombinierbar – beispielsweise das Abrufen von Benutzerinformationen, das Versenden von Slack- und Twilio-Nachrichten und die Nutzung der PagerDuty Event API, um weitere Informationen zu einem Vorfall bereitzustellen. „Trigger“ basieren auf Cloud-Ereignissen, Git-Ereignissen, Überwachungsalarmen, Tickets und Vorfällen. Im folgenden Beispiel sehen wir, wie ein PagerDuty Vorfall mithilfe der genannten Schritte den folgenden Workflow zur Vorfallsbehebung auslöst.
Wenn ein neuer PagerDuty Vorfall gemeldet wird, ermittelt Relay die E-Mail-Adresse des diensthabenden Mitarbeiters, identifiziert diesen in Jira und Slack und erstellt ein Jira-Ticket für den Produktionsvorfall. Anschließend richtet Relay einen Slack-Kanal als Kommandozentrale für Produktionsvorfälle ein, lädt den diensthabenden Mitarbeiter und den zuständigen Engineering Manager ein und verlinkt das erstellte Jira-Ticket als Thema des Kanals. Abschließend sendet Relay eine Nachricht an den Slack-Kanal und veröffentlicht einen Hinweis mit den Erwartungen an das Vorgehen bei Produktionsvorfällen.
Mithilfe der neuen, innovativen Änderungsereignisse von PagerDuty ergänzt Relay die Informationen zum Vorfall um angereicherte Warnmeldungen. So kann der Bereitschaftsdienst schnell auf den Vorfall reagieren, ohne dass der Aufwand für die Ticketerstellung und die Kommunikation über die Auslöser des Workflows reduziert wird.
Probieren Sie diesen Workflow hier aus.

Passen Sie Ihre Reaktion auf Vorfälle an
Für PagerDuty Benutzer stehen mehrere vorgefertigte Arbeitsabläufe zur Verfügung, die Sie hier finden: Relays Integrationsseite. Mithilfe dieser Workflows können Sie automatisch ein Ticket in Jira erstellen, eine Nachricht an Slack senden und eine Twillo-SMS versenden, wenn ein PagerDuty Vorfall ausgelöst wird.
Da jeder Arbeitsablauf etwas anders ist, lassen sich Relay-Workflows individuell an verschiedene Anwendungsfälle anpassen. Relay bietet kontextbezogene Hilfe in der Seitenleiste. Mit dieser Funktion können Sie die Bibliothek mit Integrationen und Schritten durchsuchen und so Ihren Workflow ganz einfach anpassen.

Melde dich für den Staffellauf an!
Nutzen Sie Relay mit PagerDuty , um Ihre Reaktionszeit bei Störungen zu verkürzen und die Transparenz zu verbessern. Eine kurze mittlere Lösungszeit (MTTR) ist entscheidend für erfolgreiches DevOps-Management. Durch ereignisgesteuerte Automatisierung verkürzt sich Ihre Reaktionszeit erheblich. Relay erleichtert dies durch Workflows, die häufig auftretende und bekannte Probleme beheben, die Teams bereits identifiziert haben. Weitere Informationen zu Relay finden Sie auf unserer Website unter [Link einfügen]. relay.sh und melde dich für unsere kostenlose Betaversion an!