- PagerDuty /
- Der Blog /
- Vorfallmanagement und -reaktion /
- Open-Source-Veröffentlichung unserer Incident-Response-Dokumentation
Der Blog
Open-Source-Veröffentlichung unserer Incident-Response-Dokumentation
Zuverlässigkeit war schon immer eine der wichtigsten Designüberlegungen bei PagerDuty. (Wir haben sogar Verwenden Sie PagerDuty unter PagerDuty !) Doch was tun wir, wenn das Unerwartete passiert und tatsächlich etwas schiefgeht? Es ist äußerst wichtig, dass wir vorbereitet sind und unsere Systeme so schnell wie möglich wieder voll funktionsfähig machen können. Wir sind stolz darauf, auftretende Probleme schnell zu lösen und unsere Systeme innerhalb des SLAs funktionsfähig zu halten. Wir haben hart daran gearbeitet, und unser Incident-Response-Prozess ist der Ausgangspunkt.
Unsere interne Dokumentation zur Reaktion auf Vorfälle haben wir in den letzten Jahren aufgebaut, indem wir aus unseren Fehlern gelernt haben. Sie beschreibt detailliert die Best Practices unseres Prozesses, von der Vorbereitung neuer Mitarbeiter auf Bereitschaftsdienste bis hin zum Umgang mit schwerwiegenden Vorfällen, sowohl vor als auch nach der Arbeit. Nur wenige Unternehmen sprechen über ihre internen Prozesse im Umgang mit schwerwiegenden Vorfällen. Manchmal gilt es als tabu, das Wort „Vorfall“ in jeglicher Kommunikation überhaupt zu erwähnen. Das möchten wir ändern.
Zu diesem Zweck freuen wir uns, bekannt geben zu können, dass wir nun Open Source sind. Dokumentation der Vorfallreaktion Zur Nutzung durch die Community! Erfahren Sie, wie wir uns auf Vorfälle vorbereiten, größere Vorfälle bewältigen und unsere Techniker für den Bereitschaftsdienst schulen. Wir hoffen, dass andere die Dokumentation als Ausgangspunkt nutzen, um ihre eigenen Prozesse zu formalisieren.
Was ist das?
Der PagerDuty Incident Response-Dokumentation ist eine Sammlung von Best Practices, die den effizienten Umgang mit größeren Vorfällen beschreibt und Informationen zur effektiven Bereitschaftsdienstleistung bietet. Sie vermittelt Erfahrungen aus der Praxis und bietet Schulungsmaterial für den schnellen Einstieg.
Für wen ist es?
Es richtet sich an Bereitschaftspersonal und an Personen, die an einem operativen Vorfallreaktionsprozess beteiligt sind oder einen formellen Vorfallreaktionsprozess einführen möchten.
Warum brauche ich es?
Die Reaktion auf Vorfälle ist ein Thema, das jedes Unternehmen berücksichtigen muss, um seinen Kunden den bestmöglichen Service zu bieten. Normalerweise wird das Wissen über den Umgang mit Vorfällen im Unternehmen im Laufe der Zeit aufgebaut und mit jedem Vorfall verbessert. Während Tools wie PagerDutys Anwendung „Schwerwiegende Vorfälle“ Obwohl wir Ihnen helfen können, sich schnell zu erholen, ist der Prozess, den Sie befolgen, genauso wichtig. Diese Dokumentation hilft Ihnen, Ihre Reaktionszeit bei größeren Vorfällen zu verkürzen, indem sie auf dem Wissen aufbaut, das wir im Laufe der Jahre intern entwickelt haben.
Was ist abgedeckt?
Es deckt alles ab, von der Vorbereitung bis auf Abruf gehen , Definitionen von Schweregrade , Vorfall Anrufetikette bis hin zur Ausführung eines Obduktion (wir bieten sogar unsere Post-Mortem-Vorlage ). Wir schließen sogar unsere Reaktionsprozess bei Sicherheitsvorfällen .
Was fehlt?
Es ist erwähnenswert, dass dies kein exakter Klon unserer internen Dokumentation; einige Informationen wurden entfernt oder geändert. Dinge wie unsere Telefonbrückennummern, Namen interner Tools und Systeme, die (noch) nicht Open Source sind, Bilder unserer Dashboards usw. Wir haben grundsätzlich alles weggelassen, was spezifisch für PagerDuty ist oder was wir für zu proprietär halten, um es zu teilen. Der Großteil der nützlichen Informationen liegt in den Prinzipien und Prozessen, nicht in den Besonderheiten der von uns verwendeten Tools.
Lizenz
Die Dokumentation wird unter der Apache-Lizenz 2.0 bereitgestellt. Das bedeutet, dass Sie die Dokumentation sowohl kommerziell als auch privat nutzen und modifizieren dürfen. Sie müssen jedoch alle ursprünglichen Copyright-Hinweise und die ursprüngliche Lizenzdatei beifügen.
Unabhängig davon, ob Sie PagerDuty -Kunde sind oder nicht, möchten wir Ihnen die Möglichkeit geben, diese Dokumentation intern in Ihrem Unternehmen zu nutzen. Sie können Quellcode anzeigen Die gesamte Dokumentation finden Sie auf unserem GitHub-Konto. Sie können das Repository gerne forken und als Grundlage für Ihre eigene interne Dokumentation verwenden.
Wir ermutigen Sie auch, Pull Requests zu stellen, wenn Sie Verbesserungsvorschläge haben.