- PagerDuty /
- Blog /
- Gestion et réponse aux incidents /
- Open source de notre documentation de réponse aux incidents
Blog
Open source de notre documentation de réponse aux incidents
La fiabilité a toujours été l'une des principales considérations de conception chez PagerDuty. (Nous utiliser PagerDuty sur PagerDuty !) Mais que faire en cas d'imprévu ? Il est primordial d'être préparés et de pouvoir remettre nos systèmes en parfait état de fonctionnement le plus rapidement possible. Nous sommes fiers de pouvoir résoudre rapidement les problèmes et de maintenir nos systèmes en parfait état de fonctionnement, conformément à nos SLA. Nous avons travaillé d'arrache-pied pour y parvenir, et notre processus de réponse aux incidents est le point de départ de tout.
Notre documentation interne de gestion des incidents est le fruit de nos efforts de développement ces dernières années, tirés des leçons de nos erreurs. Elle détaille les meilleures pratiques de notre processus, de la préparation des nouveaux employés aux astreintes à la gestion des incidents majeurs, en préparation comme en fin de journée. Peu d'entreprises semblent communiquer sur leurs processus internes de gestion des incidents majeurs. Il est parfois tabou de mentionner le mot « incident » dans toute communication. Nous souhaitons changer cela.
À cette fin, nous sommes heureux d’annoncer que nous avons désormais rendu notre documentation de réponse aux incidents À l'usage de la communauté ! Découvrez comment nous nous préparons aux incidents, gérons les incidents majeurs et formons nos ingénieurs à intervenir. Nous espérons que d'autres utiliseront cette documentation comme point de départ pour formaliser leurs propres processus.
Qu'est-ce que c'est?
Le Documentation de réponse aux incidents PagerDuty est un recueil de bonnes pratiques détaillant comment gérer efficacement tout incident majeur susceptible de survenir, ainsi que des informations sur la gestion efficace des astreintes. Il présente les leçons apprises à la dure, ainsi que des supports de formation pour une mise à niveau rapide.
À qui s'adresse-t-il ?
Il est destiné aux praticiens de garde et à ceux impliqués dans un processus de réponse aux incidents opérationnels, ou à ceux qui souhaitent mettre en place un processus formel de réponse aux incidents.
Pourquoi en ai-je besoin ?
La gestion des incidents est un élément essentiel pour chaque organisation afin d'offrir le meilleur service possible à ses clients. En général, les connaissances en matière de gestion des incidents au sein de votre entreprise s'acquièrent au fil du temps, s'améliorant à chaque incident. Des outils tels que PagerDuty Demande d'incident majeur Même si vous pouvez vous rétablir rapidement, la procédure à suivre est tout aussi importante. Cette documentation vous aidera à réduire votre temps de réponse aux incidents majeurs en s'appuyant sur les connaissances que nous avons développées en interne au fil des ans.
Qu'est-ce qui est couvert?
Il couvre tout, de la préparation à être de garde , définitions de gravités , incident étiquette d'appel , jusqu'à la façon de gérer un autopsie (nous fournissons même notre modèle d'autopsie ). Nous incluons même notre processus de réponse aux incidents de sécurité .
Que manque-t-il?
Il convient de noter que ce n’est pas un clone exact de notre documentation interne ; certaines informations ont été supprimées ou modifiées. Il s'agit notamment de nos numéros de téléphone, des noms d'outils et de systèmes internes non (encore) open source, des images de nos tableaux de bord, etc. Nous avons omis tout ce qui est spécifique à PagerDuty ou que nous considérons comme trop confidentiel pour être partagé. L'essentiel des informations utiles concerne les principes et les processus, plutôt que les spécificités des outils que nous utilisons.
Licence
La documentation est fournie sous licence Apache 2.0. En clair, cela signifie que vous pouvez l'utiliser et la modifier, tant à des fins commerciales que privées. Vous devez toutefois inclure les mentions de droits d'auteur originales et le fichier de licence original.
Que vous soyez client PagerDuty ou non, nous souhaitons que vous puissiez utiliser cette documentation en interne, au sein de votre entreprise. Vous pouvez voir le code source Pour toute cette documentation sur notre compte GitHub, n'hésitez pas à dupliquer le dépôt et à l'utiliser comme base pour votre documentation interne.
Nous vous encourageons également à formuler des demandes d’extraction si vous avez des suggestions d’amélioration.