- PagerDuty /
- Blog /
- Non classé /
- Plan directeur d'un système de planification des astreintes
Blog
Plan directeur d'un système de planification des astreintes
La série sur les meilleures pratiques en matière de planification des astreintes est de retour ! première série de bonnes pratiques d'astreinte Nous avons abordé la question du matériel nécessaire et de la manière dont les personnes de garde souhaitent être alertées. deuxième partie de la série Nous avons abordé la question de savoir qui devrait faire partie d'une politique d'escalade des astreintes.
La meilleure façon de gérer toute panne est d'anticiper. De la mise en place de plannings prévisibles à l'analyse des tendances des incidents, suivez ces 5 bonnes pratiques pour créer un système d'astreinte efficace et être prêt à faire face à toute situation d'urgence informatique.
1. Restez cohérent. Avant tout, votre planning d'astreinte doit être prévisible, régulier et équitable. Votre équipe ne doit jamais être prise au dépourvu lorsqu'elle est d'astreinte. Elle doit également disposer des outils adéquats, comme des téléphones portables, pour ne manquer aucune alerte lorsqu'elle est loin de son bureau ou de son domicile.
2. Désignez un responsable (ou une responsable). Une seule personne devrait être chargée de définir le planning d'astreinte, en concertation avec l'équipe bien entendu. Il s'agit généralement du responsable informatique. Idéalement, le planning devrait être automatisé afin qu'une fois configuré, il ne nécessite plus de maintenance constante. En cas de modifications, par exemple pour des absences maladie, il convient d'utiliser des dérogations plutôt que de reconfigurer l'intégralité du planning.
3. Augmentez les effectifs. Une politique d'alerte doit gérer les escalades dans différents scénarios. Si l'ingénieur d'astreinte principal ne résout pas le problème en X minutes, une autre personne doit être avertie au plus vite. Si l'incident est de niveau 1, davantage de personnes doivent être alertées pour résoudre le problème plus rapidement. Il ne faut jamais hésiter à mobiliser plus d'intervenants.
4. Sachez comment vous performez. Une équipe performante maîtrise ses indicateurs de gestion des incidents et peut répondre en moins de 30 secondes à la question : « Combien de fois notre équipe a-t-elle été alertée la semaine dernière ? ». Il est essentiel d’analyser régulièrement les données afin de garantir la mise en place de processus adéquats pour gérer tous les problèmes système et ainsi réduire le nombre total d’incidents et leur délai moyen de résolution (MTTR). Analysez les tendances et catégorisez les alertes au sein du système de surveillance, ou définissez des seuils d’alerte plus pertinents pour limiter la surcharge d’alertes.
5. Pensez à vos clients. Créez une culture d'entreprise où chacun comprend l'importance de garantir le bon fonctionnement de votre logiciel pour vos clients. Un service d'assistance téléphonique performant en découle naturellement. Il est essentiel de recruter les bonnes personnes, soucieuses de fournir un excellent produit à vos clients en permanence.
Mettre en place un système d'astreinte est plus facile à dire qu'à faire. Le changement culturel prend du temps et les processus évolueront. Il est important de ne pas l'instaurer de manière opaque. Sollicitez l'avis de votre équipe sur ce qu'elle considère comme une rotation d'astreinte équitable, sur la manière dont elle souhaite être alertée et sur d'autres points importants. Elle sera ravie de donner son avis et il sera plus facile d'obtenir son adhésion.