- PagerDuty /
- Blog /
- Gestion et réponse aux incidents /
- Activez la maintenance. Partez explorer. Cassez des trucs.
Blog
Activez la maintenance. Partez explorer. Cassez des trucs.

Il faut parfois tâtonner. L'expérimentation, les essais et les erreurs font partie intégrante de l'apprentissage et constituent la clé d'un avenir meilleur. Reed Richards Il n'est pas entré dans la Zone Négative du jour au lendemain, et il a peut-être libéré par inadvertance une ou deux créatures monstrueuses aspirant à la conquête du monde. Mais ce n'est pas grave. On invente le pistolet laser nécessaire pour résoudre le problème, au moment opportun.
Vous réparez le problème et vous passez à autre chose.
En améliorant votre infrastructure technique, il peut arriver que vous sachiez pertinemment que vous allez faire une erreur (parfois volontairement). Auparavant, cela pouvait se traduire par des appels intempestifs à vos collaborateurs lors de déploiements, de transitions, de migrations de bases de données ou de changements de DNS. Vous auriez peut-être envoyé des annonces à votre équipe du genre : « Ignorez les messages que vous allez recevoir pendant les 30 prochaines minutes. Je suis en train de remanier notre infrastructure Chef et je m’attends à quelques fausses alertes. »
Vous n'avez plus besoin de faire ça.
Vous pouvez désormais activer temporairement, maintenance programmée sur de nombreux services PagerDuty . Nombre d'entre vous ont déjà découvert cette fonctionnalité en naviguant quotidiennement sur le site web de PagerDuty . Je salue ces courageux utilisateurs ! J'ai vu des utilisateurs programmer des opérations de maintenance avec des descriptions simples comme « Déploiement », « Maintenance trimestrielle », « Redémarrage RDS » et « fdsaf » (très informatif 😉).
J'ai aussi vu des messages de désespoir : « Je suis harcelé d'appels et, à ce que je sache, tout va bien. »
Tout est normal. C'est ainsi que cette fonctionnalité a été conçue. Parfois, on ne sait tout simplement pas ce qui ne va pas. Parfois, on a juste besoin d'une pause pour réfléchir. Mettez votre service défaillant en pause pendant une heure grâce à la « Maintenance immédiate en 1 clic ». Identifiez le problème. Réparez-le. Le service se réactivera automatiquement.

Les fenêtres de maintenance sont également conçues pour être entièrement automatisables. Vous pouvez programmer vos processus de déploiement pour désactiver un ensemble de services pendant les cinq minutes suivant le déploiement, le temps que les liens symboliques soient modifiés, que la charge moyenne se stabilise et que tout autre élément susceptible de perturber votre système de surveillance actuel suive son cours. Personne n'apprécie d'être alerté pour un problème qui ne nécessite aucune intervention (ou qui pourrait être résolu à long terme, mais pour lequel vous n'avez pas le budget nécessaire immédiatement).
Les fenêtres de maintenance sont donc ouvertes. Explorez, améliorez, cassez des choses. On vous attendra une fois terminé.