Blog

Rendre les astreintes aussi indolores que possible

par Jérémy Bourque 5 avril 2017 | 4 min de lecture

Conçu pour le développeur

Le rôle du développeur logiciel a évolué rapidement. En tant que développeur, vous savez déjà que votre implication ne s'arrête pas au déploiement d'un service en production. Elle s'étend désormais à l'ensemble du processus. gérer ce service et être disponible pour intervenir en cas de problèmes de production dès qu'ils surviennent.

C'est une lourde responsabilité. La première fois que vous avez été d'astreinte, vous avez peut-être ressenti de l'inquiétude et de l'incertitude. Et si quelque chose casse ? Et si je ne peux pas le réparer ? Finalement, quelque chose a cassé et vous l'avez réparé. Et c'était génial !

Être d'astreinte peut être un peu intimidant, surtout au début. Mais c'est aussi gratifiant. C'est gratifiant non seulement parce que c'est très satisfaisant de résoudre un problème, surtout lorsqu'il n'a même pas encore impacté vos clients, mais aussi parce que cela vous permet de devenir meilleur dans votre travail. Cela signifie que vous êtes responsable de l'expérience client et cela vous aide à développer de l'empathie envers vos clients. Cela vous aide également à développer de l'empathie envers vous-même, ou plutôt, envers votre futur vous qui, un jour, se retrouvera à 3 heures du matin à scruter un tableau de bord de surveillance du service en essayant de comprendre ce qui se passe.

On ne peut pas acquérir cette expérience pratique uniquement par la formation. C'est grâce à cette expérience directe qu'on apprend à concevoir des services plus résilients, mieux évolutifs, capables de gérer les pannes avec plus d'élégance et d'identifier les problèmes en cas de dysfonctionnement. Et c'est assurément gratifiant.

Fonctionnalités spécifiquement destinées aux développeurs

Chez PagerDuty, nous avons développé de nouvelles fonctionnalités et API pour rendre les astreintes aussi simples que possible, afin que vous puissiez profiter des avantages de cette expérience sans les soucis et l'incertitude qui l'accompagnent parfois.

Vous devez d'abord savoir (a) quand vous êtes d'astreinte et (b) pour quels services. Avec le calendrier d'astreinte, c'est plus simple que jamais. Ce calendrier visuel affiche vos périodes d'astreinte avec une liste détaillée des procédures et niveaux d'escalade pour chacune. L'indicateur « maintenant » vous permet de voir facilement la fin de votre astreinte actuelle et le début de la suivante.

L'un des principaux avantages de PagerDuty est qu'il centralise les événements provenant de tous vos systèmes de surveillance et fournit des outils puissants pour vous aider à exploiter ces données. Avec la nouvelle API Événements v2 vous pouvez facilement intégrer vos systèmes de surveillance et normaliser les données d'événements dans le Format d'événement commun PagerDuty (PD-CEF) Cela vous permet de consulter les détails des alertes dans PagerDuty dans un format cohérent, sans vous soucier des différents noms utilisés par les outils de surveillance pour les mêmes champs.

Le Console de commandes des opérations vous aide à visualiser vos données d'alerte. Vous pouvez l'utiliser pour identifier rapidement les services bruyants, puis utiliser la suppression pour éviter d'être notifié d'événements non pertinents. Lorsque vous recevez une notification pour une action requise, Application de santé des infrastructures permet de visualiser instantanément le « rayon d'action » du problème afin de déterminer s'il est localisé ou généralisé.

Lorsque vous avez besoin d'une vue détaillée, Recherche d'alertes Vous pouvez personnaliser l'affichage du tableau des alertes et trouver rapidement les informations pertinentes grâce à des champs normalisés, ce qui est essentiel pour minimiser la charge cognitive. Vous pouvez ajouter les colonnes souhaitées et supprimer celles qui ne le sont pas. Vous pouvez ensuite effectuer des recherches, filtrer et trier les colonnes pour trouver rapidement ce que vous cherchez.

Avec la version améliorée API de création d'incidents Vous pouvez automatiser le processus de création d'un nouvel incident pour représenter le problème sous-jacent à résoudre. Ensuite, vous pouvez utiliser… API de fusion des incidents L'objectif est de fusionner les alertes pertinentes décrivant les symptômes du problème en un seul incident le représentant dans son ensemble. Cela vous permet de concentrer votre intervention sur un incident unique dans PagerDuty , regroupant toutes les alertes pertinentes. Ce contexte est utile à l'équipe d'intervention, et un enregistrement unifié de l'intervention facilite l'analyse ultérieure et le débriefing.

Nous proposons également des solutions plus complètes que de simples flux de travail de résolution pour vos alertes de surveillance. Puisque des problèmes peuvent survenir où que vous soyez, nous offrons désormais la possibilité de créer manuellement des incidents depuis l'application mobile PagerDuty .

Vous n'êtes peut-être pas de garde, mais vous venez de constater un problème lors de votre paiement. Ou votre fournisseur de services vient de vous signaler un problème urgent concernant votre compte. Créez un incident via l'application mobile pour une intervention immédiate.

PagerDuty aide les développeurs à réussir

Chez PagerDuty, nous savons ce que c'est que d'être d'astreinte — nous le sommes aussi. C'est pourquoi nous nous engageons à fournir la meilleure solution disponible. développeurs de soutien Disponibilité sur appel. Ces nouvelles améliorations et fonctionnalités s'inscrivent dans cet engagement. Elles ont déjà optimisé notre service d'astreinte et nous sommes ravis de vous les proposer à présent.