Le pouvoir des revues opérationnelles
L'automne dernier, nous avons introduit Analyse de PagerDuty Nous sommes ravis d'annoncer aujourd'hui la disponibilité générale de notre produit Analytics, qui combine les données de réponses des machines et des humains afin de fournir des informations opérationnelles permettant aux organisations d'optimiser leurs processus et d'améliorer leurs résultats commerciaux. Dans le cadre de notre offre de produits Analytics enrichie, nous lançons également une série de tableaux de bord de performance opérationnelle prescriptifs.
Avant de concevoir ces tableaux de bord, nous avons observé et interrogé de nombreuses organisations performantes sur leurs meilleures pratiques d'amélioration des processus et analysé en profondeur leurs indicateurs. À partir de ces informations, nous avons créé des tableaux de bord basés sur la structure de vos équipes, services et organisation dans PagerDuty.
Notre objectif était de reproduire les processus naturels, de promouvoir les meilleures pratiques et de suivre les rituels des équipes qui adoptent déjà une approche DevOps, afin de les aider à mieux collaborer pour résoudre des problèmes plus complexes. L'utilisation de ces tableaux de bord lors de vos revues opérationnelles régulières avec vos équipes et parties prenantes vous permettra d'avoir des échanges plus constructifs et percutants.
Pourquoi utiliser des revues opérationnelles ?
Il existe de nombreux avantages à posséder un « Vous le construisez, vous en êtes propriétaire » La culture DevOps, qui se traduit par des livraisons logicielles plus rapides et plus fréquentes, ainsi que par une responsabilisation accrue (chaque développeur étant responsable de son code et de sa correction en cas de problème), présente toutefois un risque réel de surcharge de travail pour les équipes. Celles-ci peuvent alors être amenées à prendre des décisions opérationnelles sous-optimales afin d'obtenir des résultats immédiats, au détriment d'une évolutivité et d'une stabilité à long terme.
Il est clair que cela n'est pas souhaitable et qu'il faut l'éviter. L'un des meilleurs moyens pour les équipes d'améliorer leur prise de décision est de procéder à des revues opérationnelles régulières. Nos échanges avec nos clients nous ont permis de constater que des revues opérationnelles efficaces ne se limitent pas à la collecte et à la présentation de données. Elles visent également à aider les équipes à prendre des décisions éclairées, pertinentes et, souvent, argumentées, concernant les meilleures pratiques de gestion des services modernes.
Ces évaluations devraient fournir des analyses approfondies non seulement des outils et services développés et utilisés, mais aussi des comportements au sein des équipes. Les responsables peuvent également s'en servir pour déceler les tâches non planifiées et/ou la charge opérationnelle superflue que les équipes peuvent rencontrer.
Nous avons également appris que l'une des fonctionnalités les plus précieuses de toute solution analytique devrait être de permettre aux équipes et aux parties prenantes de réaliser des analyses opérationnelles plus efficaces au sein de l'organisation. documentation des revues opérationnelles open source vous aidera, vous et votre équipe, à mieux comprendre la santé globale de votre équipe, la durabilité et la fiabilité de votre service, ainsi que son impact sur l'entreprise, en fournissant à votre équipe les informations nécessaires pour améliorer continuellement sa maturité opérationnelle.
Tableaux de bord d'évaluation opérationnelle
Nous pensons qu'une discussion sur ce qui a bien fonctionné et ce qui pourrait être amélioré devrait être prévue à la fin de chaque rotation afin que les intervenants soient conscients des problèmes potentiels tels que « Quel service a été le plus difficile ? » et « Quelle alerte a réveillé les gens pendant la nuit ? »

Notre Tableau de bord du rapport de transfert d'astreinte aide le prochain rotation d'astreinte Il s'agit de déterminer les points sur lesquels ils souhaitent se concentrer. De plus, l'adoption de ce modèle proactif permettra aux équipes de réagir plus rapidement en cas d'incident, car elles disposeront des informations nécessaires pour prendre des décisions plus éclairées en un temps record.
Ce tableau de bord a été conçu pour améliorer l'efficacité de votre équipe et doit être utilisé lors de la revue opérationnelle hebdomadaire. Il présente un résumé de plusieurs indicateurs, notamment :
- Toutes les transmissions effectuées au cours de la semaine
- Indicateurs individuels des répondants
- Nombre d'interruptions
- Nombre d'interruptions de sommeil
Outre les revues de passation de consignes en cas d'astreinte, nous souhaitons également nous concentrer sur les Les équipes de services techniques conçoivent, gèrent et surveillent Les services techniques constituent les fondements de votre écosystème de surveillance PagerDuty et permettent aux équipes de détecter et de résoudre rapidement les problèmes d'infrastructure. Compte tenu de leur importance, nous encourageons les équipes à analyser les performances de l'ensemble des services. Cependant, nous constatons souvent que les équipes ignorent les notifications des services les plus sollicités, car le nombre d'alertes reçues est tel qu'il est tout simplement trop long de les traiter. Distinguer les alertes exploitables du bruit. et plus facile de les ignorer que de les aborder.
C'est là que notre Tableaux de bord des opérations de service Ces outils vous offrent une vue détaillée de l'état et de la fiabilité de vos services techniques, avec des indicateurs tels que le temps d'indisponibilité total, le décalage de performance et le MTTR, pour vous aider, vous et votre équipe, à identifier les domaines à améliorer afin de prévenir les problèmes majeurs.
Puissance de PagerDuty Analytics + Visibilité PagerDuty
Associé à Visibilité de PagerDuty — qui offre une vue d'ensemble des données machine, des services, des équipes, des actions correspondantes et de l'impact commercial de la réponse aux incidents — les tableaux de bord d'analyse opérationnelle aident votre équipe à coordonner efficacement les efforts de réponse. communiquer avec les parties prenantes concernant le temps nécessaire à votre équipe pour résoudre les problèmes imprévus, ainsi que le temps et le travail requis pour résoudre les incidents majeurs.
Vous souhaitez consulter les résultats de votre équipe ? Contactez-nous Inscrivez-vous pour un essai gratuit !