Blog

Santé des opérations informatiques — Visualisée

par David Cooper 21 novembre 2016 | 3 min de lecture

Opérations informatiques Aujourd'hui, les professionnels ont besoin d'une vision globale de l'infrastructure pour résoudre efficacement les incidents, réduire les alertes non exploitables et améliorer en continu leurs capacités de gestion des incidents. Avec la prolifération des architectures de microservices, les applications gagnent rapidement en complexité et génèrent toujours plus de données de télémétrie. Ces tendances accentuent la difficulté d'obtenir une vision d'ensemble. opérations santé Sensibilisation et compréhension de l'impact sur l'activité. De ce fait, les intervenants manquent souvent de visibilité sur la zone d'impact des incidents.

Pour résoudre ce problème, PagerDuty a publié la Application de santé des infrastructures , une application d'intelligence essentielle qui alimente le Console de commandes des opérations .

infrastructure-health

La chronologie ultime

L'application Infrastructure Health offre une vue d'ensemble visuelle de tous les groupes d'alertes répartis sur les services et les hôtes de votre infrastructure informatique. Ces visualisations peuvent être utilisées à plusieurs fins, non seulement pour faciliter la réponse aux incidents, mais aussi pour améliorer la santé et les performances globales de vos applications.

    • Pendant l'échange de tirs

      L'application Infrastructure Health se met à jour en temps réel, affichant un bandeau défilant de droite à gauche au fur et à mesure que les alertes et les événements arrivent.

      Lors d'un incident, les équipes d'intervention peuvent consulter l'application Infrastructure Health pour évaluer rapidement l'ampleur des problèmes. Par exemple, s'agit-il d'un seul service hors service ? Ou êtes-vous confronté à un incident en cascade affectant plusieurs services et nécessitant la mobilisation d'équipes et de ressources supplémentaires ?

    • Lors d'une autopsie

      Une fois la situation stabilisée, il faut déterminer pourquoi les choses ont mal tourné et comment s'assurer que le même incident ne se reproduise pas.

      L'analyse de la chronologie des événements dans l'application Infrastructure Health avant la déclaration de l'incident peut fournir des informations précieuses. Existait-il des signes avant-coureurs ? Notre système d'alerte est-il correctement configuré ou cet incident est-il survenu sans aucun avertissement préalable ?

    • Déduction proactive

      Identifiez les tendances dans vos données d'infrastructure et repérez les indicateurs précurseurs de problèmes avant qu'ils ne se transforment en incidents.

      Vous pouvez également améliorer vos alertes en identifiant les services particulièrement actifs qui sollicitent constamment votre équipe. Enfin, vous pouvez faire pivoter votre visualisation de l'état de l'infrastructure par source pour obtenir une perspective totalement différente sur vos données.

En exploitant d'autres fonctionnalités de PagerDuty , vous pouvez tirer pleinement parti des visualisations de l'application Infrastructure Health.

      • Groupe de services Utilisez PagerDuty Groupe de services Cette fonctionnalité vous permet de modéliser vos services PagerDuty en fonction de vos services critiques pour l'entreprise.
      • Transformateur d'événements personnalisé : Intégrer des contextes d'événements supplémentaires, par exemple des déploiements et tweets , en utilisant notre Transformateur d'événements personnalisé La juxtaposition de ces événements avec vos groupes d'alertes est un outil puissant pour déterminer la cause première des incidents et comprendre leur impact sur les clients.

L'application Infrastructure Health Applications est l'une des nombreuses applications de Console de commandes des opérations Pour en savoir plus sur cette console et les autres applications qui la composent, consultez notre documentation. Article de blog sur la console de commandes des opérations .

Inscrivez-vous dès aujourd'hui pour votre essai gratuit. et accélérez votre réponse aux incidents grâce à notre nouvelle console de commande des opérations, notre application de santé de l'infrastructure et bien plus encore !