Blog

Prévenir les pannes en 2014 : données historiques, tendances et processus d'alerte

par Tony Albanese 4 février 2014 | 5 minutes de lecture

Cet article de blog invité de CopperEgg, l'un de nos partenaires de surveillance, explique comment analyser les données historiques pour créer un processus d'alerte approfondi. CopperEgg propose une solution simple et légère pour surveiller les performances des applications et services cloud. Pour en savoir plus sur CopperEgg, consultez son site web. (www.copperegg.com ).

L'année dernière, votre organisation a-t-elle connu des pannes majeures ou des problèmes de performance affectant les utilisateurs finaux ? Avez-vous mis en place un processus pour éviter que ces problèmes ne se reproduisent cette année ? Ce blog détaille les bonnes pratiques et conseils pour créer un processus d'optimisation en exploitant les données de performance historiques, en analysant la cause profonde des problèmes et en mettant en place un système d'alerte et de réponse.

Étape 1 : Examiner les tendances

La première étape pour anticiper et prévenir les problèmes majeurs sur vos serveurs, sites web et applications consiste à consulter l'historique. Il est important de consulter ces données immédiatement après un problème et sur des périodes plus longues pour évaluer les tendances. CopperEgg est un expert en la matière : il fournit des données haute résolution (mises à jour des performances toutes les 5 et 15 secondes) pour les 30 derniers jours, et des données basse résolution (mises à jour toutes les 1 minutes) pour un an. Grâce à ces données, les utilisateurs peuvent remonter dans le temps pour visualiser les tendances de performance et analyser des problèmes spécifiques.

Il est important d'analyser les données historiques selon les indicateurs de performance pertinents pour votre entreprise. Si la communication d'informations à vos clients est votre objectif principal, la mesure de la performance par la disponibilité et le temps de réponse (c'est-à-dire le pourcentage de disponibilité et le temps d'attente de vos clients) est un indicateur clé. Dans cet exemple, vous devriez analyser les temps de réponse et la disponibilité pendant les périodes de forte affluence et analyser les données sur une période plus longue afin d'identifier les pics et les tendances irréguliers.

CopperEgg_Issue_Trends

CopperEgg permet aux utilisateurs d'avoir une vue d'ensemble des performances et des détails de second niveau. Comme le montre la photo ci-dessus, la possibilité de visualiser et de comprendre rapidement les tendances historiques constitue une plateforme solide pour élaborer une stratégie de prévention des problèmes.

Étape 2 : identifier et identifier la cause profonde des principaux problèmes de performances

Maintenant que vous avez analysé les données historiques de votre solution de surveillance, il est temps d'identifier la cause profonde des problèmes de performances majeurs. Nous espérons que cela sera facile à réaliser grâce à un outil de surveillance unifié. Si vous utilisez CopperEgg, trouver la cause profonde est simple. En deux clics ou moins, les utilisateurs peuvent trouver des informations détaillées, telles que les serveurs, les sites web et les détails des processus associés. Traiter ces tendances de performance en analysant la source est l'étape la plus importante pour prévenir de futurs problèmes de performances.

CopperEgg_Widgets

La solution de surveillance de CopperEgg, illustrée sur la photo ci-dessus, suit tous vos indicateurs de performance. Chaque widget offre un aperçu rapide de votre environnement et vous permet d'analyser en détail les performances de chaque serveur, site web et application.

Étape 3 : Fixez-vous des objectifs

À ce stade, vous devriez avoir une bonne compréhension des tendances de performance de vos serveurs, sites web et applications. L'étape suivante consiste à définir des objectifs pour améliorer ou maintenir le niveau de performance de chacun de ces éléments. Ces objectifs doivent être basés sur les besoins de votre entreprise, les performances passées et la façon dont ces performances se traduisent par une accessibilité globale à vos opérations spécifiques.

La performance des transactions des utilisateurs finaux, comme l'ajout d'un article à un panier, est-elle importante pour votre entreprise ? Si oui, fixez-vous comme objectif un temps de réponse rapide et un taux de complétion élevé pour ce type de transaction.

Étape 4 : Créer des alertes spécifiques en fonction des objectifs commerciaux

Ensuite, transformez vos objectifs en alertes. Au lieu d'être averti lorsque vos serveurs, sites web et applications dépassent vos objectifs définis, préparez un ensemble d'alertes qui vous avertissent dès l'apparition de problèmes. Avec CopperEgg, vous pouvez définir les seuils et les modalités de notification. Avec les applications de surveillance, il est nécessaire d'augmenter la sévérité des notifications à mesure que le niveau de performance se rapproche de la limite fixée. Vous pourrez ainsi mieux gérer les alertes prioritaires.

Étape 5 : Regroupez et transférez vos alertes avec PagerDuty

Grâce à PagerDuty, vous pouvez acheminer les alertes de vos solutions de surveillance vers la personne compétente. Grâce à ses politiques d'escalade et à ses plannings d'astreinte, PagerDuty garantit que les alertes de vos systèmes ne seront jamais manquées, offrant ainsi le moyen le plus efficace de recevoir les alertes et de gérer vos incidents.

Avec PagerDuty, vous pouvez contrôler les temps d'arrêt grâce à des alertes d'incident efficaces tout en offrant une personnalisation individuelle pour les préférences de notification de chacun des membres de votre équipe.

Étape 6 : Restez calme et surveillez

Après avoir traité les principales causes de pannes potentielles, restez calme et détendu ! L'utilisation combinée de CopperEgg et de PagerDuty vous permettra d'être prévenu suffisamment à l'avance en cas de problème. Nous sommes convaincus qu'un système d'alerte et de surveillance efficace est essentiel pour rester calme et vigilant !

Envie d'essayer CopperEgg ? Nous vous proposons une essai gratuit de 14 jours Pour en savoir plus sur CopperEgg, visitez CopperEgg.com ou explorez l'autoguidé démo en direct .