- PagerDuty /
- Blog /
- ITOps et opérations modernes /
- Gestion des incidents pour les équipes ITOps : apprendre à centraliser
Blog
Gestion des incidents pour les équipes ITOps : apprendre à centraliser
Peut ITOps Les équipes centralisent-elles la gestion des incidents ? Si vous travaillez dans les ITOps, votre première réponse à cette question pourrait être un « non » catégorique.
Après tout, les responsabilités des ITOps sont si vastes et diversifiées qu'il peut sembler presque impossible de les regrouper sous un même toit pour la gestion des incidents. De l'administration des serveurs à la mise à disposition des ordinateurs de bureau en passant par le support technique, sans oublier la gestion des achats et des prestataires indépendants, les équipes ITOps s'occupent de tout.
C'est ce qui distingue fortement l'ITOps de la plupart des autres services d'une organisation. Si vous êtes un service de programmation, vous pouvez centraliser vos processus de développement et de gestion des bugs grâce à un référentiel de code. Si vous êtes commercial, vous pouvez gérer vos produits et vos contacts clients via une plateforme centralisée comme Salesforce. Ce n'est pas le cas avec l'ITOps, car il couvre un large éventail de tâches.
Nous sommes là pour vous dire que la gestion centralisée des incidents pour les ITOps ne doit pas être une utopie. Certes, les ITOps gèrent des tâches tellement diverses qu'il n'existe pas de plateforme universelle pour surveiller et résoudre les problèmes. Cependant, vous pouvez centraliser la gestion des incidents sur l'ensemble de votre infrastructure.
Comment y parvenir ? En utilisant un outil de gestion des incidents capable de s'intégrer à tous les aspects de votre workflow ITOps.
Tirer le meilleur parti de vos services de surveillance
Examinons un exemple de base de la manière dont votre équipe ITOps peut centraliser la gestion des incidents, même si ITOps lui-même n'est pas aussi centralisé.
Si vous êtes un professionnel ITOps au sein d'une PME, vous devez probablement surveiller trois principaux types d'infrastructure. Le premier est constitué de vos serveurs sur site, que vous pouvez utiliser pour héberger un partage de fichiers local ou héberger des sites web. Le deuxième est votre cloud public, où vous conservez les sauvegardes de données. Le troisième est constitué de vos postes de travail locaux, qui doivent être maintenus opérationnels et connectés à vos serveurs sur site et cloud.
Planifier la gestion des incidents pour chaque partie de cette infrastructure est complexe. Certains systèmes de surveillance prétendent prendre en charge aussi bien les serveurs bare metal, les infrastructures cloud que les PC. Mais s'ils le font, ils ne sont probablement spécialisés dans aucun de ces domaines. Ils se contenteront d'une surveillance générique, sans fonctionnalités avancées conçues pour des types d'infrastructures spécifiques.
C'est pourquoi il est préférable d'utiliser une combinaison de services de surveillance adaptés aux différents éléments de votre infrastructure. Pour votre cloud, vous tirerez probablement le meilleur parti d'un système de surveillance centré sur le cloud, comme AWS CloudWatch . SolarWinds Cela pourrait être utile pour vos appareils sur site et votre réseau local. Vous pourriez également utiliser quelque chose comme Splunk pour analyser toutes les données de journal que vos nombreux appareils crachent.
Un outil de gestion des incidents pour les gérer tous
Chacune des plateformes de surveillance que nous avons mentionnées est dotée d'un système d'alerte ou de notification, mais ces notifications ne sont peut-être pas aussi performantes que nécessaire. Même si elles le sont, aucune équipe ITOps ne souhaite recevoir simultanément des alertes provenant de plusieurs plateformes différentes, sous des formats et avec des contenus variés. Dans ces conditions, il serait extrêmement difficile de garantir que les bonnes alertes parviennent aux bonnes personnes au bon moment.
La bonne nouvelle pour les professionnels ITOps est que la gestion des incidents n'est plus aussi complexe et désorganisée. Même si vous disposez de plusieurs systèmes de surveillance pour vos différentes opérations, vous pouvez centraliser la réception de toutes les alertes.
Tout aussi important, vous pouvez centraliser la diffusion des notifications à votre équipe. Par exemple, certains de vos services de surveillance pourraient ne pas être en mesure de gérer les alertes SMS nativement. En interfaçant ces services avec une plateforme centralisée de gestion des incidents capable de traduire les notifications au format souhaité, vous pourrez les transférer sur les téléphones de vos administrateurs si nécessaire.
Enfin, une solution centralisée de gestion des incidents vous permet d'éviter les alertes redondantes. Si votre réseau est surchargé, cela peut entraîner des notifications non seulement du service qui surveille vos commutateurs réseau, mais aussi de la pile de surveillance de vos serveurs, qui détectera une connexion instable.
Recevoir plusieurs alertes liées au même problème principal sème la confusion au sein de votre équipe et augmente le temps de réponse. En revanche, une gestion centralisée des incidents garantit que l'équipe reçoit des notifications par incident, et non par système de surveillance. Il y a donc moins de bruit et une visibilité immédiate sur la situation.
En temps normal, ajouter un outil supplémentaire à votre workflow ITOps peut sembler synonyme de surcharge. C'est peut-être vrai dans de nombreux contextes. Mais dans le cas de la gestion des incidents, de la mise en œuvre d'une solution… comme PagerDuty, qui centralise les notifications peut aider votre équipe ITOps à tirer beaucoup plus de valeur des outils de surveillance que vous avez déjà en place.