Blog

Modernisez votre environnement ITSM

par Twain Taylor 4 octobre 2017 | 7 min de lecture

Les exigences imposées aux organisations et à leurs applications évoluent. La fiabilité est essentielle pour gagner la confiance des utilisateurs. Si une application subit une dégradation de service, a fortiori un dysfonctionnement complet, son fonctionnement devient problématique. temps d'arrêt Pendant une période prolongée, les utilisateurs chercheront une alternative parmi la multitude d'options disponibles. Dans de nombreux cas, une interruption de service peut également nuire à la réputation de l'entreprise. Les utilisateurs apprécient les applications fiables et finissent par les intégrer pleinement à leur vie professionnelle et personnelle. Il est donc essentiel que votre équipe DevOps réagisse rapidement et résolve les problèmes d'application ayant un impact sur les clients. De longues interruptions non planifiées peuvent être préjudiciables et entraîner une perte d'utilisateurs.

La transformation rapide a un coût

Développer une application moderne ou transformer une application existante et établie implique forcément des interruptions de service. Ces interruptions sont inévitables compte tenu du besoin constant de mises à jour et de transformations ; des architectures de plus en plus complexes peuvent engendrer de nouvelles vulnérabilités.

Un Rapport IDC Cela montre que les défaillances d'infrastructure et d'applications ont un impact considérable sur les entreprises du Fortune 1000. Chaque année, des milliards de dollars sont perdus en raison d'interruptions de service non planifiées. Outre les coûts tangibles, image de marque Ces entreprises subissent également des dommages. Si la satisfaction client est importante, les interruptions de service des applications doivent être traitées rapidement.

Traditionnellement, les organisations ont constaté que le fait d'avoir un Processus ITSM en place Cela contribue grandement à éviter les interruptions de service. Cependant, les processus ITSM traditionnels ont leurs limites. Face à la complexité des applications et des chaînes de développement actuelles, il est nécessaire de mettre en place un processus ITSM basé sur… paradigme des opérations modernes Ce qui fait obstacle aux opérations modernes, ce sont les rôles traditionnels des équipes de développement et d'exploitation.

L'histoire de deux équipes : les développeurs et les opérations

Il fut un temps où les équipes de développement et d'exploitation étaient deux entités distinctes. Les développeurs créaient une application et la confiaient à l'équipe d'exploitation pour son exécution et sa maintenance, ce qui engendrait un véritable chaos lors des interruptions de service. L'équipe d'exploitation devait alors gérer ces interruptions, et les développeurs avaient tendance à considérer que la gestion des conséquences du développement incombait à l'équipe d'exploitation, ce qui les conduisait à écrire du code moins susceptible d'être prêt pour la production.

Examinons les différentes caractéristiques d'une équipe de développement et d'une équipe d'exploitation :

Développeurs Opérations
Recherchez l'agilité Recherchez la stabilité
Sont exploratoires Sont-ils réticents au risque ?
Non linéaire Séquentiel
besoins commerciaux à court terme besoins commerciaux à long terme

 

Les équipes opérationnelles et les équipes de développement travaillent à des rythmes différents. L'équipe opérationnelle se concentre sur stabilité et fiabilité Les développeurs se concentrent sur la création de fonctionnalités de pointe et sur l'innovation. De ce fait, les deux équipes ne sont pas au même niveau, ce qui peut engendrer du chaos en cas d'urgence ou d'indisponibilité du service.

Cette séparation n'est plus acceptable. Dans le cadre du DevOps moderne, il est essentiel que les équipes de développement et d'exploitation collaborent étroitement et soient parfaitement synchronisées. Les organisations informatiques ne peuvent se permettre de privilégier l'une au détriment de l'autre. Il est donc nécessaire de disposer d'une solution capable de répondre aux besoins des deux équipes de manière équilibrée. Pour les organisations informatiques modernes, cette solution est le DevOps.

Le DevOps est la seule méthode éprouvée permettant aux organisations de concilier agilité et fiabilité. Trouver le juste équilibre entre ces deux aspects profitera à l'ensemble de l'organisation et permettra de réduire les temps de réponse en cas d'indisponibilité des applications.

Les trois piliers fondamentaux du DevOps : les personnes, les processus et les outils

Le DevOps vise à intégrer les équipes de développement et d'exploitation afin qu'elles puissent créer plus rapidement des applications de haute qualité. Si la rapidité est un aspect essentiel du DevOps, la qualité et la fiabilité sont tout aussi importantes.

Si l'on adopte une approche DevOps moderne, chacun des trois piliers fondamentaux aura des besoins spécifiques.

  • Personnes - En cas d'indisponibilité du système, les équipes distribuées doivent disposer d'une réponse soigneusement orchestrée. Une communication et une collaboration en temps réel entre les équipes sont essentielles pour agir rapidement et trouver la meilleure solution. Chaque équipe doit être responsable de la performance du logiciel et de l'expérience client. La direction doit avoir la visibilité nécessaire pour évaluer l'état opérationnel et les capacités de chaque équipe.
  • Processus - La réponse de l'équipe DevOps aux incidents doit être optimisée selon les meilleures pratiques. Les interventions d'urgence ponctuelles doivent rester l'exception. La disponibilité des membres de l'équipe et l'escalade vers les équipes compétentes doivent être automatisées. L'automatisation des processus est essentielle pour réduire le MTTR (temps moyen de résolution). Il n'est pas viable de réinventer la roue ou de bricoler des processus manuels à chaque fois qu'il s'agit de comprendre le contexte système, de mobiliser les bonnes personnes, etc.
  • Outils Les outils doivent être étroitement intégrés les uns aux autres. Face au flux d'informations caractéristique des interruptions de service, les différentes données doivent être intelligemment corrélées afin de mettre en évidence l'impact sur les services, et les sources de données doivent alimenter des outils permettant des flux de travail agiles et en temps réel.

Les outils seuls ne constituent pas la solution

La transition rapide vers une approche DevOps présente ses propres défis. De nombreuses organisations tentent d'effectuer cette transition en utilisant une multitude d'outils. Cependant, les outils seuls ne suffisent pas. Pour une transformation harmonieuse, il est nécessaire d'adopter une approche non conventionnelle de votre ensemble d'outils ITSM.

PagerDuty a mené une étude auprès d'organisations informatiques et a constaté qu'en moyenne, 47 % d'entre elles utilisent plus de six outils pour gérer leurs opérations. Pourtant, ces outils ne centralisent que 27 % des alertes, et ces organisations affichent un taux d'échec de 80 %. Cela démontre que l'ajout d'outils supplémentaires n'est pas la solution. Au contraire, il ne fait qu'accroître la complexité.

Avec toutes les données et alertes provenant de nombreux outils, 85 % des équipes manquent des alertes importantes.

L'afflux simultané de toutes ces informations complique le tri des données les plus importantes. Submergées d'informations, les équipes connaissent des problèmes de disponibilité pouvant atteindre 79 %. Un ensemble d'outils complexe a des répercussions importantes sur vos équipes et vos processus.

« Les équipes ont toujours du mal à trouver le bon signal au milieu de tout ce bruit. »

Réagir à une interruption de service implique de trouver la solution adéquate et d'informer les personnes concernées. Cette tâche se complique considérablement si l'on ignore la nature exacte du problème et si les outils utilisés deviennent, au lieu de simplifier les choses, un véritable casse-tête.

Gestion des opérations numériques

La meilleure façon de Optimisez votre ensemble d'outils ITSM est en utilisant un Gestion des opérations numériques PagerDuty gère intelligemment les données d'alerte provenant des plateformes ITSM et de surveillance existantes que votre organisation utilise déjà, comme ServiceNow PagerDuty permet aux équipes de détecter les problèmes de manière proactive au lieu de simplement répondre aux tickets clients. Le volume important de données générées par ces systèmes est centralisé et affiché sur une interface unique. Toutes les alertes non exploitables sont ignorées et ne donnent pas lieu à des notifications (mais sont conservées pour faciliter la détection de tendances et d'anomalies). L'automatisation mobilise automatiquement les personnes compétentes en cas de problème. Les incidents contiennent toutes les alertes relatives au problème (regroupées automatiquement grâce à des algorithmes d'apprentissage automatique), ainsi que des données de performance et des journaux d'erreurs détaillés pour faciliter un dépannage et une résolution rapides. Une fois ces étapes réalisées, PagerDuty fournit des rapports détaillés aux responsables des opérations afin d'analyser l'efficacité du système et la réactivité des employés. Lors de votre transition vers les opérations modernes, un outil de résolution d'incidents comme PagerDuty est indispensable.

Pour en savoir plus sur la façon dont PagerDuty peut vous aider à moderniser votre environnement ITSM, consultez les ressources suivantes :