Blog

Équilibrer centralisation et autonomie : la clé de l'automatisation à grande échelle

par Jake Cohen 6 août 2024 | 7 minutes de lecture

La récente panne mondiale nous rappelle que l'identification des problèmes et de leur impact n'est que la première étape d'un long processus de résolution. Les incidents sont inévitables ; la façon dont nous nous y préparons et en tirons les leçons permet aux équipes de réagir plus efficacement la prochaine fois. Comme l'ont montré les mesures de résolution prises par les entreprises du monde entier, la mise en œuvre d'un correctif connu dans un grand nombre d'environnements potentiellement gérés par plusieurs équipes dispersées peut représenter un défi colossal. Des pratiques optimales de gestion des incidents, associées à des normes d'automatisation centralisées, peuvent souvent atténuer les conséquences de ce type d'incidents. Ce blog explore les avantages et les défis d'une automatisation centralisée des opérations informatiques.
___________________________________________________________________________

Lors de nos échanges avec des professionnels et des dirigeants de l'informatique et de l'ingénierie de divers secteurs, un thème récurrent est la difficulté de mettre en œuvre des stratégies d'automatisation efficaces à grande échelle. Voyons comment les organisations peuvent trouver le juste équilibre entre centralisation et décentralisation en matière d'automatisation.

Le dilemme centralisation contre décentralisation

Dans les opérations commerciales et techniques, il existe une tension inhérente entre la centralisation des fonctions pour la standardisation et le contrôle, et la décentralisation pour l'agilité et l'innovation. Cela est particulièrement évident dans le domaine de l'automatisation, où les équipes cherchent constamment à améliorer leur efficacité et à réduire les tâches manuelles.

La centralisation offre des avantages tels que :

  • Mise en œuvre simplifiée des contrôles et des garde-fous
  • Visibilité holistique pour le leadership
  • Mise en œuvre simplifiée des nouvelles normes

D'autre part, la décentralisation offre :

  • Autonomie des équipes pour adopter des processus et des outils spécialisés
  • Une plus grande rapidité dans la prise de décision et l'exécution
  • Flexibilité d'utiliser des solutions « de pointe » pour des tâches spécifiques

Un excellent article sur ce sujet discussion par Alix Partners expose de nombreux avantages et inconvénients de chaque approche :

Le paysage de l'automatisation dans les organisations modernes

Dans les environnements informatiques et de développement logiciel actuels, l'automatisation est devenue omniprésente. Elle couvre un large éventail d'activités, de la réponse aux incidents à la gestion de la fiabilité, en passant par le provisionnement et le reporting. Cependant, la nature décentralisée de la plupart des organisations a entraîné une prolifération d'outils et de pratiques d'automatisation diversifiés au sein des différentes équipes.

Cette diversité provient de divers facteurs :

  • Technologie hétérogène piles : machines virtuelles versus conteneurs ; différents systèmes de bases de données
  • Des compétences et des préférences variées parmi les membres de l'équipe : certaines équipes préfèrent écrire l'automatisation dans des scripts Python, tandis que d'autres préfèrent les playbooks Ansible.
  • Des responsabilités distinctes et processus pour différentes équipes

Outre la diversité des automatisations techniques, chaque équipe peut présenter des différences dans les processus « de niveau supérieur » ou « métier » entourant ces tâches ou l'utilisation de l'automatisation. Par exemple, certaines équipes peuvent exiger que certaines tâches nécessitent l'approbation d'une ou plusieurs personnes, tandis que d'autres non. Certaines équipes exigent également que toutes les automatisations soient enregistrées dans un ITSM ou que les notifications soient envoyées par chat, comme Slack ou MS Teams.

Bien que cette approche décentralisée puisse favoriser l’innovation et la rapidité, elle présente également des défis dans la mise en œuvre de normes à l’échelle d’un département ou d’une organisation, en particulier dans des domaines tels que :

  • Capacités en libre-service
  • Conformité et audit
  • Sécurité et contrôle d'accès
  • Processus de gestion du changement et de révision
  • Intégration avec les systèmes d'entreprise

Il existe également des cas de gestion d'incidents critiques nécessitant la mise en œuvre d'un correctif dans tous les environnements de l'organisation, comme lors de la panne de l'agent Falcon de Cyberark au début du mois. Lorsque les environnements sont nombreux et que leurs méthodes d'exécution des tâches opérationnelles sont différentes, le délai de mise en œuvre d'un correctif en cas d'interruption de service est considérablement allongé.

L'impact de l'IA générative sur l'automatisation

L'IA générative transforme le paysage de l'automatisation en augmentant considérablement la vitesse de création des automatisations. Des outils comme Github Copilot, ChatGPT et PagerDuty Advance Permettre aux utilisateurs de générer rapidement des scripts et des playbooks, réduisant ainsi le temps de développement et accélérant le déploiement. Cependant, ce rythme rapide d'innovation illustre encore davantage les défis et les risques liés à la décentralisation pour l'automatisation :

  • Attention négligente à la sécurité : les utilisateurs professionnels moyens dotés de l'IA peuvent ne pas avoir la même sensibilisation à la sécurité que les développeurs expérimentés, ce qui entraîne des vulnérabilités potentielles.
  • Gestion des informations d'identification médiocre : les automatisations générées par l'IA peuvent ne pas adhérer à des pratiques strictes de gestion des informations d'identification, augmentant ainsi le risque d'accès non autorisé.
  • Risque accru de non-conformité : sans une surveillance appropriée, les automatisations générées par l'IA peuvent ne pas être conformes aux réglementations sur la confidentialité des données telles que le RGPD ou la HIPAA, ce qui entraîne des risques de conformité importants.

Trouver le bon équilibre

D'après nos observations chez PagerDuty, les entreprises en croissance ont souvent intérêt à mettre en place une équipe ou une fonction centralisée axée sur l'automatisation. Cependant, la clé est de trouver un équilibre qui ne freine pas la rapidité, la motivation et l'innovation de chaque équipe.

Voici quelques stratégies que nous avons vu des organisations prospères employer :

  1. Créer un Centre d’excellence (COE) : Créez une équipe centralisée qui se concentre sur les meilleures pratiques, les outils, les processus et les normes d'automatisation. Cette équipe doit avoir pour objectif de soutenir et d'aider les équipes individuelles plutôt que de prendre en charge l'ensemble des efforts d'automatisation. Lisez notre ebook COE ici )
  2. Développer des composants réutilisables : Encouragez la création et le partage de composants d'automatisation réutilisables au sein de l'organisation. Cette pratique favorise la standardisation sans obliger les équipes à abandonner leurs outils préférés.
  3. Implémenter une couche d'orchestration : Utiliser un plateforme d'orchestration d'automatisation s'intègre aux outils existants tout en appliquant les normes de l'entreprise. Les équipes peuvent ainsi continuer à utiliser leurs solutions préférées tout en garantissant le respect des exigences de sécurité, de visibilité et de libre-service. Le schéma ci-dessous présente un exemple d'architecture.
  4. Promouvoir le partage des connaissances : Faciliter la collaboration entre les équipes et l’échange de connaissances pour diffuser les meilleures pratiques et les approches innovantes dans toute l’organisation.
  5. Équilibre entre normalisation et flexibilité : Identifier les zones où la normalisation est essentielle (par exemple, pratiques de sécurité, exigences de conformité) et les domaines dans lesquels les équipes peuvent avoir plus d'autonomie (par exemple, choix des langages de script).

La plate-forme d'orchestration peut aider à mettre en œuvre des normes d'automatisation tout en donnant aux équipes l'autonomie nécessaire pour utiliser leurs propres outils

Un exemple concret : se déplacer vers la gauche tout en maintenant les normes

Nombre de nos clients s'efforcent de « shift left » en permettant à leurs équipes de développement de mettre en œuvre des runbooks dans le cadre de la gestion de leurs services. Parallèlement, ils souhaitent fournir des fonctionnalités standardisées d'auto-correction à leurs équipes de support de niveau 1 lors de la réponse aux incidents. Cela permettra non seulement aux développeurs de se concentrer sur des tâches à forte valeur ajoutée, mais aussi aux équipes de support d'intervenir en cas de besoin, plutôt que d'attendre que les experts les reconnaissent et les exécutent.

Pour atteindre cet équilibre, ces organisations s'appuient sur des plateformes centralisées capables d'orchestrer l'automatisation développée par les équipes de développement tout en fournissant une interface standardisée aux intervenants de niveau 1. Cette approche permet :

  • Autonomie de l'équipe de développement dans la création et la maintenance d'automatisations spécifiques aux services
  • Processus normalisés pour la réponse aux incidents
  • Amélioration du partage des connaissances entre les équipes de développement et d'exploitation

Préparer l'avenir

En trouvant le juste équilibre entre centralisation et autonomie dans l'automatisation, les organisations optimisent non seulement leurs opérations actuelles, mais renforcent également leur résilience face aux évolutions technologiques futures, tout en minimisant les risques de pannes en cascade. Lorsque la prochaine vague d'innovation déferlera, les équipes seront mieux préparées à adopter de nouveaux outils et pratiques dans un cadre flexible et standardisé.

En tant que DSI et responsables technologiques, le défi consiste à créer un environnement propice à l'innovation et à l'agilité, tout en maintenant les contrôles et les normes nécessaires pour atténuer les risques à long terme. En exploitant les plateformes et les structures d'équipe adaptées à la gestion des incidents et à l'orchestration de l'automatisation, vous pouvez atteindre cet équilibre et assurer la réussite durable de votre organisation dans un monde de plus en plus automatisé.

Chez PagerDuty, nous nous engageons à aider les organisations à relever ces défis et à élaborer des stratégies d'automatisation résilientes et évolutives. Je vous encourage à découvrir comment nos solutions peuvent accompagner votre démarche d'automatisation et vous aider à trouver le juste équilibre pour votre organisation.