PagerDuty
/
Blog
/
IA
/
Vous n'avez pas besoin d'un plan d'IA sur cinq ans. Il vous faut un plan sur cinq semaines.

Blog

Vous n'avez pas besoin d'un plan d'IA sur cinq ans. Il vous faut un plan sur cinq semaines.

par Heath Newburn 16 septembre 2025 | 9 min de lecture

Au cours de mes voyages, j'entends constamment parler de projets qui promettent de « libérer tout le potentiel de l'IA » à l'avenir. Le conseil habituel est de commencer modestement avec quelques projets pilotes, puis d'étendre progressivement le dispositif. Sur le papier, l'idée est séduisante, mais en pratique, elle se traduit par des mois d'expérimentations ponctuelles qui engloutissent des sommes considérables sans pour autant avoir d'impact significatif.

Cette approche « expérimenter et itérer » était pertinente pour les précédentes générations de technologies d'entreprise, dont l'évolution était moins rapide que celle de l'IA. Mais l'ère du « pilotage et de l'apprentissage » de 2023-2024 est révolue. Si vous commencez tout juste vos projets pilotes aujourd'hui, vous êtes déjà en retard.

Mike Hamilton, directeur des systèmes d'information de Cloudflare, a expliqué lors d'une Session PagerDuty On Tour à San Francisco « Élaborer une stratégie IA sur cinq ans est assez difficile actuellement. Il s'agit plutôt d'une stratégie à court terme : vous élaborez votre plan, et l'IA évolue déjà. »

Ces dernières années, de nombreuses organisations ont expérimenté des cas d'usage restreints et sécurisés axés sur l'IA générale. Il est temps désormais de passer à l'action. Tirez parti des enseignements de ces expérimentations pour généraliser les solutions efficaces et abandonner celles qui ne l'ont pas été.

D'après mon expérience, cela s'obtient de préférence sur un délai de cinq semaines Quatre cycles intensifs pour tester, consolider et déployer la valeur ajoutée, suivis d'une semaine d'évaluation pour déterminer les éléments à développer et ceux à abandonner. Ce rythme est suffisamment rapide pour suivre l'évolution du marché, tout en étant suffisamment rigoureux pour satisfaire vos équipes de gestion des risques et de finance.

Dans cet article, j'expliquerai comment fonctionne ce rythme et pourquoi il s'agit de l'approche d'adoption de l'IA la plus intelligente pour les entreprises modernes.

Votre plan IA sur cinq semaines : faire le point, confirmer les succès, puis passer à l’échelle supérieure

La première semaine d'un cycle de cinq semaines commence par une phase de réflexion. Vous avez peut-être testé un bot qui publie automatiquement des mises à jour de statut ou qui achemine les tickets vers le membre d'équipe approprié.

Avant d'explorer de nouveaux cas d'utilisation, prenez le temps d'examiner ces essais et de confirmer lesquels sont prêts à être déployés à l'échelle de l'entreprise.

Faire le point sur chaque pilote (semaine 1)

Dressez la liste de tous les points de preuve en matière d'IA que vous avez essayés, aussi petits soient-ils, et soumettez chacun d'eux à un filtre en trois questions :

Cela a-t-il résolu (ou du moins contribué à résoudre) le problème que nous cherchions à régler ?

Si l'objectif était de réduire le bruit, affichez le nombre d'alertes avant et après l'expérience. Indiquez en vert si la mesure s'est améliorée, en jaune si les résultats sont mitigés et en rouge si rien n'a changé.

Cela valait-il la peine d'y consacrer du temps et des efforts ?
Si un flux de travail permet de gagner cinq minutes par incident, mais que chaque itération mobilise dix minutes de supervision technique, le résultat est négatif. Assurez-vous de bien comprendre le coût réel de chaque expérimentation.
Les garde-corps étaient-ils suffisamment efficaces ?

Signalez tout problème d'accès, toute lacune dans les journaux d'audit ou tout problème de sécurité. Si les contrôles ont été respectés, cochez la case verte. Dans le cas contraire, cochez la case jaune pour une nouvelle exécution ou rouge pour la mise hors service.

Consignez les réponses dans un tableau simple de type feu tricolore. Les éléments verts sont automatiquement intégrés au sprint suivant. Les éléments jaunes nécessitent une mise au point. Les éléments rouges sont archivés pour le moment.

D’ici la fin de la semaine, vous aurez un carnet de commandes court et bien défini, ainsi que la clarté nécessaire pour consacrer les quatre prochaines semaines à prouver votre réelle valeur ajoutée.

Effectuer un sprint de vérification ciblé (semaines deux à trois)

Prenez l'un de vos pilotes ayant reçu le feu vert et examinez-le attentivement.

Choisissez un seul service, une seule équipe et une seule cible. Quelque chose comme : « Réduire le temps moyen de réparation (MTTR) de cinq minutes en 30 jours. »
Utilisez les outils auxquels vous faites déjà confiance. Déclenchez le flux de travail avec votre automatisation existante et laissez l'intelligence événementielle supprimer les doublons.
Restez à l'intérieur des glissières de sécurité homologuées. Grâce aux contrôles d'accès, aux journaux d'audit et aux mesures de repli déjà en place, l'équipe peut agir rapidement sans avoir à rouvrir les audits de sécurité.
Mesurez chaque course. Suivez l'indicateur choisi et notez toute surprise rencontrée. Après plusieurs essais, comparez le résultat moyen au temps et aux efforts investis.
Envisagez de mesurer le retour sur investissement. L'un des meilleurs moyens de favoriser l'adoption de l'IA et de l'automatisation est de suivre les économies réalisées, les gains d'efficacité et la réduction des risques. Ces données constituent un excellent indicateur pour les investissements futurs. La valeur ajoutée accumulée au fil des itérations est rapidement perceptible.

À la fin de la troisième semaine, vous disposerez de données concrètes confirmant si ce flux de travail est prêt à être déployé dans toute votre organisation, ou s'il nécessite des ajustements supplémentaires.

Faire élire les vrais gagnants et élaborer le plan de jeu (semaines quatre à cinq)

Une fois qu'un projet pilote atteint ses objectifs de manière fiable (réduction du MTTR, diminution du nombre d'alertes, etc.), il est prêt à être déployé à l'échelle de l'entreprise. Activez le flux de travail pour les incidents réels, en utilisant les mêmes contrôles d'accès et journaux d'audit que ceux validés lors des tests. Documentez les invites, les approbations et les procédures de repli dans un manuel partagé afin que chaque équipe puisse activer le modèle sans écrire de nouveau code.

Ensuite, une fois que l'équipe aura eu plusieurs semaines pour mettre en œuvre le processus, présentez les indicateurs avant et après lors de votre revue opérationnelle hebdomadaire. Des indicateurs clairs à ce stade renforcent la crédibilité et suscitent des idées sur d'autres domaines où ce modèle pourrait être utile.

Si tout se déroule toujours bien à ce stade, copiez le modèle sur un service voisin ou étendez-le à un cas d'utilisation plus large.

La sécurité est importante, mais il ne faut pas en faire trop.

L'objectif de ce cycle de cinq semaines est simple : faire progresser vos projets d'IA dans le processus de validation sans introduire un niveau de risque inacceptable. J'observe souvent que les équipes opérationnelles ont tendance à privilégier la prudence à la rapidité ; une planification excessive peut s'avérer plus ralentissante que le risque lui-même. L'incertitude liée à l'IA est-elle vraiment préférable à la gestion (ou à l'inaction) d'un humain débordé ?

Un juste milieu consiste à reconnaître les risques liés à l'IA sans pour autant laisser celle-ci freiner votre progression. Voici comment trouver cet équilibre.

Faites confiance aux commandes dont vous disposez

Vous disposez probablement déjà de plusieurs mécanismes de contrôle robustes, tels que AWS Bedrock Guardrails, le contrôle d'accès basé sur les rôles (RBAC) et des journaux d'audit permanents. Ces contrôles devraient suffire pour un test bien défini. Des niveaux de contrôle supplémentaires peuvent sembler offrir une protection accrue, mais en pratique, ils ralentissent souvent l'apprentissage plus qu'ils ne réduisent l'exposition aux risques liés à l'IA.

Intégrez un point de contrôle humain dans les résultats destinés aux clients.

Tout message destiné aux clients mérite une vérification humaine rapide. Si un service d'IA génère un message « Tous les services sont rétablis », transmettez-le à l'ingénieur d'astreinte pour une vérification rapide de 30 secondes avant sa publication. Une alerte de faible priorité permet à une seule personne d'être responsable du message et d'informer rapidement les clients.

Commencez par des données que vous pouvez vous permettre de perdre

Les journaux de diagnostic et les indicateurs synthétiques constituent des données idéales pour les tests préliminaires. Ils permettent de déceler les anomalies des flux de travail sans compromettre les données personnelles des clients. Une fois chaque flux de travail validé et sécurisé, il est possible de l'étendre à des domaines à plus fort impact.

Capturez et réutilisez ce qui fonctionne

Lorsqu'un projet pilote satisfait aux critères de retour sur investissement interne et de sécurité, consignez ses étapes d'approbation et ses règles d'alerte dans un manuel partagé. Pour le service suivant, utilisez ce modèle (avec ses garde-fous et ses revues déjà intégrés), afin que l'équipe n'ait pas à repenser les approbations. Vous pourrez ainsi livrer en quelques jours au lieu de plusieurs mois.

Préparez vos équipes à agir rapidement

Un rythme de cinq semaines est soutenu, et votre équipe aura peut-être besoin d'un temps d'adaptation pour s'habituer à déployer des fonctionnalités d'IA aussi rapidement. Pour pérenniser ce rythme, concentrez vos efforts sur la création d'une culture qui favorise la réussite de votre équipe.

Entraînez-vous avec des incidents réels

Remplacez les présentations PowerPoint par des ateliers pratiques en direct basés sur les pannes précédentes. Voici comment cela pourrait se dérouler concrètement :

Après votre revue des incidents du vendredi, bloquez une heure pour une simulation « et si » d’un incident de priorité 1 (P1) récent.
À l'aide de données fictives, rejouez l'incident dans les flux de travail d'incidents de PagerDuty et laissez un agent de diagnostic IA suggérer la première étape de remédiation.
Ensuite, en parallèle de cette suggestion, demandez à vos ingénieurs de comparer les échéanciers, de noter les points forts et les points faibles de l'agent et de consigner les conclusions dans un manuel partagé.
Veillez à utiliser des outils comme Arize ou Fiddler qui vous permettent de comprendre comment votre IA obtient des résultats afin de prendre des mesures correctives.

Cela transforme chaque panne réelle en une opportunité de formation et permet aux intervenants d'acquérir une maîtrise de l'IA dans le contexte qu'ils connaissent le mieux.

Attribuez un sponsor à chaque nouveau flux de travail

Les nouveaux processus doivent avoir des responsables clairement identifiés et des indicateurs de performance. Attribuez un parrain à chacun et fixez un objectif hebdomadaire. La première semaine, il pourrait s'agir simplement de « donner les moyens à l'agent ». À la quatrième semaine, l'objectif pourrait être d'« atteindre le MTTR cible ».

Par la suite, le responsable devrait présenter régulièrement les performances et les points faibles du processus lors des réunions opérationnelles. Ainsi, chacun pourra tirer des enseignements de ce qui fonctionne et de ce qui ne fonctionne pas.

Transformer les flux éprouvés en modèles

Lorsqu'un flux de travail s'exécute correctement pendant au moins deux cycles, formalisez-le. Consignez l'invite de l'IA, les étapes de repli et les contrôles d'approbation humaine dans votre bibliothèque de procédures partagées ou votre Centre d'excellence en automatisation. Utilisez Terraform pour faciliter le partage entre plusieurs équipes et l'intégrer à vos pipelines. Associez-le à des indicateurs de service et d'impact afin que chaque équipe puisse activer le modèle en un seul clic. Aucune nouvelle revue de code ni approbation ne devrait être nécessaire.

Planifier le développement des compétences

La formation pratique est un excellent point de départ, mais l'adoption durable de l'IA à grande échelle exige une stratégie de développement des compétences délibérée et globale. Définissez les compétences attendues des responsables d'incidents et des ingénieurs d'astreinte à l'aide d'une matrice de compétences par rôle. Celle-ci doit préciser les compétences, les outils et les capacités de jugement spécifiques que chaque membre de l'équipe doit maîtriser en matière d'IA.

Ensuite, pour chaque cycle de cinq semaines, choisissez une ou deux compétences par rôle à développer et définissez un contrôle simple pour les attester. Par exemple :

Tous les ingénieurs d'astreinte peuvent exécuter des agents de diagnostic sans assistance.
Les responsables SRE peuvent créer un nouveau modèle de manuel d'exploitation.
Les ingénieurs DevOps peuvent obtenir 2 à 3 nouvelles solutions guidées pour les pannes de bases de données.

Avec un parcours structuré comme celui-ci, chaque sprint contribue à bâtir une organisation compétente en IA.

Pour commencer, téléchargez notre e-book sur le développement des compétences en IA. Comment favoriser le développement des compétences en IA au sein de vos équipes opérationnelles .

Vous aimerez peut-être aussi...

IA
Découvrez votre répondeur virtuel : l’agent SRE de PagerDuty pour une fiabilité basée sur l’IA

IA , AIOps
Les points faibles cachés de votre stratégie d'IA

IA , Opérations cloud , Opérations numériques , Gestion et réponse aux incidents , Intégrations , Cas d'utilisation et solutions
Ce que la NFL nous a appris sur la coordination entre humains et IA pour construire des opérations résilientes

Drops de produits mensuels