Blog

Une journée de lancement dans la vie de mes coéquipiers IA

par Ariel Russo 17 octobre 2025 | 5 min de lecture

6h47 – Café à la main, je consulte les alertes de la nuit.

Alex, ingénieur SRE chez Greenagonia, commence sa journée en sachant qu'un lancement important se profile. Les précommandes laissent présager une augmentation du trafic de 5 à 10 fois, ce qui signifie que le café doit être particulièrement fort ce matin. En consultant ses alertes de la nuit, Alex réalise qu'il a complètement oublié un rendez-vous chez le dentiste qui coïncide avec sa prochaine garde.

Il y a six mois, cela aurait nécessité des échanges frénétiques de messages sur Slack, voire au moins un coup de fil. Aujourd'hui ? L'IA d'Alex s'en charge.

Agent de changement de poste pour les prises de force et les dérogations

Un léger ping du Agent de quart apparaît dans Slack : « Il semblerait que votre congé Google Agenda coïncide avec une astreinte. J'ai identifié des collègues disponibles pour vous remplacer. Souhaitez-vous que je demande une dérogation ? »

Quelques clics plus tard, Alex et son remplaçant ont accepté la modification, et le conflit d'horaire est résolu. Fini le stress et la coordination manuelle. L'agent de changement, l'IA qui épaule Alex, gère les tâches routinières qui lui prenaient un temps précieux et l'épuisaient mentalement, lui permettant ainsi de se concentrer sur les problèmes complexes qui nécessitent une véritable expertise humaine (et d'arriver à l'heure à son rendez-vous chez le dentiste).

Agent SRE pour la remédiation et les manuels d'exploitation

8 h 01 – Début du jour du lancement

Les nouvelles bottes de Greenagonia sont désormais disponibles en ligne. En quelques minutes, les commandes affluent du monde entier et tout semble… plutôt bien. C’est alors que Linda, la responsable du centre d’opérations réseau, constate une augmentation des temps de réponse et des erreurs 500 dans la région UE. L’incident n° 4127 est déclenché.

Entrez dans Agent SRE Pendant que Linda analyse encore la situation, l'agent SRE collecte déjà des métriques depuis l'environnement Grafana de Greenagonia. Protocole de contexte du modèle Elle saisit une requête rapide : « Analyser les 500 erreurs récentes dans catalog-west et identifier les causes profondes potentielles. »

En quelques secondes, l'agent SRE identifie le problème : des requêtes serveur web expirent. Mais cette intelligence artificielle ne s'arrête pas au diagnostic. Elle suggère déjà une solution : « Activez la mise à l'échelle automatique pour les instances d'application web. »

8h15 – Résolution et apprentissage

Linda approuve la recommandation de mise à l'échelle automatique et les temps de réponse se normalisent. L'agent SRE va plus loin en générant automatiquement une procédure d'intervention pour ce scénario précis, au cas où il se reproduirait. Ainsi, la prochaine fois qu'une saturation du pool de connexions à la base de données sera constatée, n'importe quel intervenant pourra suivre les étapes documentées. Grâce à l'agent SRE, Greenagonia a transformé un incident stressant en une connaissance institutionnelle.

C’est là toute la magie d’avoir un coéquipier IA. Les intervenants prennent toujours les décisions cruciales, mais ils les prennent avec de meilleures informations, une analyse plus rapide et un suivi automatisé.

Agent Scribe pour le soutien à la communication

8h18 – L’intrigue s’épaissit

Alors que l'équipe reprend ses activités normales, un nouvel incident survient, cette fois aux États-Unis. Les délais d'attente et les échecs de traitement des passerelles de paiement explosent, impactant directement les revenus. La situation est désormais qualifiée d'incident majeur.

8h20 – Collaboration optimisée par l'IA

Le flux de travail de gestion des incidents majeurs de Greenagonia se déclenche automatiquement, créant une réunion Zoom et ajoutant l'agent scribe Dès que les parties prenantes rejoignent la réunion, l'agent Scribe transcrit instantanément chaque détail et chaque décision, et publie des résumés sur le canal Slack dédié à l'incident. Fini les prises de notes frénétiques et les informations manquantes ! Chacun reste informé sans interrompre la résolution du problème.

Anna, la responsable des opérations, doit informer la hiérarchie. Au lieu de rédiger un compte rendu de A à Z en jonglant avec de multiples sources de données, elle demande simplement : « PagerDuty: Veuillez me rédiger un compte rendu. » En quelques secondes, l’agent Scribe rédige un compte rendu clair et professionnel à partir de la transcription en direct, des données de l’incident et de l’historique des conversations. Avant de l’envoyer, Anna le relit et le corrige, puis reprend rapidement la coordination des opérations.

Agent SRE pour le triage complexe

9h15 – Réouverture, mais pas de redémarrage de l'incident

Wade, expert en bases de données chez Greenagonia, rejoint l'équipe de réponse à l'incident. Il met en place des réplicas de lecture supplémentaires, et l'incident est résolu. Mais quinze minutes plus tard, les mêmes problèmes de performance réapparaissent.

Wade rouvre l'incident en conservant l'historique complet et demande à l'agent SRE d'approfondir l'enquête. Ce dernier établit rapidement un lien entre ce nouveau pic et les limites de débit de la passerelle de paiement, en récupérant les journaux de DataDog et les données de déploiement de GitHub via MCP.

C'est comme avoir un coéquipier doté d'une mémoire infaillible et capable de faire instantanément des liens entre plusieurs systèmes. Et ce n'est pas tout : l'agent SRE recommande de rediriger les transactions ayant échoué vers un traitement de secours à titre de mesure corrective. Wade approuve le basculement automatique, et ça fonctionne !

Agent d'analyse pour l'amélioration continue

9 h 45 – Résolution et réflexion

Une fois l'incident marqué comme résolu et les données critiques pour la conformité et le reporting automatiquement documentées, PagerDuty crée un résumé complet pour l'analyse post-incident.

Une semaine après le lancement

Une semaine après le lancement, les premiers retours indiquent un franc succès malgré l'incident, grâce à la réactivité de l'équipe. Dans le cadre du suivi, le Agent d'analyse Il fournit de manière proactive des recommandations opérationnelles basées sur les tendances qu'il a identifiées.

Grâce à l'analyse des données spécifiques à Greenagonia, AI Orchestrations a identifié une tendance à l'origine de cet incident majeur et recommande de classer automatiquement les incidents similaires futurs en catégorie P1. Ainsi, l'équipe de Greenagonia pourra réagir encore plus rapidement en cas de récidive.

La nouvelle réalité des opérations

Collaborer avec une IA a profondément transformé la façon dont les équipes de développement abordent leur rôle. L'IA prend en charge la collecte de données, la reconnaissance de formes et les tâches routinières, tandis que les humains se concentrent sur le raisonnement complexe, les décisions stratégiques et la résolution créative de problèmes, domaines dans lesquels ils excellent.

Résultat ? Pour Greenagonia, le lancement a été un franc succès. L’entreprise a géré les pics de trafic avec un minimum de perturbations, a transformé un incident majeur en une leçon précieuse et a mis en place une automatisation qui lui sera utile pendant des mois. Ses développeurs peuvent désormais se concentrer sur l’innovation plutôt que sur des tâches opérationnelles répétitives, et ses clients bénéficient de l’expérience fluide qu’ils attendent.

Greenagonia est peut-être une fiction, mais ces résultats, eux, ne le sont pas. Apprendre encore plus Découvrez l'offre d'IA de PagerDuty pour propulser vos équipes dans une ère d'innovation grâce à l'IA, ou constatez-le par vous-même. ici .