PagerDuty
/
Blog
/
IA
/
Comment prévenir et résoudre les incidents à l'aide du protocole MCP (Model Context Protocol)

Blog

Comment prévenir et résoudre les incidents à l'aide du protocole MCP (Model Context Protocol)

par Hannah Culver 6 avril 2026 | 6 min de lecture

Le rythme effréné du développement logiciel moderne, alimenté par la programmation pilotée par l'IA et des cycles de déploiement accélérés, a fait ressurgir un défi auquel de nombreuses équipes de développement étaient déjà confrontées : la rapidité de la réponse aux incidents doit désormais suivre le rythme des changements. Chaque jour, les équipes déploient du code plus rapidement que jamais, ce qui augmente inévitablement le risque qu'un nouveau problème atteigne la production. L'approche traditionnelle, où les ingénieurs perdent du temps à jongler entre des outils non connectés, n'est plus viable. Elle épuise les développeurs et les empêche de se concentrer pleinement sur leur travail. La solution réside dans un écosystème d'IA interconnecté qui exploite les données opérationnelles dont vous disposez déjà.

PagerDuty contribue à cet écosystème d'IA interconnecté via Protocole de contexte de modèle (MCP) MCP est une méthode standardisée permettant aux outils d'IA spécialisés d'échanger des informations et des actions en toute sécurité. Elle sert de langage commun, permettant aux outils et agents d'IA de communiquer directement entre eux.

À ce jour, nous avons plus de 60 outils qui permettent aux utilisateurs d'intégrer des données d'incidents critiques, des informations de service et même de déclencher des réponses automatisées dans n'importe quel outil compatible avec l'IA. Et nous ajoutons constamment de nouveaux outils (consultez notre notes de version Nous prévoyons d'assurer la parité de MCP avec nos API ouvertes, ce qui signifie que toutes les données et actions critiques de PagerDuty disponibles via l'API le seront également via MCP. L'avantage principal ? Ces données peuvent être utilisées lors d'incidents ou pendant le développement. Voyons comment un flux pourrait fonctionner dans chacun de ces cas de figure.

Prévenir les incidents grâce aux bonnes données au bon moment

Imaginez que vous créez un nouvel agent, par exemple un agent qui guide vos utilisateurs lors du processus de paiement, en leur proposant des offres à ajouter à leur panier avant l'achat final. Cet agent pourrait ensuite partager ces informations avec d'autres équipes qui recherchent des signaux de demande pour les produits populaires. Il est essentiel que cet agent offre une expérience client optimale (suggestions pertinentes, fonctionnement conforme aux attentes) et qu'il transmette correctement les informations finales d'achat aux équipes internes. Imaginez maintenant que vous apportez une petite modification à cet agent afin de permettre à l'utilisateur d'évaluer la pertinence des suggestions. Prévenons tout incident potentiel.

Former des agents plus sûrs grâce aux enseignements tirés des incidents passés avec LangSmith

Le Agent de réponse aux incidents PagerDuty pour LangSmith L'agent se connecte au serveur PagerDuty MCP et accède à l'historique et au contexte des incidents d'un service. Les développeurs peuvent saisir le nom du service (par exemple, celui auquel ce nouvel agent est associé), les liens vers les incidents précédents concernant cet agent ou la description des symptômes d'une défaillance antérieure. PagerDuty fournit alors des informations essentielles permettant aux développeurs d'évaluer les risques : incidents passés, informations de triage et modes de défaillance connus identifiés lors des analyses post-incident. Ainsi, les développeurs peuvent préparer un déploiement en disposant des données pertinentes au moment opportun.

Évaluation des risques liés au code avant déploiement avec Claude Code

Les développeurs qui codent avec Claude Code peuvent également évaluer le risque lié aux modifications de code non validées directement dans leur flux de développement, comme mécanisme de sécurité supplémentaire. Module complémentaire PagerDuty pour Claude Code est un outil d'évaluation des risques qui intègre le contexte de production directement dans le processus de développement. Lorsqu'un développeur exécute une simple commande comme /score-de-risque Claude analyse le nouveau code en le comparant aux données d'incidents PagerDuty des 90 derniers jours. Cette analyse identifie les types de fichiers à haut risque, l'ampleur de la modification et détermine si elle recoupe des zones ayant déjà causé des incidents. Le développeur reçoit ensuite un score de risque précis et des recommandations concrètes avant la validation du code, ce qui contribue à réduire le risque et le coût des pannes majeures.

Vérification de l'état du système avant le déploiement avec GitHub Copilot

Le Agent personnalisé PagerDuty Incident Responder pour GitHub GitHub Copilot offre aux utilisateurs un accès direct aux données PagerDuty , notamment la corrélation des modifications et les données d'incidents. De plus, les développeurs peuvent créer leurs propres agents personnalisés à l'aide des outils PagerDuty MCP, offrant ainsi des ensembles de données et d'actions encore plus complets. Les utilisateurs peuvent rapidement consulter l'état actuel du système, s'informer sur les incidents précédents et même synthétiser les notes d'analyse post-incident. Ceci permet de signaler tout problème susceptible de justifier le report d'un déploiement.

Accélération de la réponse lors d'un incident

En réalité, il est impossible d'empêcher tous les incidents, surtout avec le rythme accéléré de déploiement de nouvelles versions de code. Lorsqu'un incident survient, MCP aide les équipes à reprendre leurs activités plus rapidement en réduisant les perturbations et la charge cognitive liée à la jonglerie entre différents outils. Prenons l'exemple de notre nouvel agent. Imaginons que le développeur qui a implémenté la modification pour ajouter le système de notation ait ignoré la procédure de révision décrite précédemment, et qu'un problème soit passé inaperçu. Voici comment MCP peut fluidifier la réponse.

Accusé de réception et révision dans le curseur

Lorsqu'une nouvelle alerte est déclenchée, vous pouvez immédiatement la prendre en compte et la consulter sans quitter votre outil de programmation. L'intégration de PagerDuty MCP avec Cursor permet à Cursor d'importer les données. Données PagerDuty ou actions d'exécution PagerDuty fournit des informations telles que les personnes d'astreinte, l'état du service et l'historique des incidents. Ces données permettent aux développeurs de répondre aux questions essentielles et d'entamer le tri, en interrogeant PagerDuty sur l'impact de l'incident et les services concernés, les notes pré-remplies, etc. Sans changer d'outil, un utilisateur peut également consulter GitHub Copilot pour obtenir des informations sur les modifications récentes et les synchroniser avec les données critiques de PagerDuty , directement depuis son outil de prédilection.

Diagnostic automatisé et suggestions de corrections à partir des données Honeycomb

Pendant qu'un développeur examine le problème, le Agent SRE de PagerDuty PagerDuty effectue des diagnostics en arrière-plan. Son agent SRE sera étendu pour exploiter les données de journalisation et de métriques de Honeycomb via MCP. Cet agent utilisera ces données de télémétrie critiques pour optimiser le tri des incidents, identifier rapidement la cause première et exécuter des automatisations ciblées, allégeant ainsi la charge de travail initiale de l'intervenant humain. Par exemple, l'agent pourra suggérer rapidement une solution, comme annuler une modification récente.

Solution rapide et résolution

Grâce à ce flux d'informations fluide, l'utilisateur peut ensuite retourner à Cursor pour effectuer l'action suggérée, comme annuler la modification. Ce flux de travail unifié et intelligent boucle rapidement la boucle, de la détection de l'alerte à sa résolution, sans obliger l'utilisateur à changer d'interface. La réponse est plus rapide et les développeurs peuvent reprendre le développement en consacrant moins de temps aux tâches interrompues.

En connectant les données et les actions provenant d'outils tels que LangSmith, Claude, GitHub Copilot, Cursor, Honeycomb et bien d'autres, PagerDuty rend les données et les actions pertinentes accessibles exactement là où les équipes en ont besoin. Cette approche contribue à réduire les frictions, à accélérer la gestion des incidents pour suivre le rythme du développement piloté par l'IA et, en fin de compte, à libérer du temps pour les développeurs afin qu'ils puissent se consacrer à des tâches à plus forte valeur ajoutée. Nous n'avons encore qu'effleuré le potentiel de MCP.

Vous souhaitez en savoir plus sur l'approche de PagerDuty concernant MCP ? Rejoignez notre stream Twitch. ici .

Vous souhaitez contribuer à notre dépôt ? Consultez notre Dépôt GitHub .

Meilleures pratiques DevOps

Vous pourriez aussi aimer ces articles...

IA , AIOps
Pérennisez vos services grâce à l'IA agentique Operations Cloud

IA
Automatisez vos flux de travail critiques grâce à des agents d'IA en 5 étapes

IA
Découvrez votre répondeur virtuel : l’agent SRE de PagerDuty pour une fiabilité basée sur l’IA

Drops de produits mensuels

Drops de produits mensuels

Intégrité opérationnelle chez FOX

Rapport d'impact FY26

PagerDuty on Tour

Blog

Comment prévenir et résoudre les incidents à l'aide du protocole MCP (Model Context Protocol)

Prévenir les incidents grâce aux bonnes données au bon moment

Accélération de la réponse lors d'un incident

Pérennisez vos services grâce à l'IA agentique Operations Cloud

Automatisez vos flux de travail critiques grâce à des agents d'IA en 5 étapes

Découvrez votre répondeur virtuel : l’agent SRE de PagerDuty pour une fiabilité basée sur l’IA