Wie man Vorfälle mithilfe des Model Context Protocol (MCP) verhindert und behebt
Das rasante Tempo der modernen Softwareentwicklung, angetrieben durch KI-gestützte Programmierung und beschleunigte Bereitstellungszyklen, hat eine Herausforderung wieder aufleben lassen, mit der viele Entwicklungsteams bereits zu kämpfen hatten: Die Geschwindigkeit der Reaktion auf Sicherheitsvorfälle muss nun mit der Geschwindigkeit der Änderungen mithalten. Teams liefern täglich Code schneller als je zuvor aus, was unweigerlich das Risiko erhöht, dass ein neues Problem in die Produktion gelangt. Der traditionelle Ansatz – bei dem Entwickler Zeit mit dem Wechsel zwischen unzusammenhängenden Tools verschwenden – ist nicht mehr tragfähig. Er führt zu Burnout und unterbricht den Arbeitsfluss. Die Lösung ist ein vernetztes KI-Ökosystem, das die bereits vorhandenen Betriebsdaten nutzt.
PagerDuty trägt zu diesem vernetzten KI-Ökosystem bei über Model Context Protocol (MCP) MCP ist eine standardisierte Methode, mit der spezialisierte KI-Tools sicher Informationen und Aktionen austauschen können. MCP fungiert als gemeinsame Sprache und ermöglicht es KI-Tools und -Agenten, direkt miteinander zu kommunizieren.
Bis heute haben wir über 60 Werkzeuge Diese ermöglichen es Nutzern, Daten zu kritischen Vorfällen und Serviceinformationen abzurufen und sogar automatisierte Reaktionen in jedem beliebigen KI-fähigen Tool auszulösen. Und wir fügen ständig weitere Tools hinzu (siehe unsere Website). Versionshinweise Wir planen, die MCP-Funktionalität an unsere offenen APIs anzugleichen. Das bedeutet, dass alle wichtigen PagerDuty Daten und -Aktionen, die über die API verfügbar sind, auch über MCP zugänglich sein werden. Und das Beste daran? Diese Daten können sowohl bei Störungen als auch beim Programmieren genutzt werden. Sehen wir uns an, wie ein solcher Workflow für die verschiedenen Szenarien aussehen könnte.
Vorfälle verhindern – mit den richtigen Daten zum richtigen Zeitpunkt
Stellen Sie sich vor, Sie erstellen einen neuen Agenten, der Ihre Nutzer durch den Bezahlvorgang führt und ihnen Angebote vorschlägt, die sie vor dem Kaufabschluss in den Warenkorb legen sollten. Dieser Agent könnte diese Informationen dann an andere Teams weitergeben, die nach Nachfragesignalen für beliebte Produkte suchen. Es ist entscheidend, dass dieser Agent sowohl ein positives Kundenerlebnis bietet (relevante Vorschläge, einwandfreie Funktion) als auch die korrekten Kaufdaten an die internen Teams übermittelt. Stellen Sie sich nun vor, Sie nehmen eine kleine Änderung an diesem Agenten vor, die es dem Nutzer ermöglicht, die Nützlichkeit der Vorschläge zu bewerten. Lassen Sie uns einen potenziellen Zwischenfall vermeiden.
- Mit LangSmith sicherere Einsatzkräfte durch Kenntnisse vergangener Vorfälle aufbauen
Der PagerDuty Incident Responder-Agent für LangSmith Die Verbindung zum PagerDuty MCP-Server ermöglicht den Zugriff auf den Vorfallverlauf und Kontext eines Dienstes. Entwickler können einen Dienstnamen (z. B. den des neuen Agenten), Links zu früheren Vorfällen mit diesem Agenten oder eine Symptombeschreibung eines früheren Fehlers eingeben. PagerDuty liefert daraufhin wichtige Details zur Risikobewertung: vergangene Vorfälle, Triage-Informationen und bekannte Fehlermodi aus der Nachbesprechung von Vorfällen. So können Entwickler die Bereitstellung mit den richtigen Daten zum richtigen Zeitpunkt vorbereiten.
- Risikobewertung von Code vor der Bereitstellung mit Claude Code
Entwickler, die mit Claude Code arbeiten, können das Risiko nicht übertragener Codeänderungen direkt in ihrem Entwicklungsworkflow als zusätzlichen Sicherheitsmechanismus bewerten. PagerDuty Plug-in für Claude Code ist ein Risikobewertungstool, das den Produktionskontext direkt in den Entwicklungsprozess einbezieht. Wenn ein Entwickler einen einfachen Befehl wie ausführt, /Risiko-Score Claude analysiert den neuen Code anhand von 90 Tagen PagerDuty Vorfallsdaten. Die Analyse identifiziert risikoreiche Dateitypen, den Umfang der Änderung und ob Überschneidungen mit Bereichen bestehen, die in der Vergangenheit zu Vorfällen geführt haben. Der Entwickler erhält anschließend eine eindeutige Risikobewertung und konkrete Handlungsempfehlungen, bevor der Code eingecheckt wird. Dies trägt dazu bei, das Risiko und die Kosten schwerwiegender Betriebsstörungen zu reduzieren.
- Systemzustandsprüfung vor der Bereitstellung mit GitHub Copilot
Der PagerDuty Incident Responder benutzerdefinierter Agent für GitHub GitHub Copilot ermöglicht Nutzern den direkten Zugriff auf PagerDuty -Daten, einschließlich Änderungskorrelation und Vorfalldaten. Entwickler können zudem mithilfe der PagerDuty MCP-Tools eigene Agents erstellen, die noch umfassendere Daten- und Aktionsfunktionen bieten. Nutzer können sich schnell einen Überblick über den aktuellen Systemstatus verschaffen, Informationen zu früheren Vorfällen abrufen und sogar die Ergebnisse der Vorfallanalyse zusammenfassen. So lassen sich potenzielle Probleme erkennen, die eine Verschiebung der Bereitstellung erforderlich machen könnten.
Beschleunigung der Reaktion während eines Vorfalls
Tatsächlich lassen sich nicht alle Vorfälle verhindern, insbesondere angesichts der rasanten Entwicklung neuer Software. Tritt ein Vorfall auf, unterstützt MCP Teams bei der schnelleren Wiederherstellung, indem es Unterbrechungen und die kognitive Belastung durch den Wechsel zwischen verschiedenen Tools reduziert. Nehmen wir unser Beispiel mit dem neuen Agenten. Angenommen, der Entwickler, der die Änderung zur Hinzufügung des Bewertungssystems implementiert hat, hat den oben beschriebenen Überprüfungsprozess übersprungen, und ein Problem ist unentdeckt geblieben. So kann MCP die Reaktion beschleunigen.
- Bestätigen und überprüfen Sie in Cursor
Wenn eine neue Benachrichtigung ausgelöst wird, können Sie diese sofort bestätigen und überprüfen, ohne Ihr Programmierwerkzeug zu verlassen. Die PagerDuty MCP-Integration mit Cursor ermöglicht es Cursor, diese Benachrichtigungen abzurufen. PagerDuty Daten oder Aktionen ausführen Dazu gehören Informationen wie der aktuelle Bereitschaftsdienst, Details zum Servicestatus und die Vorfallhistorie. Dies hilft Entwicklern, wichtige Fragen zu beantworten und mit der Priorisierung zu beginnen, indem sie PagerDuty nach den Auswirkungen von Vorfällen und den betroffenen Diensten, vorausgefüllten Notizen und mehr fragen. Ohne Kontextwechsel können Benutzer auch GitHub Copilot nach kürzlichen Änderungen fragen und diese Informationen so mit den wichtigen PagerDuty -Daten abgleichen, ohne ihr bevorzugtes Tool verlassen zu müssen.
- Automatisierte Diagnose und Lösungsvorschläge mit Honeycomb-Daten
Während ein Entwickler das Problem prüft, PagerDuty SRE-Agent PagerDuty führt im Hintergrund Diagnosen durch und erweitert seinen SRE-Agenten um Protokollierungs- und Metrikdaten von Honeycomb über MCP. Der SRE-Agent nutzt diese wichtigen Telemetriedaten zur Priorisierung von Problemen, zur schnellen Ermittlung der Ursache und zur gezielten Automatisierung, wodurch die anfängliche Diagnoselast für den menschlichen Supportmitarbeiter reduziert wird. Beispielsweise kann der Agent schnell eine Lösung vorschlagen, etwa das Zurücksetzen einer kürzlich vorgenommenen Änderung.
- Schnelle Lösung
Dank dieses nahtlosen Informationsflusses kann der Bearbeiter anschließend zu Cursor zurückkehren und die vorgeschlagene Aktion ausführen – beispielsweise die Änderung rückgängig machen. Dieser einheitliche, intelligente Workflow schließt den Kreislauf von der Alarmerkennung bis zur Problemlösung schnell, ohne den Benutzer auf eine andere Oberfläche zu verweisen. Die Reaktion erfolgt schneller, und Entwickler können sich wieder ihrer eigentlichen Arbeit widmen, da sie weniger Zeit mit Unterbrechungen verbringen müssen.
Durch die Verknüpfung von Daten und Aktionen aus Tools wie LangSmith, Claude, GitHub Copilot, Cursor, Honeycomb und anderen stellt PagerDuty sicher, dass die richtigen Daten und Aktionen genau dort verfügbar sind, wo Teams sie benötigen. Dieser Ansatz trägt dazu bei, Reibungsverluste zu reduzieren, das Incident-Management zu beschleunigen und so mit dem Tempo der KI-gestützten Entwicklung Schritt zu halten. Letztendlich gewinnen Entwickler dadurch mehr Zeit für wertschöpfende Aufgaben. Wir haben erst einen Bruchteil der Möglichkeiten von MCP ausgeschöpft.
Möchtest du mehr über PagerDutys Ansatz für MCP erfahren? Dann schau dir unseren Twitch-Stream an. Hier Die
Möchtest du zu unserem Repository beitragen? Schau dir unsere GitHub-Repository Die