PagerDuty
/
Blog
/
KI
/
Sie brauchen keinen Fünfjahresplan für KI. Sie brauchen einen Fünfwochenplan.

Blog

Sie brauchen keinen Fünfjahresplan für KI. Sie brauchen einen Fünfwochenplan.

von Heath Newburn 16. September 2025 | 9 Minuten Lesezeit

Auf meinen Reisen höre ich immer wieder von Plänen, die versprechen, in Zukunft „das volle Potenzial der KI freizusetzen“. Der übliche Rat lautet, klein anzufangen, mit einigen Pilotprojekten, und dann schrittweise zu expandieren. Das klingt gut in der Theorie, aber in der Praxis artet es in monatelange, mühsame Einzelversuche aus, die viel Kapital verschlingen, aber meist kaum Wirkung zeigen.

Dieser Ansatz des „Experimentierens und Iterierens“ war für frühere Generationen von Unternehmenstechnologien sinnvoll, die sich nicht so schnell wie KI entwickelten. Doch die Ära des „Pilotprojekts und Lernens“ von 2023/24 liegt hinter uns. Wer heute erst seine ersten Pilotprojekte plant, ist bereits im Rückstand.

Cloudflare-CIO Mike Hamilton erklärte bei einem PagerDuty On Tour San Francisco Session „Eine fünfjährige KI-Strategie ist derzeit ziemlich schwierig umzusetzen. Es ist eher eine Fünf-Minuten-Strategie – man entwickelt seinen Plan, und die KI entwickelt sich bereits weiter.“

Viele Organisationen haben die letzten Jahre damit verbracht, mit kleinen, sicheren Anwendungsfällen von genAI zu experimentieren. Jetzt ist es an der Zeit, mutigere Schritte zu unternehmen. Nutzen Sie die Erkenntnisse aus diesen Experimenten, um erfolgreiche Ansätze auszuweiten und erfolglose zu verwerfen.

Meiner Erfahrung nach lässt sich dies am besten auf einem Fünf-Wochen-Zeitplan Vier intensive Sprints zum Testen, Optimieren und Ausliefern von Mehrwert, gefolgt von einer einwöchigen Überprüfung, um zu entscheiden, was skaliert und was verworfen wird. Das ist schnell genug, um mit dem Markt Schritt zu halten, und gleichzeitig diszipliniert genug, um Ihre Risiko- und Finanzteams zufriedenzustellen.

In diesem Blog erkläre ich, wie diese Vorgehensweise funktioniert und warum sie der intelligenteste Ansatz für die Einführung von KI in modernen Unternehmen ist.

Ihr Fünf-Wochen-KI-Plan: Bestandsaufnahme, Erfolge nachweisen und dann skalieren

Die erste Woche eines fünfwöchigen Zyklus beginnt mit einer Reflexionsphase. Vielleicht haben Sie einen Bot getestet, der automatisch Statusaktualisierungen veröffentlicht oder Tickets an das zuständige Teammitglied weiterleitet.

Bevor Sie sich auf neue Anwendungsfälle konzentrieren, sollten Sie diese Versuche überprüfen und feststellen, welche davon für eine unternehmensweite Ausweitung geeignet sind.

Erfassung aller Piloten (Woche eins)

Rufen Sie die Liste aller KI-Beweispunkte auf, die Sie ausprobiert haben – egal wie klein – und unterziehen Sie jeden einzelnen einem Filter mit drei Fragen:

Hat es das Problem, das wir lösen wollten, behoben (oder zumindest dazu beigetragen)?

Wenn das Ziel die Reduzierung von Störungen war, zeigen Sie die Anzahl der Alarme vor und nach dem Experiment an. Markieren Sie die Werte grün, wenn sich der Wert verbessert hat, gelb, wenn die Ergebnisse uneinheitlich sind, und rot, wenn sich nichts geändert hat.

Hat sich der Zeit- und Arbeitsaufwand gelohnt?
Wenn ein Workflow zwar fünf Minuten pro Vorfall einspart, aber jede Iteration zehn Minuten Entwicklerzeit für die Überwachung benötigt, entsteht ein Nettoverlust. Stellen Sie sicher, dass Sie die tatsächlichen Kosten jedes Experiments verstehen.
Waren die Leitplanken ausreichend?

Notieren Sie alle Zugriffsprobleme, Lücken im Audit-Log oder Sicherheitswarnungen. Wenn die Kontrollen funktionierten, markieren Sie den Eintrag grün. Andernfalls markieren Sie ihn gelb für eine Wiederholung oder rot für die Stilllegung.

Trage die Antworten in eine einfache Ampeltabelle ein. Grüne Antworten führen direkt zum nächsten Sprint. Gelbe Antworten benötigen eine Überarbeitung. Rote Antworten werden vorerst archiviert.

Am Ende der Woche verfügen Sie über einen kurzen, aber sicheren Auftragsbestand und die nötige Klarheit, um in den nächsten vier Wochen echten Mehrwert zu schaffen.

Führen Sie einen fokussierten Verifizierungs-Sprint durch (Woche zwei bis drei)

Nehmen Sie einen Ihrer Piloten mit grünem Licht und untersuchen Sie ihn genau.

Wählen Sie einen einzelnen Service, ein Team und ein Ziel aus. Etwa so: „Die mittlere Reparaturzeit (MTTR) innerhalb von 30 Tagen um fünf Minuten verkürzen.“
Nutzen Sie die Werkzeuge, denen Sie bereits vertrauen. Starten Sie den Workflow mit Ihrer bestehenden Automatisierung und lassen Sie die Ereignisintelligenz doppelte Meldungen unterdrücken.
Bleiben Sie innerhalb der genehmigten Leitplanken. Da Zugriffskontrollen, Audit-Protokolle und Ausweichmechanismen bereits vorhanden sind, kann das Team schnell handeln, ohne Sicherheitsüberprüfungen erneut durchführen zu müssen.
Messen Sie jeden Lauf. Verfolgen Sie die von Ihnen gewählte Kennzahl und protokollieren Sie alle unerwarteten Ergebnisse. Vergleichen Sie nach mehreren Durchläufen das durchschnittliche Ergebnis mit dem Zeit- und Arbeitsaufwand.
Erwägen Sie, den ROI zu messen. Eine der besten Methoden, den verstärkten Einsatz von KI und Automatisierung sicherzustellen, besteht darin, die erzielten Einsparungen, Effizienzsteigerungen und Risikominderungen zu erfassen. Diese Daten bilden eine wertvolle Grundlage für zukünftige Investitionen. Die Wertschöpfung über mehrere Iterationen hinweg summiert sich schnell.

Am Ende der dritten Woche verfügen Sie über konkrete Daten, die bestätigen, ob dieser Workflow bereit ist, in Ihrem gesamten Unternehmen eingeführt zu werden, oder ob weitere Anpassungen erforderlich sind.

Echte Gewinner ausbilden und die Strategie zusammenstellen (Wochen vier bis fünf)

Sobald ein Pilotprojekt seine Ziele zuverlässig erreicht (z. B. die mittlere Reparaturzeit verkürzen, die Anzahl der Warnmeldungen reduzieren), kann es unternehmensweit skaliert werden. Aktivieren Sie den Workflow für Live-Vorfälle und verwenden Sie dabei dieselben Zugriffskontrollen und Audit-Logs, die Sie in den Tests validiert haben. Dokumentieren Sie die Eingabeaufforderungen, Genehmigungen und Ausweichschritte in einem gemeinsamen Handbuch, sodass jedes Team das Muster ohne Codeänderungen aktivieren kann.

Nachdem das Team den Prozess einige Wochen lang implementiert hat, präsentieren Sie die Vorher-Nachher-Kennzahlen in Ihrem wöchentlichen Betriebsbericht. Klare Kennzahlen in dieser Phase schaffen Glaubwürdigkeit und regen zu Ideen an, wo das Muster sonst noch hilfreich sein kann.

Wenn bis jetzt alles noch gut läuft, kopieren Sie das Muster auf einen benachbarten Dienst oder erweitern Sie es auf einen größeren Anwendungsfall.

Sicherheit ist wichtig, aber übertreiben Sie es nicht.

Das Ziel dieses fünfwöchigen Zyklus ist einfach: die KI-Workflow-Kandidaten durch den Funnel zu führen, ohne ein unvertretbares Risiko einzugehen. Ich beobachte häufig, dass Betriebsteams hier zu vorsichtig statt schnell agieren – übermäßige Planung kann mehr ausbremsen als das tatsächliche Risiko. Ist die Unsicherheit, die eine KI bei der Ausführung einer Aufgabe hat, wirklich besser als die eines gestressten Menschen, der dieselbe Aufgabe erledigt (oder eben nicht erledigt)?

Ein angemessener Mittelweg besteht darin, die von KI ausgehenden Risiken anzuerkennen, ohne sich dadurch den Fortschritt aufhalten zu lassen. So finden Sie die richtige Balance.

Vertrauen Sie den Bedienelementen, die Sie haben

Sie verfügen wahrscheinlich bereits über eine Reihe robuster Kontrollmechanismen, wie AWS Bedrock Guardrails, rollenbasierte Zugriffskontrolle (RBAC) und permanente Audit-Logs. Diese Kontrollen sollten für einen gut durchdachten Test ausreichend sein. Zusätzliche Prüfebenen mögen zwar zusätzlichen Schutz bieten, in der Praxis verlangsamen sie jedoch oft den Lernprozess stärker, als sie das KI-Risiko verringern.

Führen Sie eine menschliche Kontrollinstanz bei der Überprüfung der kundenorientierten Ergebnisse ein.

Alles, was mit Kunden zu tun hat, sollte vorsorglich noch einmal von einem Mitarbeiter geprüft werden. Wenn ein KI-Dienst beispielsweise eine Meldung wie „Alle Dienste wiederhergestellt“ erstellt, sollte diese vor dem Versand 30 Sekunden lang vom diensthabenden Techniker geprüft werden. Eine einzige Benachrichtigung mit niedriger Priorität sorgt dafür, dass eine Person die Verantwortung für die Meldung übernimmt und die Kunden schnell informiert werden.

Beginnen Sie mit Daten, deren Verlust Sie sich leisten können.

Diagnoseprotokolle und synthetische Metriken liefern ideale Daten für frühe Tests. Sie ermöglichen es, Workflow-Fehler aufzudecken, ohne personenbezogene Daten (PII) von Kunden zu gefährden. Sobald sich ein Workflow als nützlich und sicher erweist, kann er auf wichtigere Anwendungsbereiche ausgeweitet werden.

Bewährtes festhalten und wiederverwenden

Sobald ein Pilotprojekt sowohl die internen ROI- als auch die Sicherheitskriterien erfüllt, sollten die Genehmigungsschritte und Alarmregeln in einem gemeinsamen Handbuch dokumentiert werden. Beim nächsten Service kann diese Vorlage (mit bereits integrierten Leitplanken und Prüfungen) verwendet werden, sodass das Team die Genehmigungsprozesse nicht erneut festlegen muss. Dadurch können Sie die Bereitstellung innerhalb von Tagen statt Monaten realisieren.

Bereiten Sie Ihre Mitarbeiter auf schnelles Handeln vor.

Ein Fünf-Wochen-Rhythmus ist ein hohes Tempo, und Ihr Team benötigt möglicherweise eine gewisse Eingewöhnungszeit, um sich an die schnelle Bereitstellung von KI-Funktionen zu gewöhnen. Verankern Sie diesen Rhythmus, indem Sie Ihre Zeit und Energie darauf konzentrieren, eine Kultur aufzubauen, die Ihr Team zum Erfolg führt.

Trainieren Sie anhand realer Ereignisse.

Ersetzen Sie Folienpräsentationen durch Live-Übungen, die auf früheren Ausfällen basieren. So könnte das in der Praxis aussehen:

Nach Ihrer Vorfallbesprechung am Freitag sollten Sie eine Stunde für eine „Was-wäre-wenn“-Szenarioanalyse eines kürzlich aufgetretenen Vorfalls der Priorität 1 (P1) einplanen.
Anhand von Dummy-Daten wird der Vorfall in den Incident Workflows von PagerDuty nachgespielt, und ein KI-Diagnoseagent schlägt den ersten Abhilfeschritt vor.
Parallel dazu sollten Ihre Ingenieure die Zeitabläufe vergleichen, festhalten, wo der Agent seine Stärken und Schwächen hatte, und die wichtigsten Erkenntnisse in einem gemeinsamen Leitfaden protokollieren.
Nutzen Sie unbedingt Tools wie Arize oder Fiddler, die Ihnen Einblicke in die Funktionsweise Ihrer KI geben, um Korrekturmaßnahmen ergreifen zu können.

Dadurch wird jeder tatsächliche Stromausfall zu einer Trainingsmöglichkeit und die Einsatzkräfte erlangen KI-Kompetenz in dem Kontext, den sie am besten kennen.

Weisen Sie jedem neuen Workflow einen Sponsor zu.

Neue Workflows sollten klar definierte Verantwortliche und Erfolgskennzahlen haben. Weisen Sie jedem Workflow einen Sponsor zu und legen Sie wöchentliche Meilensteine fest. In der ersten Woche könnte das Ziel beispielsweise sein, den Agenten zu aktivieren. In der vierten Woche könnte es dann darum gehen, das Ziel für die mittlere Reparaturzeit (MTTR) zu erreichen.

Ab diesem Zeitpunkt sollte der Sponsor regelmäßig in Betriebsbesprechungen über die Leistung und die Schwachstellen des Workflows berichten. So kann jeder aus den Erfolgen und Misserfolgen lernen.

Bewährte Abläufe in Vorlagen umwandeln

Wenn ein Workflow mindestens zwei Durchläufe fehlerfrei durchläuft, formalisieren Sie ihn. Dokumentieren Sie die KI-Abfrage, die Ausweichschritte und die Prüfungen zur manuellen Genehmigung in Ihrer gemeinsamen Runbook-Bibliothek oder im Automation Center of Excellence. Nutzen Sie Terraform, um die gemeinsame Nutzung durch mehrere Teams zu vereinfachen und den Workflow in Ihre Pipelines zu integrieren. Kennzeichnen Sie ihn mit Service- und Auswirkungsmetriken, sodass jedes Team das Muster mit einem Klick aktivieren kann. Neue Code-Reviews oder Genehmigungen sind nicht erforderlich.

Fähigkeitenentwicklung planen

Praxisnahe Schulungen sind ein guter Anfang, doch für eine nachhaltige KI-Einführung im großen Maßstab ist eine gezielte, unternehmensweite Strategie zur Kompetenzentwicklung erforderlich. Definieren Sie mithilfe einer rollenbasierten Kompetenzmatrix, was für Einsatzleiter und Bereitschaftsingenieure die erforderliche Expertise ausmacht. Diese Matrix sollte die spezifischen KI-Fähigkeiten, -Tools und Entscheidungskompetenzen aufzeigen, die jedes Teammitglied beherrschen muss.

Wählen Sie anschließend für jeden Fünf-Wochen-Zyklus ein oder zwei Kompetenzen pro Rolle aus, die geübt werden sollen, und definieren Sie eine einfache Überprüfung, um diese nachzuweisen. Zum Beispiel:

Alle Bereitschaftstechniker können Diagnoseagenten selbstständig ausführen.
SRE-Leiter können eine neue Runbook-Vorlage erstellen.
DevOps-Ingenieure erhalten 2-3 neue, geführte Lösungsansätze für Datenbankfehler.

Mit einem so strukturierten Vorgehen trägt jeder Sprint dazu bei, eine KI-kompetente Organisation aufzubauen.

Laden Sie sich zunächst unser E-Book zur Entwicklung von KI-Kompetenzen herunter. Wie Sie die Entwicklung von KI-Kompetenzen in Ihren Betriebsteams vorantreiben können Die

Diese könnten Ihnen auch gefallen...

KI
Was NVIDIA, Okta und Warner Bros. Discovery über die Skalierung von KI-Operationen über die Pilotphase hinaus gelernt haben

KI
Wie zukunftsorientierte Institutionen von agentenbasierter KI profitieren

KI , Vorfallmanagement und Reaktion
Aus Vorfällen Erkenntnisse gewinnen: Der kontinuierliche KI-Betriebskreislauf erklärt