Der Blog

Operationen als Code: Operative Exzellenz mit PagerDuty

von Heath Newburn 5. März 2025 | 5 Minuten Lesezeit

Der Druck auf die digitale Transformation und Cloud-native Infrastruktur ist enorm, doch Unternehmen müssen auch ihre bestehenden Kapazitäten aufrechterhalten. Dieser Druck bringt die Notwendigkeit mit sich, den Betrieb mit der gleichen Sorgfalt und Automatisierung zu managen, die wir für Infrastruktur, Programmierung und Sicherheit anwenden. Viele Unternehmen haben die Idee von „Alles in einer Pipeline“ und „Alles als Code“ angenommen. Teams implementieren erfolgreich Anwendungen und die zugrunde liegenden Frameworks, doch die eigentliche Bereitstellung und Sicherung von Diensten erfolgt oft erst im Nachhinein oder ist rein reaktiv.

PagerDuty füllt diese Lücke mit Operations as Code.

Operations as Code erweitert die Prinzipien von Infrastructure as Code (IaC) auf operative Abläufe. Es umfasst die Definition, Verwaltung und Ausführung operativer Aufgaben – wie z. B. die Definition von Eskalationsrichtlinien, Orchestrierungen zur Verknüpfung von Runbooks, die Automatisierung von Diagnosen und die Standardisierung von Vorfall-Workflows – mithilfe von PagerDutys Terraform-Anbieter Dieser Ansatz stellt sicher, dass Betriebsabläufe standardisiert und versionskontrolliert sind und mit minimalem menschlichen Eingriff ausgeführt werden können.

Vollständiger Servicebesitz

Einer der Grundsätze, denen PagerDuty schon lange folgt, ist Vollständiger Servicebesitz Sie erstellen es, Sie betreiben es, Sie besitzen es. Operations as Code macht Sie unabhängig von zentralisierten Teams. Da der Bedarf an Geschwindigkeit steigt, können DevOps-Teams nicht mehr auf zentralisierte ITSM- oder PagerDuty Administratoren angewiesen sein, um neues Monitoring zu integrieren, Ereignisse zu erweitern oder neue Runbooks zu erstellen.

Ebenso wenig sinnvoll ist es, wenn zentralisierte ServiceNow-Teams teure Spezialkenntnisse für die Überwachung von Integrationen, Eventmanagement, Anreicherung und Automatisierung aufwenden, die über Operations as Code verwaltet werden können. Diese Teams, insbesondere in großen Organisationen, sind bereits überlastet, und der Arbeitsrückstand wächst täglich. Die Nutzung des Terraform-Anbieters von PagerDuty erreicht dieselben Ziele und liefert gleichzeitig bessere Ergebnisse für alle.

Nutzung von Pipelines und Terraform für den Betrieb

Terraform, traditionell in IaC verwendet, ist die Lingua Franca von DevOps. Durch das Schreiben von Terraform-Konfigurationen können Teams die Bereitstellung und Verwaltung nicht nur der Infrastruktur, sondern auch der Komponenten und Workflows automatisieren, die operative Exzellenz gewährleisten. Mit Terraform von PagerDuty können Sie Servicedefinitionen erstellen, Benutzer, Teams und Rollen konfigurieren, Eskalationsrichtlinien und -pläne definieren, Ereigniskorrelation, Orchestrierung und Runbooks für die automatisierte Diagnose erstellen.

Continuous Integration und Continuous Deployment (CI/CD) spielen bei Operations as Code eine entscheidende Rolle. Durch die Integration operativer Aufgaben in CI/CD-Pipelines stellen Sie sicher, dass Änderungen kontrolliert und automatisiert getestet, überprüft und bereitgestellt werden. Anstatt Konfigurationen direkt über die Benutzeroberfläche oder API von PagerDuty zu ändern, ermöglichen Pipelines Versionskontrolle, Standardisierung und Rollback im Fehlerfall.

Quality Gates werden traditionell für Codeüberprüfungen, automatisierte Tests, Sicherheitsprüfungen usw. verwendet. Bei Operations as Code können sie die Konsistenz von Servicestandards sicherstellen, wie etwa eine Eskalationsrichtlinie mit mindestens drei Ebenen und maximale Zeiträume zwischen Eskalationen, Mindestanforderungen für Runbooks, minimale Anreicherung durch Orchestrierungen usw.

Dies schafft eine hervorragende Grundlage für die Steigerung der operativen Reife. Mit einfachen Vorlagen und Regeln wie „Niemals eine App ohne Runbook ausliefern“ lässt sich leicht beginnen. Mithilfe eines Quality Gates können Sie sicherstellen, dass immer ein Terraform mit einem Link zu einem Confluence-Dokument oder einem Knowledge Base-Artikel vorhanden ist.

Sie können dann im Laufe der Zeit wachsen und „Gewinner- und Sünder“-Anwendungen identifizieren, um die aktuelle Betriebsreife zu ermitteln. Vorlagen können standardisiert und von Teams wiederverwendet werden, die möglicherweise nicht so ausgereift sind. Ein Kunde, der dieses Modell nutzte, stellte fest, dass Dienste, die mindestens fünf seiner sieben Betriebsstandards erfüllten, eine um etwa 30 % bessere mittlere Reaktionszeit (MTTR) aufwiesen als solche, die dies nicht taten. Dies wird ihn letztendlich dazu veranlassen, minimale Betriebsstandards zu definieren und Builds für Teams und Dienste, die die Erwartungen nicht erfüllen, zu streichen.

Vorteile von Operations as Code

Organisationen, die Operations as Code einsetzen, werden zahlreiche Vorteile sehen, viele davon mit sofortigem Return on Investment (ROI).

Die Reduzierung des Arbeitsaufwands ist entscheidend. Zu viel Zeit wird mit „ClickOps“ verbracht. Durch die Abkehr von manuellen Konfigurationen werden mehr Zeit und Ressourcen für kundenrelevante Aufgaben frei. Sie reduzieren außerdem das Betriebsrisiko, indem Sie die Nachverfolgbarkeit von Konfigurationsänderungen, die Versionskontrolle und wiederverwendbare Vorlagen sicherstellen. Ebenso können Sie Governance und Compliance durch den Einsatz von Parsern, Qualitätsgates und genehmigten Vorlagen operationalisieren, während die Geschäftsführung Mindeststandards und erwartete Ergebnisse definieren kann.

Die Erfahrung der Entwickler wird verbessert, indem die Einarbeitungszeit neuer Teammitglieder verkürzt wird, der Aufwand für die Aufrechterhaltung des Betriebs reduziert wird und Break-Fix-Arbeiten an jüngere Teammitglieder verlagert werden, sodass sich die erfahrenen Mitarbeiter auf die Reduzierung der technischen Schulden (oder, wenn Sie optimistisch sind, auf die Ausbeutung des technischen Reichtums) konzentrieren können, um großartige Kundenerlebnisse zu bieten.

Die operative Exzellenz wird verbessert, indem Häufigkeit, Schweregrad und Dauer von Ausfällen reduziert werden, indem wiederholbare Ergebnisse und weniger Fehler sichergestellt werden. Sie können sich von Stammeswissen lösen, indem Sie erfahrenen Mitarbeitern eine vereinfachte, wiederholbare Methode zur Erfassung ihres angeborenen Wissens bieten und so einen Kontext für die Wiederverwendung durch Nachwuchskräfte schaffen.

Erste Schritte

Sprechen Sie mit Ihrem PagerDuty Kontakt, um zu erfahren, wie Sie loslegen können.

Wir beginnen mit Erfolgskennzahlen und identifizieren dann die Bereiche, in denen wir mit Automatisierung und Vorlagen schnell starten können. Wo könnten Sie Risiken sofort reduzieren und welche Ergebnisse könnten Sie durch die Standardisierung von Abläufen beeinflussen?

Wir prüfen die Möglichkeit, ein Kompetenzzentrum mit den richtigen Enthusiasten und Experten zu gründen, die bei Fragen und Antworten helfen, die Vorlagen verwalten und zur kontinuierlichen Verbesserung der Automatisierung und Orchestrierung beitragen können.

Wir beginnen mit einfachen, aber wirkungsvollen Bereichen und konzentrieren uns dann auf die kontinuierliche Verbesserung, bei der wir Ihre Prozesse anhand von Feedback und Kennzahlen regelmäßig überprüfen und verbessern.

Wie geht es weiter?

Operations as Code bietet Konsistenz, Effizienz und Zuverlässigkeit durch die Standardisierung der Erstellung operativer Aufgaben. Durch die Nutzung des Terraform-Anbieters von PagerDuty in Ihren CI/CD-Pipelines können Sie Ihre Teams bei der Einführung dieses transformativen Ansatzes unterstützen. Zwar bestehen Herausforderungen, diese lassen sich jedoch mit sorgfältiger Planung, Umsetzung und kontinuierlicher Verbesserung leicht bewältigen, insbesondere wenn Sie Ihr PagerDuty -Team eingebunden haben.

Dieser vereinfachte Ansatz für „Operations as Code“ kann ein Eckpfeiler der operativen Exzellenz sein und Ihren Teams den Übergang von einer Welt der Plackerei und Reparatur zu einer automatisierungsgesteuerten Vollservice-Verantwortung ermöglichen, die Ihren Teams und vor allem Ihren Kunden besser dient.

Um dies in die Praxis umzusetzen, Melden Sie sich an für eine kostenlose Testversion.