Der Blog

Balance zwischen Zentralisierung und Autonomie: Der Schlüssel zur Automatisierung im großen Maßstab

von Jake Cohen 6. August 2024 | 7 min Lesezeit

Der jüngste globale Ausfall erinnert uns daran, dass die Identifizierung von Problemen und deren Auswirkungsradius nur der erste Schritt eines langwierigen Prozesses zur Behebung ist. Vorfälle sind unvermeidlich; wie wir uns darauf vorbereiten und aus ihnen lernen, ist es, was Teams in die Lage versetzt, beim nächsten Mal effektiver zu reagieren. Wie wir anhand der Behebungsmaßnahmen von Unternehmen auf der ganzen Welt gesehen haben, kann die Implementierung einer bekannten Lösung in einer großen Anzahl von Umgebungen, die möglicherweise von einer Reihe verteilter Teams verwaltet werden, eine gigantische Herausforderung sein. Optimale Vorfallmanagementpraktiken in Verbindung mit zentralisierten Automatisierungsstandards können diese Art von Vorfällen oft etwas lindern. Dieser Blog befasst sich mit den Vorteilen und Herausforderungen einer zentralisierten Automatisierungspraxis für den IT-Betrieb.
_______________________________________________________________________________

Wenn ich mit IT- und Engineering-Experten und -Führungskräften aus den verschiedensten Branchen spreche, ist die Herausforderung, effektive Automatisierungsstrategien in großem Maßstab umzusetzen, ein wiederkehrendes Thema. Lassen Sie uns untersuchen, wie Unternehmen beim Thema Automatisierung die richtige Balance zwischen Zentralisierung und Dezentralisierung finden können.

Das Dilemma von Zentralisierung und Dezentralisierung

In allen geschäftlichen und technischen Abläufen besteht eine inhärente Spannung zwischen der Zentralisierung von Funktionen zur Standardisierung und Kontrolle und der Dezentralisierung zur Steigerung von Agilität und Innovation. Dies zeigt sich insbesondere im Bereich der Automatisierung, wo Teams ständig nach Möglichkeiten suchen, die Effizienz zu verbessern und den manuellen Arbeitsaufwand zu reduzieren.

Die Zentralisierung bietet Vorteile wie:

  • Einfachere Umsetzung von Kontrollen und Leitplanken
  • Ganzheitliche Transparenz für die Führung
  • Optimierte Implementierung neuer Standards

Auf der anderen Seite bietet die Dezentralisierung:

  • Autonomie des Teams bei der Einführung spezialisierter Prozesse und Tools
  • Höhere Geschwindigkeit bei Entscheidungsfindung und Umsetzung
  • Flexibilität bei der Verwendung von „Best-of-Breed“-Lösungen für spezifische Aufgaben

Ein ausgezeichneter Artikel zu diesem Diskussion von Alix Partners legt viele der Vor- und Nachteile der einzelnen Ansätze dar:

Die Automatisierungslandschaft in modernen Organisationen

In den heutigen IT- und Softwareentwicklungsumgebungen ist Automatisierung allgegenwärtig. Sie umfasst eine breite Palette von Aktivitäten, von der Reaktion auf Vorfälle und dem Zuverlässigkeitsmanagement bis hin zur Bereitstellung und Berichterstattung. Die dezentrale Natur der meisten Organisationen hat jedoch zu einer Verbreitung unterschiedlicher Automatisierungstools und -praktiken in verschiedenen Teams geführt.

Diese Vielfalt ist auf verschiedene Faktoren zurückzuführen:

  • Heterogene Technologie Stacks: VMs versus Container; unterschiedliche Datenbanksysteme
  • Unterschiedliche Fähigkeiten und Vorlieben unter den Teammitgliedern: Einige Teams schreiben Automatisierungslösungen lieber in Python-Skripten, während andere Ansible-Playbooks bevorzugen.
  • Klare Verantwortlichkeiten Und Prozesse für verschiedene Teams

Zusätzlich zur Vielfalt der technischen Automatisierung kann es in jedem Team Unterschiede in den „höheren“ oder „geschäftlichen“ Prozessen rund um diese Aufgaben oder den Einsatz der Automatisierung geben. Einige Teams verlangen beispielsweise, dass bestimmte Aufgaben von einer oder mehreren Personen unterschrieben oder genehmigt werden müssen, während dies bei anderen nicht der Fall ist. Oder einige Teams schreiben vor, dass die gesamte Automatisierung in einem ITSM protokolliert wird oder dass Benachrichtigungen per Chat gesendet werden – beispielsweise über Slack oder MS Teams.

Dieser dezentrale Ansatz kann zwar Innovation und Geschwindigkeit vorantreiben, bringt aber auch Herausforderungen bei der Implementierung abteilungs- oder organisationsweiter Standards mit sich, insbesondere in Bereichen wie:

  • Self-Service-Funktionen
  • Compliance und Auditing
  • Sicherheit und Zugangskontrolle
  • Änderungsmanagement und Überprüfungsprozesse
  • Integration mit Geschäftssystemen

Es gibt auch Fälle, in denen ein Fix in allen Umgebungen der Organisation implementiert werden muss, wie beispielsweise beim Ausfall des Cyberark Falcon Agent Anfang dieses Monats. Wenn es zahlreiche Umgebungen mit unterschiedlichen Methoden zur Durchführung von Betriebsaufgaben gibt, wird die Zeit zum Anwenden eines Fixes für eine Dienstunterbrechung erheblich länger.

Der Einfluss generativer KI auf die Automatisierung

Generative KI verändert die Automatisierungslandschaft, indem sie die Geschwindigkeit der Automatisierungserstellung deutlich erhöht. Tools wie Github Copilot, ChatGPT und PagerDuty Advance ermöglichen es Benutzern, Skripte und Playbooks schnell zu erstellen, was die Entwicklungszeit verkürzt und die Bereitstellung beschleunigt. Dieses schnelle Innovationstempo verdeutlicht jedoch auch die Herausforderungen und Risiken der Dezentralisierung für die Automatisierung:

  • Nachlässige Beachtung der Sicherheit: Durchschnittliche Geschäftsbenutzer, die durch KI unterstützt werden, verfügen möglicherweise nicht über das gleiche Sicherheitsbewusstsein wie erfahrene Entwickler, was zu potenziellen Schwachstellen führt.
  • Mangelhaftes Anmeldeinformationsmanagement: KI-generierte Automatisierungen halten sich möglicherweise nicht an strenge Praktiken zum Anmeldeinformationsmanagement, was das Risiko eines unbefugten Zugriffs erhöht.
  • Erhöhtes Risiko der Nichteinhaltung: Ohne entsprechende Aufsicht verstoßen KI-generierte Automatisierungen möglicherweise gegen Datenschutzbestimmungen wie die DSGVO oder den HIPAA, was zu erheblichen Compliance-Risiken führt.

Die richtige Balance finden

Basierend auf unseren Beobachtungen bei PagerDuty haben wir festgestellt, dass Unternehmen mit ihrem Wachstum oft von der Einrichtung eines zentralen Teams oder einer zentralen Funktion profitieren, die sich auf die Automatisierung konzentriert. Der Schlüssel liegt jedoch darin, ein Gleichgewicht zu finden, das die Geschwindigkeit, Motivation und Innovation einzelner Teams nicht behindert.

Hier sind einige Strategien, die erfolgreiche Organisationen unserer Erfahrung nach anwenden:

  1. Richten Sie ein Center of Excellence (COE) ein: Bilden Sie ein zentrales Team, das sich auf Best Practices, Tools, Prozesse und Standards für die Automatisierung konzentriert. Dieses Team sollte darauf abzielen, einzelne Teams zu unterstützen und zu befähigen, anstatt alle Automatisierungsbemühungen zu übernehmen. ( Lesen Sie hier unser COE-E-Book )
  2. Entwickeln Sie wiederverwendbare Komponenten: Fördern Sie die Erstellung und gemeinsame Nutzung wiederverwendbarer Automatisierungskomponenten im gesamten Unternehmen. Diese Vorgehensweise fördert die Standardisierung, ohne dass die Teams ihre bevorzugten Tools aufgeben müssen.
  3. Implementieren Sie eine Orchestrierungsschicht: Nutzen Sie ein Automatisierungs-Orchestrierungsplattform die sich in vorhandene Tools integrieren lässt und gleichzeitig unternehmensweite Standards durchsetzt. So können Teams weiterhin ihre bevorzugten Lösungen verwenden und gleichzeitig die Einhaltung der Sicherheits-, Sichtbarkeits- und Self-Service-Anforderungen gewährleisten. Eine Beispielarchitektur finden Sie im folgenden Diagramm.
  4. Fördern Sie den Wissensaustausch: Erleichtern Sie die teamübergreifende Zusammenarbeit und den Wissensaustausch, um bewährte Methoden und innovative Ansätze in der gesamten Organisation zu verbreiten.
  5. Balance zwischen Standardisierung und Flexibilität: Identifizieren Sie Bereiche, in denen Standardisierung ist entscheidend (z. B. Sicherheitspraktiken, Compliance-Anforderungen) und Bereiche, in denen Teams mehr Autonomie haben können (z. B. Auswahl der Skriptsprachen).

Eine Orchestrierungsplattform kann bei der Implementierung von Automatisierungsstandards helfen und den Teams gleichzeitig die Autonomie geben, ihre eigenen Tools zu verwenden.

Ein Beispiel aus der Praxis: Linksruck unter Beibehaltung der Standards

Viele unserer Kunden arbeiten an einem „Shift Left“, indem sie ihren Entwicklungsteams die Möglichkeit geben, Runbooks als Teil ihrer Serviceverantwortung zu implementieren. Gleichzeitig möchten sie ihren Level-1-Supportteams während der Vorfallreaktion standardisierte automatische Korrekturfunktionen bereitstellen. Dadurch bleibt den Entwicklern nicht nur mehr Zeit, sich auf wichtige Aufgaben zu konzentrieren, sondern die Supportteams können auch bei Bedarf Maßnahmen ergreifen, anstatt darauf zu warten, dass Experten dies bestätigen und umsetzen.

Um dieses Gleichgewicht zu erreichen, nutzen diese Organisationen zentralisierte Plattformen, die die von Entwicklerteams geschriebene Automatisierung orchestrieren und gleichzeitig eine standardisierte Schnittstelle für L1-Responder bereitstellen können. Dieser Ansatz ermöglicht:

  • Autonomie des Entwicklerteams bei der Erstellung und Wartung servicespezifischer Automatisierung
  • Standardisierte Prozesse für die Reaktion auf Vorfälle
  • Verbesserter Wissensaustausch zwischen Entwicklungs- und Betriebsteams

Vorbereitung auf die Zukunft

Indem sie bei der Automatisierung das richtige Gleichgewicht zwischen Zentralisierung und Autonomie finden, optimieren Unternehmen nicht nur ihre aktuellen Abläufe, sondern machen sich auch widerstandsfähiger gegenüber zukünftigen technologischen Veränderungen – und minimieren gleichzeitig das Risiko künftiger kaskadierender Ausfälle. Wenn die nächste Innovationswelle kommt, sind die Teams besser darauf vorbereitet, neue Tools und Praktiken in einem flexiblen und dennoch standardisierten Rahmen zu übernehmen.

Als CIO und Technologieführer besteht die Herausforderung darin, eine Umgebung zu schaffen, die Innovation und Agilität fördert und gleichzeitig die notwendigen Kontrollen und Standards aufrechterhält, um Risiken langfristig zu minimieren. Indem Sie die richtigen Plattformen und Teamstrukturen für das Vorfallmanagement und die Automatisierungsorchestrierung nutzen, können Sie dieses Gleichgewicht erreichen und Ihr Unternehmen für langfristigen Erfolg in einer zunehmend automatisierten Welt positionieren.

Bei PagerDuty möchten wir Unternehmen dabei unterstützen, diese Herausforderungen zu meistern und belastbare und skalierbare Automatisierungsstrategien zu entwickeln. Ich möchte Sie dazu ermutigen, herauszufinden, wie unsere Lösungen Sie bei der Automatisierung unterstützen und Ihnen helfen können, die richtige Balance für Ihr Unternehmen zu finden.