Blog

Wie PagerDuty und Partner Rundeck die Geschäftskontinuität für digitale Abläufe ermöglichen

von Scott McAllister 23. April 2020 | 5 Minuten Lesezeit

In Zeiten wie diesen, in denen die Welt gezwungen ist, sich anzupassen und nahezu vollständig auf Digitalisierung umzustellen, ist es unerlässlich, dass unsere Systeme und Plattformen jederzeit verfügbar und betriebsbereit sind. Wir unternehmen größte Anstrengungen, um die Zuverlässigkeit und Reaktionsfähigkeit der Hardware und Software unserer Anwendungsarchitekturen sicherzustellen. Die Hardware ist mit redundanten Backups ausgestattet, und neuer Code wird getestet und geprüft, um sicherzustellen, dass er keine Fehler in das System einschleusen kann. Diese Vorkehrungen minimieren die Auswirkungen eines Ausfalls eines Teils unserer digitalen Infrastruktur.

Doch was geschieht, wenn wir den Kontakt zu unseren Mitmenschen verlieren?

Kurz gesagt: Der Verlust (vorübergehender oder dauerhafter) von Menschen bedeutet auch den Verlust des gesamten Stammeswissens, das ein Unternehmen tatsächlich am Laufen hält.

Die ausführliche Antwort: Im digitalen Betrieb sind Störungen trotz aller Sicherheitsvorkehrungen, Tests und Überprüfungen von Hard- und Software unvermeidbar. Der Bedarf an Echtzeitlösungen für diese Probleme war noch nie so groß. Um bestmöglich auf auftretende Probleme reagieren zu können, müssen wir uns sowohl individuell als auch im Team proaktiv vorbereiten. Wir benötigen im Falle einer Störung die richtigen Informationen für die von uns verantworteten Dienste. Eine gut koordinierte Reaktion erfordert die Zusammenarbeit der richtigen Personen, die handeln können. Die Zusammenführung dieser Personen mit dem erforderlichen Wissen und Systemzugriff erfordert Planung und Weitsicht.

Tools wie PagerDuty ermöglichen es Ihren Teams, informiert zu bleiben und Maßnahmen zu ergreifen – aber, wie PagerDuty -Mitbegründer und CTO Alex Solomon in einer kürzlich ausgestrahlten Folge von … erwähnte Page It to the Limit Podcast Es ist mehr als nur ein Produkt oder eine Plattform, die Ihr Team befähigt, Vorfälle effektiv zu bewältigen. „Ich sehe immer wieder, dass man zwar die Plattform kaufen kann. Die eigentliche Herausforderung besteht aber darin, die Unternehmenskultur zu verändern und die Arbeitsweise der Mitarbeiter zu transformieren – und das hängt letztendlich von den Menschen und den Prozessen ab“, erklärte er.

Für eine erfolgreiche Unternehmenskultur ist es wichtig, dass die richtigen Personen für die Bearbeitung von Vorfällen eingeplant sind. Dies erfordert eine sorgfältige Planung, um die optimale Balance an Fachkompetenz zu gewährleisten und sicherzustellen, dass diese Experten regelmäßig im Einsatz sind. Ihre Experten müssen im Ernstfall einsatzbereit und kompetent sein. Das bedeutet, dass sie auch ausreichend freie Zeit benötigen – also Zeiten, in denen sie nicht in Bereitschaft sind und nicht reagieren müssen.

All diese Vorkehrungen dienen dazu, unsere Technologie im Notfall am Laufen zu halten. Doch was ist mit unseren Mitarbeitern? Selbst bei sorgfältigster Planung kann es vorkommen, dass unsere Fachexperten nicht erreichbar sind. Wie wir in letzter Zeit gesehen haben, können Naturkatastrophen, familiäre Notfälle oder sogar Pandemien dazu führen, dass wir plötzlich nicht mehr erreichbar sind. Dieses Risiko wird als Risiko für die Geschäftskontinuität bezeichnet, wie die Experten von Rundeck in ihrem neuen E-Book „Business Continuity“ beschreiben. Leitfaden zur Geschäftskontinuität für digitale Prozesse.

Rundeck, eine Plattform zur Automatisierung von Einsatzplänen, ermöglicht es Ihnen, jedem Teammitglied Self-Service-Zugriff auf operative Funktionen zu gewähren, die zuvor nur Ihren Fachexperten vorbehalten waren. Stellen Sie sich vor, wie viel sicherer Sie sich fühlen würden, wenn Ihre Fachexperten im Rahmen der Notfallvorbereitungen automatisierte Einsatzpläne für Aufgaben erstellen, die sie im Falle von Vorfällen häufig erwarten.

Bei der Betrachtung von Risiken für die Geschäftskontinuität hat die Erfassung des vorhandenen Wissens höchste Priorität, um Betriebsunterbrechungen zu vermeiden. Mit PagerDuty können Sie mithilfe von Ereignisanalysen, Reaktionsplänen und Eskalationsrichtlinien festhalten, wie Probleme erkannt und behoben werden (einschließlich der Modellierung von Eskalationsoptionen für den Fall, dass keine Mitarbeiter verfügbar sind). Das dynamische Serviceverzeichnis ermöglicht es Ihnen, proaktiv alle notwendigen Informationen zu Ihren Diensten sowie Runbooks zu sammeln, sodass Ihre Teams in kritischen Momenten der Störungsbehebung jederzeit schnell und einfach auf alle benötigten Informationen zugreifen können.

Mit Rundeck gehen Sie bei diesen Vorbereitungen noch einen Schritt weiter, indem Sie alle Verfahren zur Wartung, Diagnose und Reparatur Ihrer Umgebungen und Dienste erfassen. Durch die Kombination von PagerDuty und Rundeck können Sie Ihr digitales Geschäft auch dann weiterführen, wenn Ihre Fachkräfte ausfallen oder verunsichert sind.

Um Unternehmen den Übergang zu Remote-Arbeitskräften zu erleichtern, bietet Rundeck Folgendes an: umfassender Leitfaden Wie lässt sich die Geschäftskontinuität in unsicheren Zeiten sicherstellen? Der Leitfaden erklärt, dass der Schlüssel zur Sicherstellung der Geschäftskontinuität im digitalen Betrieb in drei Punkten liegt: Automatisierung, Schutzmaßnahmen und eine dynamische Infrastrukturkarte.

Die Runbook-Automatisierungsfunktion von Rundeck ermöglicht die Automatisierung wiederkehrender Aufgaben, und PagerDuty unterstützt die Einrichtung von Schutzmechanismen. Wenn nur die richtigen Personen über einen Vorfall informiert werden – also diejenigen, die über das nötige Wissen und die Zugriffsrechte verfügen, um zu handeln – und diese Personen nur die benötigten Informationen erhalten, vermeiden Unternehmen, in Krisensituationen hektisch nach Personen und Wissen suchen zu müssen. Mit der richtigen Vorbereitung und Planung werden diese Entscheidungen im Vorfeld getroffen.

Ein weiterer Aspekt beim Aufbau eines erfolgreichen Reaktionsteams ist die Abstimmung der technischen Serviceteams mit den entsprechenden Fachabteilungen. Die Infrastruktur und Softwarekomponenten von heute sind ständig in Bewegung. Durch eine enge und effektive Kommunikation zwischen den Teams und das Wissen um die wichtigsten Informationsquellen können Sie alle Beteiligten regelmäßig auf dem Laufenden halten. PagerDuty bietet hierfür einen Leitfaden an. Vollservice-Eigentum Das kann Ihrem Team helfen, sich auf diese gemeinsamen Prinzipien zu einigen.

Gut vorbereitete Teams sind reaktionsschnelle Teams. Bereiten Sie Ihre Teams auf das Unvorstellbare vor und nutzen Sie das Wissen aus den oben genannten Ressourcen. Um mehr darüber zu erfahren, wie Sie Ihre Teams (und Ihre Zeitpläne) optimal auf Zwischenfälle vorbereiten, werfen Sie einen Blick auf unsere Reaktion auf Vorfälle Betriebshandbuch. Wenn Sie über Ihre Dienste nachdenken und wie Sie Ihre technischen Dienste so konfigurieren können, dass sie zu den entsprechenden Geschäftsdiensten passen, beachten Sie Folgendes: Servicekonfiguration Leitfaden. Und um herauszufinden, wie die Runbook-Automatisierung Ihnen helfen kann, das interne Wissen zu verwalten und den Betrieb aufrechtzuerhalten, schauen Sie sich den Leitfaden von Rundeck an. Geschäftskontinuität im digitalen Betrieb Führung.