- PagerDuty /
- Der Blog /
- Integrationen /
- Wie PagerDuty und Partner Rundeck die Geschäftskontinuität für digitale Abläufe ermöglichen
Der Blog
Wie PagerDuty und Partner Rundeck die Geschäftskontinuität für digitale Abläufe ermöglichen
In Zeiten wie diesen, in denen die Welt gezwungen ist, sich anzupassen und fast vollständig digital zu werden, ist es unerlässlich, dass unsere Systeme und Plattformen jederzeit einsatzbereit bleiben. Wir unternehmen große Anstrengungen, um sicherzustellen, dass die Hardware und Software in unseren Anwendungsstapeln zuverlässig und reaktionsschnell sind. Die Hardware wird mit redundanten Backups eingerichtet und neuer Code wird getestet und überprüft, um sicherzustellen, dass er keine Fehler in das System einbringt. Diese Vorbereitungen minimieren die Auswirkungen, wenn wir einen Teil unserer digitalen Infrastruktur verlieren.
Doch was passiert, wenn wir den Kontakt zu unseren Leuten verlieren?
Kurze Antwort: Der (vorübergehende oder dauerhafte) Verlust von Mitarbeitern bedeutet auch den Verlust des gesamten Stammeswissens, das den eigentlichen Betrieb eines Unternehmens ausmacht.
Die lange Antwort: Bei digitalen Vorgängen sind Vorfälle trotz aller Sicherungen, Tests und Überprüfungen von Hard- und Software unvermeidlich. Der Bedarf an Echtzeitlösungen für diese Probleme war noch nie so groß. Um auf Probleme bestmöglich reagieren zu können, wenn sie auftreten, müssen wir uns sowohl als Einzelpersonen als auch als Teams proaktiv vorbereiten. Im Falle eines Vorfalls benötigen wir die richtigen Informationen für die Dienste, für die wir verantwortlich sind. Eine gut orchestrierte Reaktion erfordert eine koordinierte Anstrengung der richtigen Personen, die Maßnahmen ergreifen können, und das Zusammenbringen derjenigen, die über das richtige Wissen und den richtigen Systemzugriff verfügen, erfordert Planung und Weitsicht.
Tools wie PagerDuty ermöglichen es Ihren Teams, auf dem Laufenden zu bleiben und Maßnahmen zu ergreifen. Aber wie Alex Solomon, Mitbegründer und CTO von PagerDuty , in einer aktuellen Folge der Page It bis zum Limit Podcast ist mehr als ein Produkt oder eine Plattform, die Ihr Team in die Lage versetzt, Vorfälle effektiv zu bewältigen. „Ich sehe immer wieder, dass man die Plattform zwar kaufen kann. Aber der schwierige Teil ist die Veränderung der Kultur … und die Umgestaltung der Arbeitsweise der Menschen – und das hängt von den Menschen und den Prozessen ab“, erzählte er.
Als Teil einer erfolgreichen Unternehmenskultur möchten Sie sicherstellen, dass die richtigen Personen für die Bearbeitung von Vorfällen eingesetzt werden. Dies erfordert Planung, um das richtige Gleichgewicht an Fachwissen zu erreichen und sicherzustellen, dass diese Experten in einer gesunden Rotation eingesetzt werden. Sie möchten, dass Ihre Experten bei einem Vorfall aufmerksam und bereit sind. Das bedeutet, dass sie auch genügend Ausfallzeiten benötigen – mit anderen Worten, sie benötigen Zeiten, in denen sie nicht auf Abruf bereitstehen und nicht erwartet wird, dass sie reagieren.
All diese Vorkehrungen werden getroffen, um unsere Technologie im Notfall am Laufen zu halten, aber was ist mit unseren Mitarbeitern? Selbst bei aller richtigen Planung kann es Zeiten geben, in denen unsere Fachexperten (SMEs) einfach nicht verfügbar sind. Wie wir kürzlich gesehen haben, können Naturkatastrophen, familiäre Notfälle oder sogar Pandemien jeden von uns plötzlich unerreichbar machen. Diese Art von Risiko wird als Risiko für die Geschäftskontinuität bezeichnet, wie die Leute von Rundeck in ihrem neuen E-Book „The ‚Business Continuity‘“ beschreiben. Leitfaden zur Geschäftskontinuität für digitale Vorgänge. ”
Rundeck, eine Plattform für die Runbook-Automatisierung, ermöglicht es Ihnen, jedem in Ihrem Team Self-Service-Zugriff auf die Betriebsfunktionen zu gewähren, die bisher nur Ihre SMEs ausführen konnten. Überlegen Sie, wie viel wohler Sie sich fühlen würden, wenn Ihre SMEs im Rahmen der Notfallvorbereitungen Ihres Teams automatisierte Runbooks für Aufgaben erstellen würden, die sie bei Vorfällen häufig erwarten.
Wenn Sie über Risiken für die Geschäftskontinuität nachdenken, ist die Erfassung von Stammwissen die oberste Priorität, damit Ihr Geschäft nicht unterbrochen wird. Mit PagerDuty können Sie Event Intelligence, Response Plays und Eskalationsrichtlinien verwenden, um zu erfassen, wie Sie Probleme erkennen und darauf reagieren (einschließlich der Modellierung von Eskalationsoptionen, wenn keine Mitarbeiter verfügbar sind). Das dynamische Serviceverzeichnis ermöglicht Ihnen die proaktive Erfassung aller erforderlichen Informationen zu Ihren Services zusätzlich zu Runbooks, sodass Ihre Teams in den kritischen Momenten der Lösung eines Vorfalls problemlos auf das gesamte erforderliche Wissen zugreifen können.
Mit Rundeck gehen Sie bei diesen Vorbereitungen noch einen Schritt weiter, indem Sie alle Verfahren zur Wartung, Diagnose und Reparatur Ihrer Umgebungen und Dienste erfassen. Wenn Sie PagerDuty und Rundeck kombinieren, können Sie Ihr digitales Geschäft auch dann weiterführen, wenn Sie mit einer gestörten oder desorientierten Fachbelegschaft konfrontiert sind.
Um Unternehmen bei der Umstellung auf Remote-Arbeit zu unterstützen, bietet Rundeck eine umfassender Leitfaden darüber, wie Sie die Geschäftskontinuität in unsicheren Zeiten sicherstellen können. Der Leitfaden erklärt, dass der Schlüssel zur Gewährleistung der Geschäftskontinuität im digitalen Betrieb auf drei Dinge hinausläuft: Automatisierungsgeschirr, Leitplanken und eine dynamische Infrastrukturkarte.
Die Runbook-Automatisierungsfunktion von Rundeck bietet ein Mittel zur Automatisierung sich wiederholender Aufgaben, und PagerDuty kann bei der Bereitstellung von Sicherheitsvorkehrungen helfen. Wenn nur die richtigen Personen über einen Vorfall informiert werden – also diejenigen, die über das Wissen und den Zugriff verfügen, um auf das Problem zu reagieren – und diese Personen nur die Informationen erhalten, die sie benötigen, können Organisationen vermeiden, während einer Krise hektisch nach Personen und Wissen suchen zu müssen. Mit der richtigen Vorbereitung und Planung werden diese Entscheidungen im Voraus getroffen.
Ein weiterer Aspekt beim Aufbau eines erfolgreichen Reaktionsteams ist die Abstimmung der technischen Serviceteams mit den entsprechenden Geschäftsdiensten. Die heutigen Infrastruktur- und Softwarekomponenten sind ständig in Bewegung. Indem Sie eine starke Kommunikation zwischen den Teams aufbauen und aufrechterhalten und wissen, wo Sie die „Quellen der Wahrheit“ finden, können Sie alle Parteien regelmäßig auf dem Laufenden halten. PagerDuty hat einen Betriebsleitfaden für Vollständiger Service die Ihrem Team dabei helfen können, sich auf diese gemeinsamen Grundsätze zu einigen.
Vorbereitete Teams sind reaktionsschnelle Teams. Wenn Sie Ihre Teams auf das Undenkbare vorbereiten, wappnen Sie sich mit dem Wissen, das Sie in einigen der oben genannten Ressourcen finden. Weitere Informationen dazu, wie Sie Ihre Teams (und Ihre Zeitpläne) am besten auf die Bewältigung von Vorfällen vorbereiten, finden Sie in unserem Reaktion auf Vorfälle Betriebshandbuch. Wenn Sie über Ihre Dienste nachdenken und wissen möchten, wie Sie Ihre technischen Dienste so konfigurieren, dass sie mit den entsprechenden Geschäftsdiensten übereinstimmen, lesen Sie die Dienst-Konfiguration Leitfaden. Und um herauszufinden, wie die Runbook-Automatisierung Ihnen dabei helfen kann, den Überblick über Stammeswissen zu behalten und die Dinge am Laufen zu halten, lesen Sie Rundecks Geschäftskontinuität im digitalen Betrieb Führung.