Der Blog

Reden wir über AIOps: Teil 1: Was genau ist AIOps?

von Vivian Chan 9. September 2020 | 8 Minuten Lesezeit

Aktualisierung des Herausgebers: Seit der letzten Veröffentlichung dieses Blogs haben wir eine Reihe neuer Funktionen für unsere AIOps-Lösung angekündigt. Sie können mehr darüber in diesem Artikel lesen. Blogbeitrag oder erfahren Sie mehr unter https://cbandstaging.wpengine.com/use-cases/aiops/

Dies ist der erste Teil einer zweiteiligen Blogserie zur Dekonstruktion von AIOps für ITOps-Leiter.


Wenn Sie mir für jedes Unternehmen, das behauptet, „KI“ zu nutzen, einen Dollar geben würden, wäre ich ziemlich gut aufgestellt. Als Vermarkter bin ich diesen Behauptungen jedoch etwas skeptisch gegenüber. Lassen Sie mich das erklären.

Erstens gibt es über 50 Anbieter in der Gartner-Marktführer für AIOps – das sind eine Menge AIOps-„Lösungen“. Versuchen Sie dann, sich in die Lage des Kunden zu versetzen, und Sie werden sich wahrscheinlich fragen: „Woher weiß ich, was ich genau bekomme?“

Die Lage ist hart. Unternehmen stehen stärker denn je unter Druck, ihr Geschäft zu transformieren, die Digitalisierung voranzutreiben und schneller voranzukommen. Schon vor der Pandemie begannen viele IT-Organisationen, AIOps als potenzielles Investitionsfeld zu betrachten. Sie hoffen, dass Investitionen in diese neue Technologie ihre Betriebsabläufe verbessern, mehr datenbasierte Erkenntnisse liefern und ihnen eine effizientere Skalierung und schnellere Problemlösung ermöglichen.

Doch all das wirft immer noch die Frage auf: Was ist AIOps eigentlich … und, was vielleicht noch wichtiger ist, ist das alles nur Hype?

Die Sache ist: Ob Hype oder nicht, der Begriff wird nicht verschwinden. Um den Wirbel um AIOps zu zerstreuen, habe ich mich mit Julian Dunn, Director of Product Marketing bei PagerDuty, zusammengesetzt, um das Thema zu besprechen.


F: Ist AIOps nur ein Marketing-Hype?

JD : Das mag so scheinen. Doch ohne Marketing bieten sich KI und maschinellem Lernen (ML) enorme Chancen, eine wichtige Rolle in der Echtzeitarbeit zu spielen. Müsste man AIOps unbedingt definieren, wäre die einfachste Definition meiner Meinung nach, dass es die „Zukunft des Monitorings“ ist. Sie umfasst nicht nur Netzwerk, Server und Anwendungen, sondern auch das gesamte digitale Kundenerlebnis – und die Fähigkeit, diese Bereiche miteinander zu verknüpfen.

Im Echtzeitbetrieb bietet AIOps das Potenzial, Einblicke in mehrere Domänen zu gewinnen und so einen detaillierten Kontext zu den zugrunde liegenden Ursachen von Ausfällen zu liefern. Nehmen wir an, eine Anwendung ist langsam. Können wir das direkt auf den Kunden zurückführen? Liegt die Ursache beispielsweise darin, dass viele Kunden ein bestimmtes Produkt gekauft haben oder auf eine Weise mit unserer Website interagiert haben, die die Anwendung verlangsamt hat? Das ist der Traum, dem wir als Branche gerade in kleinen Schritten näher kommen.

KI und maschinelles Lernen klingen zwar nach hochtrabenden Begriffen, aber bedenken Sie: Im Grunde stecken dahinter Algorithmen, Mathematik und Statistik. Wir verfügen heute über eine unglaubliche Datenmenge und ebenso viel Rechenleistung in der Cloud, die wir darauf anwenden können – auf eine Art und Weise, die vor zehn Jahren noch nicht möglich war. Ironischerweise ist es also ein Problem, mit dem sich ML-Algorithmen gerne beschäftigen, wenn Kunden sagen: „Ich kann mit so vielen Daten nicht umgehen.“ Je mehr Daten Sie haben, desto praktikabler und präziser kann ein KI-Modell trainiert werden.

Ich möchte jedoch zur Vorsicht mahnen: Stellen Sie sicher, dass Kunden das Geschäftsproblem, das sie mit AIOps lösen möchten, klar artikulieren können. Andernfalls ist es nur ein weiteres Spaß-Tool.

F: Was bewegt die Leute eigentlich dazu, AIOps zu kaufen?

JD : Es gibt zwei Dinge, die wir am häufigsten von IT-Leitern hören:

  • Sie wollen mit der gleichen Anzahl an Mitarbeitern mehr erreichen. Infrastruktur und Datenvolumen wachsen astronomisch, und sie verfügen nicht über das Betriebsbudget, um mehr Personal einzustellen.
  • Sie möchten das Risiko verringern und hoffen, dass KI dabei hilft, die Grundursache schneller zu finden und die Zusammenarbeit bei der Problembehebung zu beschleunigen.

Das ist also der Ansatzpunkt für das Versprechen von KI für Echtzeit-Operationen. Ich leugne nicht, dass KI wertvoll ist und sein kann, aber sie ist sicherlich kein Allheilmittel, das alle Probleme der zentralen IT löst. Manches, was sie erreichen wollen, ist schlicht nicht leicht zu erreichen, und manches ist vielleicht sogar im Bereich der Informatik nicht möglich.

Mit aktuellen AIOps-Lösungen ist es beispielsweise möglich, Empfehlungen zum aktuellen Verhalten abzugeben, die dem früheren Verhalten sehr ähnlich sind. Beispiel: „Dienst X ist Dienst Y nachgelagert. Wir stellen fest, dass Vorfälle bei Dienst Y in den meisten Fällen innerhalb von fünf Minuten Vorfälle bei Dienst X verursachen. Empfehlung: Schauen Sie sich Dienst Y vor Dienst X an.“

Nicht erreichbar ist jedoch die Fähigkeit, Verhaltensweisen vorherzusagen bzw. zu erkennen, die stark von früheren abweichen – genau das wünschen sich die Kunden und viele Anbieter behaupten, dazu in der Lage zu sein. In der Kybernetik nennt man dies das „Gesetz der erforderlichen Varietät“ (Sie können es nachschlagen).

Mit anderen Worten: Statistiken und Daten über vergangene Vorfälle und menschliches Verhalten, die kontinuierlich in ein KI-Modell eingespeist werden, können uns helfen, sichere Annahmen zu treffen, wenn diese eng mit vergangenen Vorfällen zusammenhängen. Viele Menschen suchen jedoch nach einer „KI-Zaubermaschine“, die ihnen hilft, Probleme zu erkennen und zu lösen, selbst wenn aktuelle Daten und Verhaltensweisen deutlich von früheren Beobachtungen abweichen. Darin liegt die Herausforderung – und die Enttäuschung.

F: Lassen Sie mich hier kurz den Advocatus Diaboli spielen. Hat die IT tatsächlich ein AIOps-Problem?

JD : Nach unseren Beobachtungen haben unsere Kunden tatsächlich ein AIOps-Problem – es ist nur oft nicht das, das sie vermuten.

In den meisten Fällen – und unsere Gespräche mit Branchenanalysten bestätigen dies – ist es eine zentrale IT-Organisation, die eine AIOps-Lösung anschaffen möchte. Zu den Aufgaben gehören typischerweise die Reduzierung von Störungen, die Erkennung von Anomalien und die Korrelation von Ereignissen über verschiedene Dienste hinweg. Ohne jedoch in die Theorie einzusteigen, stößt dies häufig auf dieselben Machbarkeitsprobleme, die ich oben beschrieben habe. Beispielsweise ist es schwierig, etwas mit hoher Sicherheit als Anomalie zu bezeichnen, die Maßnahmen erfordert, wenn man es noch nie zuvor gesehen hat.

Der andere blinde Fleck zentraler IT-Organisationen besteht darin, dass sie oft übersehen, dass sich die Betriebswelt verändert hat. Betriebsteams übernehmen zunehmend eine dezentrale „Full-Service-Verantwortung“, bei der die einzelnen Geschäftsbereiche ihre eigenen Technologieteams mit jeweils eigener Kultur, Geschwindigkeit, Toolchain usw. besetzen.

Interessanterweise macht diese Dezentralisierung AIOps tatsächlich praktikabler, da sie Ereignisse so trennt, dass sie für Algorithmen einfacher zu verarbeiten sind. Dennoch sehen wir oft, wie zentrale IT-Organisationen sich gegen die Umstellung auf dezentrales Eventmanagement wehren, obwohl es allen das Leben erleichtern würde!

Darüber hinaus gibt es auch ein kulturelles und organisatorisches Problem. Ein AIOps-Ansatz, der sich nur auf die Bedürfnisse des zentralisierten Teams konzentriert, wird nicht den gewünschten ROI liefern. Denn wenn Sie eine solche Lösung kaufen und versuchen, sie den dezentralen Teams aufzuzwingen, werden diese sich wehren, was die Erreichung der angestrebten Geschäftsziele erheblich erschwert.

Denken Sie an zentrale Teams, die versuchen, ITSM-Lösungen zu kaufen und sie den Entwicklern aufzudrängen – das geht selten gut. Und eines der Geschäftsziele, das in der Eile, neue Funktionen bereitzustellen, untergeht, ist die Notwendigkeit der Zusammenarbeit technischer Teams, insbesondere zwischen zentralen und dezentralen Gruppen. Die ganze KI-gestützte Lärmreduzierung nützt nichts, wenn die Teams nicht kommunizieren, wenn etwas schiefgeht, weil sie sich weigern, die Tools der anderen zu nutzen.

Halten Sie nächste Woche Ausschau nach Teil 2 dieses Themas. Darin sprechen wir über wichtige Überlegungen, die IT-Leiter bei der Suche nach einer AIOps-Lösung berücksichtigen sollten. Außerdem erläutern wir den Ansatz und die Investitionsbereiche von PagerDuty, um AIOps für unsere Kunden zum Leben zu erwecken.


Um den Hype um AIOps weiter zu reduzieren, haben Julian und ich gemeinsam ein Webinar mit unserem Senior Vice President für Produkt und Produktmarketing, Jonathan Rende, zu diesem Thema zusammengestellt. „AIOps erklärt: Was es ist und wie es Echtzeit-Operationen verbessern kann.“ Sie können sich die Aufzeichnung jederzeit ansehen, um einen Eindruck davon zu bekommen, wie wir bei PagerDuty die vielen verschiedenen Philosophien rund um AIOps analysieren und unsere eigene Perspektive auf das Thema formulieren. Im Webinar zeigt Jonathan außerdem, wie Sie Technologien bewerten können, die AIOps versprechen, um Ideen zu entwickeln, wie sich AIOps in Ihre Strategie einfügen lässt.

Dies ist nur die Spitze des Eisbergs dessen, was PagerDuty zu bieten hat, wenn Wir helfen unseren Kunden, Intelligenz und Automatisierung zu nutzen um die Echtzeitarbeit zu erleichtern, damit sich Teams auf Innovationen konzentrieren können, anstatt Probleme zu lösen. Außerdem werden wir in wenigen Wochen auf unserer Jahreskonferenz, dem PagerDuty Summit, einige wichtige Produktankündigungen bekannt geben. Falls Sie es also noch nicht getan haben, Registrieren Sie sich noch heute kostenlos um Ihren Platz zu sichern!