Größe: 1.001 - 5.000 Mitarbeiter
Industrie: Finanzdienstleistungen
Standort: Bangalore, Indien
Kunde seit: 2022
Wichtige Integrationen:
Google Cloud-Plattform
Prometheus
New Relic
Grafana Gegründet im Jahr 2017, Wachsen ist eine Investmentplattform, die es Nutzern ermöglicht, einfach, papierlos und unkompliziert in Aktien, Investmentfonds, ETFs und Gold zu investieren. Das FinTech-Unternehmen zählt zu den am schnellsten wachsenden Investmentplattformen Indiens und hat den Unicorn-Status erreicht, indem es Investitionen für neue Anleger vereinfacht und transparent gestaltet.
Betrieb unter einer Dienstleistungsverantwortung Im DevOps-Modell ist das Team für mehrere geschäftskritische Dienste verantwortlich, darunter Authentifizierungs- und Zahlungsdienste. Es muss außerdem sicherstellen, dass Kunden Marktdaten in Echtzeit einsehen und Aufträge erteilen können. Im vergangenen Jahr erreichte das Startup über 30 Millionen Nutzer und stockte sein Entwicklerteam um über 65 % auf, um das rasante Wachstum zu unterstützen.
Aman Khare, DevOps-Ingenieur, unterstützt die Infrastruktur und Sicherheit der Plattform. „Wir stellen sicher, dass die Infrastruktur reibungslos funktioniert. Wir sorgen dafür, dass unsere Kunden die bestmögliche Erfahrung auf unserer Plattform machen“, sagte er.
DevOps-Arbeit nach Feierabend
Groww hatte zwar eine Rufbereitschaftslösung im Einsatz, diese erwies sich jedoch im Krisenfall, insbesondere außerhalb der regulären Geschäftszeiten, nicht immer als zuverlässig. DevOps-Ingenieure verpassten mitten in der Nacht mitunter E-Mails und Slack-Benachrichtigungen. „Wir konnten uns nachts nicht auf Slack-Benachrichtigungen verlassen, und die Reaktionszeit war recht lang“, so Khare.
Die Einbeziehung weiterer Einsatzkräfte oder Fachexperten bei kritischen Vorfällen erforderte zusätzlichen manuellen Aufwand vom Team. Besonders ärgerlich war, dass es vorkommen konnte, dass das gesamte Team eine Benachrichtigung erhielt, über die der diensthabende Techniker keine E-Mail erhalten hatte. In solchen Fällen mussten die zuständigen Personen erst ausfindig gemacht werden, was die Lösungszeit verlängerte.
Darüber hinaus fehlte dem Team die Möglichkeit, Warnmeldungen anhand bestimmter Kriterien wie der Schwere zu unterdrücken. Einige Warnmeldungen waren außerhalb der Geschäftszeiten irrelevant und konnten bis zum nächsten Tag aufgeschoben werden. Die Vielzahl an Warnmeldungen erschwerte es den Ingenieuren, sich auf das Wesentliche zu konzentrieren.
Diese Herausforderungen führten zu schwierigen Bereitschaftsdiensten für das DevOps-Team. Es wurde deutlich, dass das Team einen besseren, mit dem Unternehmen skalierbaren Prozess zur Reaktion auf Sicherheitsvorfälle benötigte. „Wir brauchten etwas, das die Arbeit unserer Entwickler verbessert“, erklärte Khare.
Ein zuverlässiges Werkzeug für zuverlässige Ergebnisse
Nach Prüfung alternativer Optionen wählte das Team PagerDuty als zuverlässigere und umfassendere DevOps-Lösung. Durch die Nutzung einiger der über 700 über PagerDuty verfügbaren Integrationen zentralisierte Groww Warnmeldungen von Überwachungssystemen wie beispielsweise Google Cloud-Plattform , Prometheus , New Relic , Und Grafana Groww hat PagerDuty an die Bereitstellung der Dienste in der Unternehmensinfrastruktur angepasst, um Klarheit darüber zu schaffen, wer über einen Vorfall benachrichtigt werden soll, und um Kontextinformationen bereitzustellen. Dienstabhängigkeiten Die
Die flexiblen, dynamischen Benachrichtigungen von PagerDuty waren ein sofortiger Gewinn für das Team, das nun Benachrichtigungen per SMS, Anruf oder … erhalten kann. mobile App Push-Benachrichtigungen machten das Prüfen von E-Mails und Slack nach Feierabend überflüssig und verkürzten die Reaktionszeit des Teams erheblich. „PagerDuty benachrichtigt uns und stellt sicher, dass wir keine wichtigen Angelegenheiten verpassen“, so Khare.
PagerDuty ermöglicht zudem die einfache Hinzuziehung weiterer Einsatzkräfte, wenn eine funktionsübergreifende Triage erforderlich ist – beispielsweise, wenn die Sicherheits- und Datenbankteams von dem Vorfall betroffen sind. Die Bestätigung, Eskalation und Behebung von Vorfällen kann alles innerhalb der mobilen App erfolgen, sodass Teams die Reaktion auf Vorfälle von überall aus steuern können.
PagerDuty Veranstaltungsregeln Groww bietet die Flexibilität, Benachrichtigungen zu unterdrücken, die Teammitglieder nicht über Nacht aufwecken müssen, wie z. B. Benachrichtigungen mit geringer Priorität oder solche, die keine Handlungsbedarf erfordern. Die Reduzierung unnötiger Benachrichtigungen hilft dem Team, sich auf wichtige Probleme zu konzentrieren und darauf zu reagieren.
Vorteile eines verbesserten Vorfallreaktionsprozesses
PagerDuty hat seinen Wert bei Groww schnell unter Beweis gestellt und die Grundlage für einen optimierten Incident-Response-Prozess geschaffen, der das Unternehmenswachstum fördert und gleichzeitig ein hervorragendes Nutzererlebnis gewährleistet. PagerDuty hat dabei geholfen:
- Verbesserung der MTTA. Dank der dynamischen Benachrichtigungen und der anpassbaren Eskalationsrichtlinien von PagerDuty wird kein Vorfall übersehen.
- Verbesserung der mittleren Reparaturzeit (MTTR). Dank der servicebasierten Architektur von PagerDuty erreichen Benachrichtigungen die richtigen Personen schneller, was bedeutet, dass der Einsatzleiter Vorfälle schneller beheben kann.
- Das Leben wird leichter. Das mobile Störungsmanagement und die Ereignisregeln haben den manuellen Aufwand reduziert und den diensthabenden Technikern mehr Flexibilität geboten.
„Wenn die Mitarbeiter keine Zeit mit der Fehlersuche verbringen müssen und wir Ausfallzeiten vermeiden können, können sie sich auf wichtigere Aufgaben konzentrieren. Die Mitarbeiter werden zufriedener sein, wenn sie neue Produkte entwickeln, anstatt ständig Probleme zu beheben“, sagte Khare.
In die Zukunft hineinwachsen
Nachdem das DevOps-Team schnell einen Mehrwert erkannt hat, möchte es PagerDuty nun noch besser nutzen, um seine Abläufe zu optimieren. Beispielsweise plant das Team, die Alarmanalyse auszuwerten, um besser zu verstehen, welche Probleme am längsten zur Behebung benötigen. Diese Informationen helfen dabei, die wirkungsvollsten Systemverbesserungen zu ermitteln. Darüber hinaus möchte das Team PagerDuty für folgende Zwecke einsetzen: Kommunikation mit Interessengruppen um dem Unternehmen Informationen über den Umfang der Auswirkungen eines Vorfalls und den Fortschritt bei der Lösungsfindung bereitzustellen.
Um mehr darüber zu erfahren, wie PagerDuty Unternehmen bei der Transformation ihrer digitalen Abläufe unterstützt, besuchen Sie www.pagerduty.com/customers für weitere Informationen und Starten Sie noch heute Ihre 14-tägige kostenlose Testphase. Die