PagerDuty image

Groww choisit PagerDuty pour une meilleure expérience DevOps

PagerDuty image

Taille: 1 001 à 5 000 employés

Industrie: Services financiers

Emplacement: Bangalore, Inde

Client depuis : 2022

Intégrations clés :

Plateforme Google Cloud
Prométhée
New Relic
Grafana

Fondée en 2017, Cultiver Cette plateforme d'investissement permet aux utilisateurs d'investir en actions, fonds communs de placement, ETF et or de manière simple, dématérialisée et sans tracas. Cette FinTech est l'une des plateformes d'investissement à la croissance la plus rapide en Inde et a atteint le statut de licorne en simplifiant et en rendant l'investissement transparent pour les nouveaux investisseurs.

Fonctionnant sous un propriété de service Dans ce modèle, l'équipe DevOps est responsable de plusieurs services critiques, notamment l'authentification et les paiements. Elle doit également garantir l'accès des clients aux données de marché en temps réel et la possibilité de passer des ordres. Au cours de l'année écoulée, la startup a dépassé les 30 millions d'utilisateurs et a augmenté ses effectifs d'ingénierie de plus de 65 % pour accompagner sa croissance rapide.

Aman Khare, ingénieur DevOps, contribue au bon fonctionnement de l'infrastructure et à la sécurité de la plateforme. « Nous veillons à ce que l'infrastructure soit opérationnelle et que nos clients bénéficient de la meilleure expérience possible sur notre plateforme », a-t-il déclaré.

Travail DevOps après les heures de travail

Groww disposait d'une solution de gestion des astreintes, mais celle-ci n'était pas toujours fiable en cas d'incident, notamment en dehors des heures ouvrables. Il arrivait que les ingénieurs DevOps manquent des notifications par e-mail et Slack en pleine nuit. « Nous ne pouvions pas compter sur Slack pour les notifications tard le soir, et le délai de réponse était assez long », explique Khare.

L'implication d'autres intervenants ou d'experts lors d'incidents critiques nécessitait un travail manuel de la part de l'équipe. Plus frustrant encore, il arrivait qu'une équipe entière reçoive une alerte sans que l'ingénieur d'astreinte n'en ait été informé par courriel. Ces situations impliquaient de retrouver les personnes concernées, ce qui ralentissait la résolution du problème.

De plus, l'équipe ne disposait d'aucun moyen de désactiver les alertes en fonction de critères tels que leur gravité. Certaines alertes n'étaient pas pertinentes en dehors des heures de bureau et pouvaient être traitées le lendemain. Ce trop grand nombre d'alertes empêchait les ingénieurs de se concentrer sur l'essentiel.

Ces difficultés ont rendu les astreintes complexes pour l'équipe DevOps. Il est devenu évident que l'équipe avait besoin d'un processus de réponse aux incidents plus performant et évolutif. « Nous avions besoin d'une solution qui améliore l'expérience de nos développeurs », explique Khare.

Un outil fiable pour des résultats fiables

Après avoir exploré d'autres options, l'équipe a sélectionné PagerDuty comme solution DevOps plus fiable et complète. En tirant parti de certaines des plus de 700 intégrations disponibles via PagerDuty, Groww a centralisé les alertes provenant de systèmes de surveillance tels que Plateforme Google Cloud , Prométhée , New Relic , et Grafana Groww a personnalisé PagerDuty pour l'adapter au déploiement des services dans l'infrastructure de l'entreprise, clarifiant ainsi les personnes à notifier en cas d'incident et fournissant un contexte plus précis. dépendances de service .

Les notifications flexibles et dynamiques de PagerDuty ont immédiatement été un atout pour l'équipe, qui peut désormais recevoir des notifications par SMS, appel ou application mobile Les notifications push ont permis d'éviter de consulter ses e-mails et Slack en dehors des heures de travail, et ont considérablement amélioré le délai moyen de réponse de l'équipe. «PagerDuty nous appelle et nous assure de ne jamais manquer un problème critique », a déclaré Khare.

PagerDuty facilite également l'intervention de renforts lorsqu'un triage interfonctionnel est nécessaire, par exemple si les équipes de sécurité et de bases de données sont impactées par l'incident. La prise en compte, l'escalade et la résolution des incidents peuvent être effectuées directement depuis l'application mobile, permettant ainsi aux équipes de gérer la réponse aux incidents où qu'elles soient.

PagerDuty Règles de l'événement Groww dispose ainsi de la possibilité de désactiver les alertes qui n'ont pas besoin de mobiliser les équipes pendant la nuit, comme les alertes de faible gravité ou non exploitables. En réduisant les alertes inutiles, l'équipe peut se concentrer sur les problèmes importants et y répondre plus efficacement.

Avantages d'un processus de réponse aux incidents amélioré

PagerDuty a rapidement démontré sa valeur chez Groww, jetant les bases d'un processus de réponse aux incidents plus efficace qui stimulera la croissance de l'entreprise tout en garantissant une excellente expérience utilisateur. PagerDuty a notamment permis :

  • Améliorer le MTTA. Les notifications dynamiques et les politiques d'escalade personnalisables de PagerDuty garantissent qu'aucun incident ne soit manqué.
  • Améliorer le MTTR. Grâce à l'architecture basée sur les services de PagerDuty, les notifications parviennent plus rapidement aux bonnes personnes, ce qui permet à l'intervenant de résoudre les incidents plus rapidement.
  • Simplifiez-vous la vie. La gestion mobile des incidents et les règles relatives aux événements ont permis de réduire les interventions manuelles et d'offrir une plus grande flexibilité aux ingénieurs d'astreinte.

« Si les employés n'ont pas à passer du temps à corriger les bugs et que nous parvenons à éviter les interruptions de service, ils pourront se concentrer sur des tâches plus importantes. Ils seront plus satisfaits de développer de nouveaux produits plutôt que de devoir éteindre des incendies », a déclaré Khare.

Grandir vers l'avenir

Ayant constaté un retour sur investissement rapide, l'équipe DevOps souhaite explorer davantage les possibilités offertes par PagerDuty pour optimiser ses opérations. Par exemple, elle prévoit d'analyser les alertes afin de mieux comprendre quels problèmes sont les plus longs à résoudre. Ces informations permettront de déterminer les améliorations système les plus efficaces. L'équipe envisage également d'utiliser PagerDuty pour… communications avec les parties prenantes Fournir à l'entreprise des informations sur l'étendue de l'impact d'un incident et sur les progrès réalisés en vue de sa résolution.

Pour en savoir plus sur la façon dont PagerDuty aide les entreprises à transformer leurs opérations numériques, consultez le site web. www.pagerduty.com/clients pour plus d'informations et Commencez votre essai gratuit de 14 jours dès aujourd'hui .