PagerDuty améliore la visibilité du site de comparaison de prix Verivox.
Taille: Plus de 500 employés
Industrie: Technologie
Emplacement: Heidelberg, Allemagne
Client depuis : 2018
Verivox, l'un des principaux comparateurs de services en Allemagne (énergie, téléphonie mobile, assurances, etc.), compte plus de huit millions de clients qui comparent les prix et changent de fournisseur. Face à une telle demande d'informations fiables, le site web de Verivox se doit d'être stable et fiable. Avec une concurrence féroce, 13 équipes de développement qui déploient de nouvelles fonctionnalités chaque semaine et des équipes d'ingénierie réparties sur tout le territoire, l'entreprise avait besoin d'une solution plus performante pour automatiser et faire évoluer ses opérations numériques afin de minimiser les interruptions de service.
Auparavant, Verivox s'appuyait sur son équipe d'ingénierie de la fiabilité des sites (SRE) pour examiner manuellement les alertes et informer les équipes des incidents. Cependant, les protocoles d'alerte de l'entreprise déclenchaient régulièrement des alertes non valides, consommant des ressources considérables et compromettant la visibilité sur l'état du réseau. De plus, avec une seule personne d'astreinte une semaine entière après les heures de bureau (week-ends compris), Verivox risquait à la fois l'épuisement professionnel de son personnel et le risque de manquer des alertes importantes en pleine nuit.
« En éliminant les interactions manuelles, PagerDuty a permis à notre processus d'alerte de faire un grand pas en avant. Et nous ne perdons plus la trace des incidents qui affectent la production. »
– Responsable SRE, Verivox
Du manuel à l'automatisé
Selon le responsable de l'ingénierie de la fiabilité des sites, « Notre priorité absolue était d'automatiser les alertes grâce à PagerDuty . » Avec plus de 200 intégrations, PagerDuty a permis à Verivox de connecter facilement sa plateforme de gestion des opérations PagerDuty à tous ses outils de surveillance (comme New Relic, Zabbix et AWS CloudWatch) au sein de son environnement de production hybride, composé de bases de données, d'applications cloud, de serveurs Windows et Linux, etc.
L'automatisation de PagerDuty a permis à Verivox de mieux définir et d'attribuer les rôles d'astreinte. Ainsi, l'entreprise peut immédiatement acheminer les incidents vers les personnes compétentes, évitant ainsi à un intermédiaire de décrocher le téléphone et de rechercher un interlocuteur. Si l'équipe d'astreinte a besoin de renforts, elle peut déclencher une procédure d'intervention pour mobiliser automatiquement les personnes adéquates. « En éliminant les interventions manuelles, PagerDuty a considérablement amélioré notre système d'alerte », a-t-il déclaré. « Nous ne perdons plus la trace des incidents ayant un impact sur la production. »
« Nous réagissons et résolvons les incidents plus rapidement que jamais auparavant, ce qui est vraiment important étant donné la brièveté de notre cycle de développement », a-t-il ajouté.
L'automatisation permet également de lisser les fluctuations saisonnières de l'activité de Verivox en standardisant le processus d'astreinte et en permettant à l'entreprise de mieux prévoir ses coûts. Grâce à PagerDuty, les équipes d'astreinte assurent désormais une couverture complète et continue tout au long de l'année, garantissant un niveau d'expertise constant, même en dehors de la période de pointe du quatrième trimestre.
Une meilleure visibilité met en lumière les opérations numériques
Grâce à PagerDuty, Verivox comprend mieux les incidents : l’équipe de Spitschak peut désormais consulter le nombre exact d’incidents par service et leur rapidité de résolution. Ces données leur permettent de déterminer si la plateforme fonctionne correctement ou si un service particulier est impacté. Avec les nombreuses fonctionnalités de l’API de PagerDuty, Verivox peut générer différents rapports et systèmes d’alerte, et configurer la maintenance automatisée.
« PagerDuty nous offre une vision plus globale. Auparavant, nous devions prendre des décisions au feeling. Grâce à PagerDuty, nous avons une image plus claire de ce qui se passe dans notre environnement de production », a-t-il déclaré.
Cette transparence accrue permet également à Verivox d'améliorer la qualité de sa surveillance et de ses alertes. Grâce à la suppression des alertes obsolètes et invalides de PagerDuty, la surveillance est désormais bien plus performante. Moins d'alertes signifient également moins d'incidents à traiter. « Auparavant, notre système d'alerte envoyait 10 à 20 fois plus d'e-mails que nécessaire à la personne d'astreinte », explique-t-il. « Désormais, le ratio est d'environ 1:1. »
Perspectives d'avenir
L'entreprise prévoit prochainement de déployer PagerDuty dans toute son organisation et chez ses filiales. « Grâce à PagerDuty, nous avons une vision beaucoup plus claire de l'état de notre environnement de production, et nous étudions les fonctionnalités de PagerDuty. » Console de commandes des opérations et Service de gestion de la santé opérationnelle « », a-t-il dit.
Si Verivox a initialement choisi PagerDuty pour ses fonctionnalités d'alerte, l'entreprise l'utilise désormais pour optimiser d'autres aspects clés de la gestion de ses opérations numériques. Consciente que l'optimisation des ressources est essentielle pour les entreprises à forte croissance comme Verivox qui souhaitent conserver leur avantage concurrentiel, elle prévoit également d'utiliser PagerDuty pour définir et mesurer ses indicateurs clés de performance.
Visite www.pagerduty.com Pour plus de détails sur la solution de gestion des opérations numériques de PagerDuty ou pour obtenir des informations, des stratégies et une expérience pratique lors de l'un de nos nombreux événements, veuillez nous contacter. événements à venir .