PagerDuty améliore la visibilité du site de comparaison de consommateurs Verivox
Taille: Plus de 500 employés
Industrie: Technologie
Emplacement: Heidelberg, Allemagne
Client depuis : 2018
Verivox, l'un des principaux comparateurs allemands de services publics, de téléphonie mobile, d'assurances et autres, dessert plus de huit millions de consommateurs souhaitant comparer les prix et changer d'opérateur. Face à un tel nombre de clients qui comptent sur Verivox pour obtenir des informations précises, son site web doit rester stable et fiable. Face à la concurrence qui le talonne, à ses 13 équipes de développement qui publient chaque semaine de nouvelles fonctionnalités et à ses équipes d'ingénierie dispersées dans tout le pays, l'entreprise avait besoin d'une meilleure solution pour optimiser et automatiser ses opérations numériques afin de limiter les temps d'arrêt.
Par le passé, Verivox s'appuyait sur son équipe d'ingénierie de fiabilité des sites (SRE) pour examiner manuellement les alertes et signaler les incidents aux équipes. Cependant, les protocoles d'alerte de l'entreprise déclenchaient régulièrement des alertes non valides, ce qui accaparait les ressources et empêchait la visibilité sur l'état du réseau. De plus, avec une seule personne d'astreinte pendant une semaine entière après les heures de bureau (week-ends inclus), Verivox risquait à la fois de provoquer un épuisement professionnel et de manquer des alertes importantes en pleine nuit.
En éliminant les interactions manuelles, PagerDuty a permis à notre processus d'alerte de progresser considérablement. Nous ne perdons plus de vue les incidents qui affectent la production.
– Responsable SRE, Verivox
Du manuel à l'automatisé
Selon le responsable de l'ingénierie de fiabilité des sites, « Nous avions avant tout besoin de PagerDuty pour automatiser les alertes. » PagerDuty comptant plus de 200 intégrations, Verivox a pu facilement connecter sa plateforme de gestion des opérations PagerDuty à tous ses outils de surveillance, tels que New Relic, Zabbix et AWS Cloudwatch, sur l'ensemble de son environnement de production hybride (bases de données, applications cloud, serveurs Windows et Linux, etc.).
L'automatisation de PagerDuty a permis à Verivox de mieux définir et attribuer les rôles d'astreinte. Ainsi, l'entreprise peut immédiatement rediriger les problèmes vers les personnes compétentes, sans avoir à appeler un intermédiaire pour contacter quelqu'un. Si l'équipe d'astreinte a besoin de ressources supplémentaires, elle peut lancer un scénario d'intervention pour contacter automatiquement les personnes concernées. « En éliminant les interactions manuelles, PagerDuty a permis à notre processus d'alerte de faire un grand pas en avant », a-t-il déclaré. « Et nous ne perdons plus la trace des incidents qui impactent la production. »
« Nous réagissons et résolvons les incidents plus rapidement que jamais, ce qui est vraiment important puisque notre cycle de développement est très court », a-t-il ajouté.
L'automatisation permet également d'équilibrer les fluctuations saisonnières du flux de travail de Verivox en standardisant le processus d'astreinte et en permettant à l'entreprise de mieux anticiper les coûts. Grâce à PagerDuty, les équipes d'astreinte assurent désormais la même couverture complète tout au long de l'année, maintenant un niveau d'expertise constant au-delà de la période de pointe du quatrième trimestre.
Une visibilité améliorée met en lumière les opérations numériques
Grâce à PagerDuty, Verivox comprend désormais mieux les incidents : l'équipe de Spitschak peut connaître le nombre exact d'incidents par service et leur rapidité de résolution. Ces données l'aident à déterminer si la plateforme fonctionne correctement ou si un service particulier est impacté. Grâce aux riches fonctionnalités API de PagerDuty, Verivox peut générer différents rapports et mécanismes d'alerte, et mettre en place une maintenance automatisée.
« Avec PagerDuty, nous bénéficions d'une vision plus globale. Auparavant, nous devions prendre des décisions au feeling. Avec PagerDuty, nous avons une vision plus claire de ce qui se passe dans notre environnement de production », a-t-il déclaré.
Cette transparence accrue permet également à Verivox d'améliorer la qualité de la surveillance et des alertes. Grâce à la suppression des alertes invalides et obsolètes de PagerDuty, la surveillance est désormais bien plus performante. Et avec moins d'alertes, Verivox gère moins d'incidents. « Auparavant, notre système d'alerte envoyait 10 à 20 fois plus d'e-mails que ce dont la personne d'astreinte avait besoin pour réagir », a-t-il expliqué. « Aujourd'hui, le ratio est plutôt de 1:1. »
Regard vers l'avenir
L'entreprise prévoit bientôt de déployer PagerDuty dans toute son organisation et ses filiales. « Avec PagerDuty, nous avons une vision beaucoup plus claire de la santé de notre environnement de production, et nous étudions les Console de commande des opérations et Service de gestion opérationnelle de la santé ', a-t-il déclaré.
Si Verivox a initialement choisi PagerDuty pour ses fonctionnalités d'alerte, l'entreprise l'utilise désormais pour améliorer d'autres aspects clés de sa gestion des opérations numériques. Et comme l'optimisation des ressources est essentielle pour permettre aux entreprises en forte croissance comme Verivox de conserver une longueur d'avance sur un marché concurrentiel, l'entreprise prévoit également d'utiliser PagerDuty pour définir et mesurer des indicateurs clés de performance.
Visite www.pagerduty.com pour plus de détails sur la solution de gestion des opérations numériques de PagerDuty ou pour obtenir des informations, des stratégies et une expérience pratique dans l'un de nos nombreux événements à venir .