Ecobee améliore la santé et la productivité de ses équipes grâce à PagerDuty
Taille: 101 à 500 employés
Industrie: Technologie
Emplacement: Toronto, Ontario
Client depuis : 2016
Intégrations clés :
Fondée en 2007, ecobee est une entreprise canadienne de domotique qui conçoit des thermostats connectés en Wi-Fi pour applications résidentielles et commerciales. Ces thermostats permettent aux utilisateurs d'optimiser leur confort, de réduire leur empreinte carbone et de réaliser des économies. Derrière ce produit intuitif se cachent des déploiements continus d'applications et de services critiques, une infrastructure distribuée à l'échelle régionale et des clusters de serveurs à auto-réparation qui assurent la disponibilité des services pour sa clientèle mondiale.
Jordan Christensen, vice-président de la technologie chez ecobee, est responsable de l'infrastructure de la plateforme de l'entreprise, notamment de l'automatisation, de l'autoréparation et de la disponibilité et de la fourniture de services de bout en bout. « La mission globale de mon équipe est de construire une infrastructure fiable et tolérante aux pannes, et PagerDuty est la plateforme essentielle que nous utilisons pour mesurer et surveiller cette fiabilité », a-t-il expliqué.
Défis rencontrés
Le produit phare d'ecobee étant responsable de la régulation de la température dans des millions de bâtiments résidentiels et commerciaux, ses services doivent être disponibles en permanence. Le moindre incident ou dysfonctionnement d'une application peut engendrer des pertes de revenus ; il est donc crucial d'anticiper et de résoudre les problèmes potentiels avant qu'ils n'affectent les clients.
Afin d'offrir la meilleure expérience client possible, ecobee devait adopter une approche proactive et préventive de la gestion des incidents. Pour ce faire, ses équipes d'ingénierie avaient besoin d'une plateforme permettant une visibilité en temps réel sur l'ensemble de l'infrastructure et des services d'ecobee.
Infrastructure as Code avec Terraform
L'équipe en charge de la plateforme de Jordan s'appuie fortement sur Intégration Terraform de PagerDuty Pour intégrer leur instance PagerDuty à leur infrastructure globale en tant que code, les équipes bénéficient d'une meilleure visibilité sur l'état de leur infrastructure en temps réel et d'une gestion complète des astreintes, le tout étant défini sous PagerDuty de code dans l'environnement Terraform.
Cette technique a permis aux équipes de supprimer les tâches manuelles de gestion des astreintes et de créer des opportunités d'automatisation pour la gestion des rotations et des plannings d'astreinte entre les différentes applications et services. « L'intégration de PagerDuty au sein de l'infrastructure, sous forme de code plutôt que d'interface disparate, en fait un élément central de l'infrastructure au lieu d'un service annexe », explique Jordan. Cette meilleure visibilité et la possibilité de manipuler le code au sein de la base de code d'ecobee permettent à ses équipes de comprendre précisément l'état de l'infrastructure lorsque des incidents surviennent. Grâce à cette intégration, l'équipe ecobee s'efforce progressivement d'atteindre un taux de disponibilité de 99,9 ...
Les avantages de PagerDuty
Grâce à PagerDuty, ecobee peut gérer les incidents de manière proactive et collaborative, en bénéficiant d'une vision complète du contexte. « Les informations sont précises et ciblées, et non génériques », se souvient Jordan. La centralisation de tous les signaux provenant des conteneurs, serveurs, applications et microservices dans PagerDuty permet à ses équipes de diagnostiquer facilement les problèmes et de mobiliser automatiquement les personnes compétentes pour les résoudre avant qu'ils n'impactent le client.
L'équipe de Jordan a bénéficié de plusieurs avantages grâce à PagerDuty, notamment :
- Amélioration de la visibilité et de la communication entre les équipes d'ingénierie et les autres parties prenantes clés tout au long du cycle de vie de la gestion des incidents
- Un processus de réponse automatisé, qui réduit le travail manuel et améliore la productivité et l'équilibre entre vie professionnelle et vie personnelle.
- Les équipes qui sont habilitées à apporter des changements positifs grâce à la pratique de la responsabilisation et de l'appropriation complète des services
- La création d'un espace sécurisé permettant aux ingénieurs juniors de signaler les incidents et de travailler directement avec les ingénieurs seniors lorsqu'ils ont besoin de conseils contribue à améliorer la santé de l'équipe.
L'accent est mis sur la santé de l'équipe
Grâce à la mise en place de PagerDuty au sein de l'ensemble du département d'ingénierie, ainsi que dans d'autres unités opérationnelles et auprès des parties prenantes clés, Jordan a constaté que la direction a pu se concentrer sur le bien-être des équipes, l'équilibre vie professionnelle-vie privée et la création d'opportunités de développement pour les jeunes ingénieurs. « Avec PagerDuty, les employés se sentent en sécurité lorsqu'ils sont d'astreinte, car ils savent qu'ils peuvent remonter les problèmes aux développeurs seniors pour obtenir de l'aide et un accompagnement dans la résolution du problème », a expliqué Jordan. Les incidents mineurs se transforment souvent en occasions d'apprentissage, ce qui renforce le moral et la cohésion d'équipe au sein de l'organisation.
« Sans PagerDuty, il serait extrêmement difficile pour l'entreprise de gérer et de répondre correctement aux incidents. »
– Jordan Christensen vice-président de la technologie
L'avenir de PagerDuty avec ecobee
Ecobee prévoit de poursuivre l'utilisation et le déploiement de PagerDuty à l'échelle de l'entreprise. Plus précisément, les équipes d'ingénierie souhaitent optimiser son utilisation. Réponse moderne aux incidents PagerDuty Ils pourront ainsi mettre en œuvre des procédures de réponse pour des services spécifiques et automatiser certaines tâches au sein d'une action de réponse. Les équipes prévoient également d'exploiter l'intégration Slack de PagerDuty afin de centraliser les communications et d'améliorer la collaboration entre les équipes lors d'incidents majeurs.
De plus, ecobee souhaite formaliser une analyse post-mortem au sein de son instance PagerDuty afin de centraliser l'intégralité du cycle de vie des incidents sur une seule plateforme. L'équipe de Jordan cherche également à exploiter pleinement les capacités de l'API REST de PagerDuty pour favoriser l'automatisation et améliorer l'efficacité opérationnelle au sein de l'organisation. « Nous n'avons encore qu'effleuré le potentiel de PagerDuty», a expliqué Jordan.
Vous souhaitez en savoir plus sur la façon dont PagerDuty peut améliorer la santé de votre équipe et la gestion des incidents ? Inscrivez-vous à une formation. Essai gratuit de deux semaines dès aujourd'hui !