DraftKings marque un touchdown avec PagerDuty

PagerDuty image

Taille: Plus de 1 000

Industrie: Médias et divertissement

Emplacement: Boston, Massachusetts

Client depuis : 2013

DraftKings est une entreprise de divertissement et de jeux sportifs numériques qui stimule l'esprit de compétition des amateurs de sport. Elle propose des jeux de fantasy sports quotidiens, des paris sportifs et un casino, offrant ainsi aux fans la possibilité de miser sur leur équipe favorite.

Le marché du jeu en ligne aux États-Unis, en pleine expansion, intensifie la concurrence. DraftKings s'efforce de proposer les meilleures offres, les plus fiables et les plus centrées sur le client, tout en se développant rapidement sur de nouveaux marchés, comme celui des jetons non fongibles (NFT). Josh Engels, directeur de la gestion des problèmes chez DraftKings, est chargé de garantir un environnement stable pour offrir la meilleure expérience possible aux joueurs. La priorité est de renforcer la résilience de l'entreprise en fournissant un cadre de gestion des incidents permettant aux équipes de DraftKings de résoudre leurs problèmes de manière autonome. « Notre croissance rapide et notre expansion sur de nouveaux marchés entraînent de nombreux changements au niveau de l'infrastructure. Nous devons garantir notre stabilité et offrir une excellente expérience client », explique Engels.

Graphic that shows: Issues proactively identified by internal stakeholders is above 90%; Mean time to respond is under 30 minutes; A highly available platform translates to fan loyalty.

Attention à Gronk Spike

Les week-ends de football américain représentent un test crucial pour la plateforme. Chaque jour de match, un flux constant d'utilisateurs de jeux de fantasy football compose leurs équipes avant le coup d'envoi. Dès le premier touchdown, DraftKings enregistre ce qu'ils appellent un « pic Gronk ». Les fans ouvrent et actualisent leurs applications, doublant souvent le trafic sur la plateforme et mettant à rude épreuve l'infrastructure. Pour éviter des pertes de revenus, l'entreprise doit garantir la disponibilité et la stabilité de sa plateforme malgré le chaos permanent des jours de match. « Le marché du jeu vidéo est extrêmement concurrentiel », explique Engels. « Si un client ne peut pas accéder à notre service, il se tournera immédiatement vers un concurrent. »

Durant ses premières années, DraftKings s'appuyait sur quelques personnes clés connaissant parfaitement son infrastructure pour surveiller activement les systèmes et résoudre les problèmes. Ces personnes étaient constamment rivées à leurs ordinateurs portables, qu'elles transportaient toute la journée, ce qui les éloignait souvent de leurs autres responsabilités. Avec l'expansion de l'entreprise et l'augmentation du nombre d'utilisateurs de la plateforme, le nombre d'équipes et de services a également crû. Engels a déclaré : « Personne ne souhaite surveiller manuellement un tableau de bord 24 h/24 et 7 j/7. Nous voulons être alertés uniquement lorsque nous devons être informés d'un incident. »

La complexité croissante de la gestion technologique a engendré une surcharge d'alertes et un épuisement professionnel chez les ingénieurs. Il devenait difficile de dégager du temps pour travailler sur de nouveaux projets, des projets qui permettraient à DraftKings de conserver son avantage concurrentiel. Engels a expliqué : « Nous devons aider les équipes à comprendre pourquoi elles reçoivent des alertes et à identifier les tendances, afin qu'elles puissent consacrer plus de temps à l'innovation. »

Utiliser PagerDuty pour rationaliser les opérations et stimuler les améliorations

Les équipes de DraftKings ont adopté un modèle de propriété des services Chaque gamme de produits était responsable de l'écriture et du support de son propre code en production. Ces équipes opéraient selon le cadre de gestion des incidents de l'équipe de gestion des problèmes, avec PagerDuty comme outil de suivi. plateforme d'opérations numériques PagerDuty a permis une visibilité sur l'ensemble des systèmes et a permis à DraftKings de gérer rapidement les incidents et de réduire les problèmes récurrents.

DraftKings a intégré ses principaux systèmes de surveillance à PagerDuty et a mis en place des calendriers et des procédures d'escalade. Les équipes n'ont plus besoin de transporter un ordinateur. Désormais, la personne compétente est avertie en cas de problème, ce qui leur offre flexibilité et autonomie. Engels explique : « Avec PagerDuty, lorsqu'un service rencontre un problème, nous savons précisément qui est chargé de le résoudre et où se déroule la communication. Cela nous a permis de développer considérablement notre activité. »

Lors du déploiement de services par les équipes, tout est centralisé dans PagerDuty. Afin de réduire les tâches manuelles et répétitives, un outil logiciel d'infrastructure en tant que code est utilisé pour la configuration initiale et l'intégration. Chaque fois qu'un nouveau service est déployé, il est automatiquement créé dans PagerDuty et configure les intégrations spécifiques requises. Cela permet à DraftKings de standardiser ses processus. listes de service Dans PagerDuty, Engels a commenté : « PagerDuty permet de consulter les services que nous utilisons et d’identifier leurs propriétaires. Maintenir cette information était complexe pour une entreprise en pleine croissance. La clarté concernant la propriété des services constitue un autre avantage majeur de PagerDuty. »

La gestion des problèmes utilise PagerDuty pour garantir la stabilité et la disponibilité du produit pour les clients. Les rapports PagerDuty fournissent des indicateurs permettant d'identifier les tendances, par exemple, un nombre important d'incidents liés à une fonctionnalité particulière. Ces données servent à communiquer avec l'ensemble des services de l'entreprise, jusqu'au directeur technique, en fournissant des informations sur l'état des incidents, le délai moyen de résolution et les SLA. Engels explique : « Ces indicateurs nous permettent de prendre des décisions et d'impulser des améliorations à tous les niveaux de l'organisation. »

Le guide pratique de PagerDuty

DraftKings a mis en œuvre PagerDuty réponses En cas d'incidents majeurs (situations où le nombre d'alertes est trop important pour être géré par une seule personne, ou lorsque plusieurs personnes reçoivent des alertes concernant un même problème), la procédure d'intervention mobilisera un ingénieur clé possédant une expertise métier sur l'ensemble de l'infrastructure, en tant que responsable de l'incident. Cette procédure peut également créer une visioconférence dédiée à l'incident, à laquelle les intervenants pourront se connecter via PagerDuty. Ceci permet une résolution rapide lors des moments les plus critiques pour DraftKings.

En cas de panne, DraftKings utilise également des systèmes de réponse pour alerter les clients au plus vite. L'équipe Expérience Client est notifiée et peut réagir immédiatement en affichant une bannière dans l'application et en diffusant des communications sur les réseaux sociaux. Cela améliore l'expérience des fans en les tenant informés de la situation. Par ailleurs, si un client est le premier à signaler un problème, l'équipe Expérience Client utilise PagerDuty. intégration du courrier électronique pour créer un incident et en informer les équipes concernées.

«PagerDuty nous permet d'être informés des problèmes avant même que les clients ne le sachent… PagerDuty a vraiment amélioré notre efficacité en tant qu'entreprise. »

– Josh Engels Responsable de la gestion des problèmes chez DraftKings

Avantages de PagerDuty

Grâce à PagerDuty, DraftKings a amélioré la résilience de son ingénierie et la stabilité de sa plateforme. Les ingénieurs n'ont plus besoin de transporter leurs ordinateurs portables et les pics de Gronk sont maîtrisés grâce à PagerDuty qui orchestre la réponse adéquate à chaque fois.

Depuis la mise en place de PagerDuty, DraftKings a bénéficié des avantages suivants :

    • Expérience client et fidélisation. DraftKings fidélise les fans sur un marché concurrentiel en maintenant une plateforme hautement disponible et en communiquant de manière proactive lorsque des problèmes surviennent.
    • Gestion des incidents. Le cadre de gestion des problèmes, incluant la plateforme PagerDuty pour les opérations numériques et un modèle de propriété des services, garantit que la bonne personne est avertie et peut résoudre rapidement les incidents.
    • Innovation. Les ingénieurs peuvent ainsi se concentrer sur le développement des gammes de produits sans être distraits ni épuisés par la surveillance active de l'infrastructure.
    • Configuration flexible. Outre l'intégration aux systèmes de surveillance, les équipes peuvent également intégrer les outils spécifiques à leur gamme de produits et définir des planifications et des politiques adaptées à leurs besoins. L'ensemble de ces opérations est simplifié grâce à l'infrastructure en tant que code.
    • Prise de décision fondée sur les données : DraftKings utilise les rapports PagerDuty pour optimiser ses opérations. Le MTTR est désormais inférieur à 30 minutes et plus de 90 % des problèmes sont identifiés proactivement par les parties prenantes internes, ce qui représente une amélioration significative.
    • Communication améliorée. PagerDuty permet une communication à l'échelle de l'entreprise pour une réponse rapide, notamment pour les services d'ingénierie, l'expérience client et les principaux acteurs commerciaux.

DraftKings s'efforce d'offrir la meilleure expérience possible à ses fans tout en restant compétitif et en captant un maximum de mises. Engels a déclaré : « PagerDuty nous permet d'être informés des problèmes avant même que les clients ne les remarquent. DraftKings a des exigences strictes en matière de disponibilité et de service, et dépasse désormais constamment ses objectifs. PagerDuty a vraiment contribué à améliorer notre efficacité. »

Où placer mon prochain pari ?

DraftKings continuera de privilégier la santé des équipes. L'équipe de gestion des problèmes prévoit d'explorer les solutions de PagerDuty. Renseignements sur les événements , notamment grâce à une réduction intelligente du bruit, afin de minimiser le nombre d'alertes que reçoivent les ingénieurs d'astreinte lors d'un incident. En éliminant les interruptions, les intervenants peuvent se concentrer sur la résolution des problèmes encore plus rapidement, ce qui permet à DraftKings de gagner du temps et de l'argent. Par ailleurs, l'entreprise a mené des investigations. communication avec les parties prenantes Fournir en temps réel des informations sur l'état de l'activité et son impact, et réduire l'afflux de questions adressées aux équipes d'ingénierie.

Pour en savoir plus sur la façon dont PagerDuty aide les entreprises à transformer leurs opérations numériques, consultez le site web. www.pagerduty.com/clients pour plus d'informations et Commencez votre essai gratuit de 14 jours dès aujourd'hui .