Blog

Les tickets rendent les opérations inutilement misérables

par Damon Edwards 16 décembre 2022 | 9 minutes de lecture

Les opérations informatiques ont toujours été difficiles. Il y a toujours trop de travail à faire, et pas assez de temps pour le faire. Les interruptions fréquentes et la charge de travail excessive n'arrangent rien. De plus, la pression des dirigeants est constante, qui se demandent pourquoi tout prend trop de temps, les interruptions sont trop fréquentes et les coûts trop élevés.

En quête d'amélioration, nous avons constamment misé sur de nouveaux outils pour optimiser notre travail. Nous avons expérimenté de nouvelles plateformes (de la virtualisation au cloud, en passant par les conteneurs et Kubernetes) et de nouvelles automatisations (par exemple, Ansible, Terraform, Pulumi). Si chacune d'entre elles a apporté des avantages, un ingénieur moyen dirait-il que la pression et la surcharge sur les opérations ont fondamentalement changé ?

Les entreprises ont également largement appliqué ces deux dernières décennies des cadres de gestion comme ITIL et COBIT. Là encore, un ingénieur moyen dirait-il que la situation s'est améliorée ou aggravée ?

Au milieu de tout cela, il existe une sagesse conventionnelle qui est rarement remise en question : l’utilisation intensive de tickets pour gérer le travail opérationnel.

Les tickets sont devenus l'outil de gestion incontournable des opérations. Besoin d'une intervention ? Ouvrez un ticket. Quelqu'un a besoin de votre aide ? Un ticket apparaîtra dans votre file d'attente.

Les méthodes de travail basées sur les tickets sont devenues si omniprésentes que peu de gens réfléchissent à deux fois avant d’ajouter davantage de files d’attente de tickets dans une organisation.

Mais que se passerait-il si nous nous trompions au sujet des billets ? Et si les files d'attente étaient une source importante de conflits opérationnels, invisibles à la vue de tous ? Examinons comment les files d'attente causent souvent plus de tort que de bien.

Graphic of person moving through ticket cycle

Quel est le problème avec les billets ?

Ce sont les files d'attente

Les billets en eux-mêmes sont relativement inoffensifs, car ce ne sont que des enregistrements. Le problème est Vous mettez ces billets. Ils finissent par être mis en file d'attente, et c'est là que les problèmes commencent.

Les files d’attente ajoutent des retards, augmentent les risques, ajoutent de la variabilité, ajoutent des frais généraux, diminuent la qualité et diminuent la motivation.

Ce ne sont pas mes opinions, le coût des files d’attente provient de recherches approfondies dans d’autres domaines aussi divers que la fabrication physique et le développement de produits. Théorie des files d'attente est son domaine d’étude universitaire respecté.

Dans la suite de cet article, j'utiliserai indifféremment « tickets » et « files d'attente ». Sachez simplement que c'est le file d'attente partie qui cause les problèmes.

Image illustrating queue creation leading to money and time spent

Les tickets augmentent les problèmes de communication

Chaque fois que des parties sont contraintes de communiquer via des files d'attente de tickets, des déconnexions et des problèmes de communication surviennent. Pensez à tous les problèmes que vous avez probablement rencontrés avec des tickets : des demandes mal comprises, un manque de contexte pour la personne qui lit une demande ou qui travaille dans un contexte différent, une mauvaise demande ou une incompréhension des implications de sa demande. Lorsqu'une demande est en file d'attente, ses paramètres ont changé ou ne sont plus valides (à l'insu des deux parties).

Illustration demonstrating ticket queue being a barrier  to communication

Les tickets retardent le retour d'information et l'apprentissage

Presque toutes les philosophies de management modernes (du Lean au DevOps en passant par le Lean Startup) reposent sur le concept d'un apprentissage plus rapide de l'organisation. Toutes s'efforcent de resserrer les boucles de rétroaction afin d'accélérer les analyses et les décisions.

Cependant, comme Scott Prugh aime à nous rappeler que « les files d'attente n'apprennent pas ». Elles agissent contre les boucles de rétroaction en injectant des retards et en décontextualisant chaque requête. Il est difficile de devenir une organisation apprenante lorsque les files d'attente de requêtes basées sur des tickets sont omniprésentes.

Illustration demonstrating feedback loop and what happens when ticket queues are introduced

Les billets encouragent les goulots d'étranglement

La façon dont les équipes gèrent les files d'attente de tickets favorise les goulots d'étranglement. Premièrement, les files d'attente de tickets sont souvent utilisées en cas d'inadéquation de capacité. Par exemple, elles servent couramment à mettre en mémoire tampon les demandes des équipes spécialisées (par exemple, réseau, base de données, sécurité), largement dépassées en nombre par les personnes qui ont besoin d'elles. Ces équipes « encombrent » la file d'attente de demandes, ce qui augmente la longueur de la file et les délais de réponse. Comme les files d'attente retardent les retours, les demandeurs ignorent souvent (ou ne se soucient pas) de l'inadéquation de capacité et continuent de la surcharger. Ce comportement augmente à la fois la longueur de la file et les délais de réponse, aggravant ainsi le goulot d'étranglement.

De plus, à mesure que la longueur des files d'attente augmente, les équipes chargées de les gérer se replient instinctivement sur elles-mêmes pour protéger leur capacité. Cette réaction naturelle conduit à des optimisations pour l'équipe en charge de la file d'attente, souvent au détriment de l'ensemble de l'organisation. Par exemple, si une équipe de pare-feu n'effectue des modifications non urgentes que les lundis et jeudis, cela engendre des retards pour le reste de l'organisation, même si cela permet à l'équipe de pare-feu d'optimiser sa charge de travail.

Les tickets renforcent les méthodes de travail cloisonnées

Les files d'attente servent de tampons permettant aux équipes de continuer à travailler de manière cloisonnée et déconnectée. Plus les équipes sont déconnectées, plus elles se comportent comme des réserves cloisonnées de main-d'œuvre spécialisée.

Les demandes adressées à ces spécialistes sont traitées via des files d'attente de tickets, et les demandes sont traitées ponctuellement par des interventions semi-manuelles ou manuelles. La variabilité est élevée. Les priorités et le contexte sont difficiles à évaluer.

Comme pour la réaction aux goulots d'étranglement, la priorité du management est de protéger les capacités des équipes (et non les besoins de l'organisation dans son ensemble). Plus les effets de silos se renforcent, plus les déconnexions, les erreurs et les retards se multiplient. Les files d'attente sont les catalyseurs de cette spirale descendante.

Illustration of siloed specialist labor pools and the breakdown of communication

Les billets créent des flocons de neige

Le principe FIFO (premier entré, premier sorti) par défaut des files d'attente favorise les demandes ponctuelles. Lorsqu'un ticket arrive en tête de file, les personnes en charge de la file d'attente interviennent rapidement, tentent de recueillir un maximum de contexte dans le temps limité dont elles disposent, font ce qu'elles estiment être la bonne approche, puis passent au ticket suivant.

Cette façon de travailler – passer d'une requête à l'autre, chacune avec un contexte apparemment déconnecté – est l'une des principales causes des flocons de neige. Le terme « flocons de neige » désigne un élément techniquement correct (voire parfait), mais unique et non reproductible. Un serveur mis à jour manuellement est l'exemple classique d'un flocon de neige. Vous parviendrez peut-être à le rendre opérationnel, mais il sera probablement légèrement différent des autres serveurs de votre parc (et souvent de manière imperceptible).

Le coût des flocons de neige peut sembler minime au premier abord, mais à mesure que les environnements se développent, les coûts s'accumulent rapidement et créent une situation coûteuse et apparemment insoluble. Keith Chambers a fait remarquer avec justesse : « Combien d’entreprises ont connu des « journées de neige » où une petite variation inattendue a entraîné un incident qui a anéanti la capacité d’une équipe pendant des heures ou des jours ? »

Image of a ticket queue being compared to a "snowflake maker"

Les tickets obscurcissent la chaîne de valeur

Une grande partie du travail des mouvements Lean, Agile et DevOps a consisté à lever les barrières pour construire une vision systémique du travail à accomplir pour générer de la valeur (cette vision systémique de bout en bout est souvent appelée « flux de valeur »). Le contexte étant important dans tout travail de connaissance, il est essentiel de comprendre la place de chaque élément dans le système global.

Après tout le travail de transparence et de contextualisation, le découpage en tickets individuels obscurcit la chaîne de valeur et disperse le contexte. En réalité, le découpage du travail en unités de plus en plus petites est souvent perçu comme un système de tickets. meilleures pratiques .

Illustration demonstrating how queues break down shared/common goals across teams

Les tickets ajoutent des frais de gestion

Les files d'attente ne se gèrent pas toutes seules. Il faut bien sûr configurer la file d'attente et définir les règles (règles qui, souvent, imposent à d'autres personnes d'apprendre à les respecter ou à les contourner). Il faut aussi assurer la maintenance du système de tickets. Les priorités, les conflits et les enjeux politiques doivent également être gérés en permanence (souvent via une gestion de projet coûteuse). Tout ce travail a un coût et requiert du temps et des efforts qui pourraient être consacrés à d'autres tâches à valeur ajoutée.

À quoi servent les billets ?

Ne vous méprenez pas : les billets ne sont pas tous mauvais. Ils sont simplement surutilisés ou utilisés à mauvais escient.

À mon avis, les systèmes de tickets sont utiles pour signaler de véritables exceptions (par exemple, pour consigner des bogues ou des demandes d'amélioration). Ils présentent également un certain intérêt pour documenter les communications interhumaines lorsque les approbations sont inévitables.

Les files d'attente de billets sont également utiles lorsque chaque demande est ponctuelle et isolée (par exemple, assistance client traditionnelle ou vente de billets au guichet). Cependant, la plupart de ces demandes sont idéales pour l'automatisation en libre-service.

En ce qui concerne le travail de connaissances complexe requis pour fournir et exploiter des services basés sur des logiciels d’entreprise, il semble clair que les files d’attente de tickets sont au mieux coûteuses et au pire destructrices.

Comment pouvons-nous éliminer autant de files d’attente que possible pour les billets ?

Alors que de plus en plus d'organisations prennent conscience des effets secondaires toxiques des files d'attente de demandes basées sur des tickets, je vois le même modèle de base émerger pour supprimer autant de travail que possible des files d'attente :

  1. Repenser le travail pour éviter les transferts autant que possible

Les organisations avant-gardistes se concentrent sur la création d'équipes « propriétaires du service » ou « axées sur le produit », capables de gérer la plus grande partie possible du cycle de vie (sans avoir à déléguer des tâches à d'autres équipes). Éliminer les transferts de tâches réduit naturellement les files d'attente pour les tickets.

  1. Appliquer l'automatisation en libre-service pour éliminer les files d'attente de tickets restantes

Lorsqu'il est impossible d'éliminer les files d'attente pour les tickets, leur remplacement par le libre-service constitue une excellente alternative. L'automatisation du libre-service permet de déléguer la définition et l'exécution des activités opérationnelles au-delà des frontières organisationnelles traditionnelles. En remplaçant les files d'attente par des interfaces de libre-service basées sur le tirage, les temps d'attente sont supprimés, les boucles de rétroaction sont raccourcies, les interruptions de contexte sont évitées et les tâches coûteuses sont éliminées. Les rares files d'attente restantes sont celles réservées aux demandes réelles et aux demandes ponctuelles.

Illustration demonstrating the value of self-service automation

Il est temps d'agir

Il est temps, en tant qu'industrie, de remettre en question les idées reçues concernant les files d'attente. Les tickets ont leur utilité, mais ils ont été surutilisés au détriment de tous. Chez PagerDuty, nous collaborons avec nos utilisateurs pour trouver et mettre en œuvre de meilleures méthodes de travail qui simplifient la gestion de leurs tâches. Nous espérons que vous nous rejoindrez dans cette mission.

  Contactez-nous pour en savoir plus sur l'automatisation des processus PagerDuty .