Blog

Incidents évités de justesse : comment les analyser et en tirer des leçons

par Jeli 8 juin 2022 | 4 minutes de lecture

Cet article a été initialement publié sur le blog de Jeli. Jeli a été racheté par PagerDuty en 2023 et nous le republions ici pour partager leur expertise avec notre communauté.

Nous avons discuté des incidents qui pourraient être plus susceptibles de faire l'objet d'un examen plus approfondi que d'autres. Parmi ces incidents figurent également les quasi-accidents. Ces incidents sont particulièrement utiles car ils offrent une voie d'accès facile à l'apprentissage. Après tout, ils sont exempts du nuage noir qui plane souvent sur les incidents qui ont, en réalité, manqué. Pourtant, trop peu d'organisations tirent profit des leçons tirées de ces quasi-accidents.

Qu’est-ce qu’un incident évité de justesse ?

Les quasi-accidents présentent des caractéristiques similaires à ce que l'on appelle habituellement un « incident » : un événement survient, la collaboration de plusieurs personnes est nécessaire pour le résoudre, chacun doit interrompre ses activités pour s'y attaquer immédiatement, et une personne doit coordonner et communiquer la situation. Mais contrairement à un incident traditionnel, à la fin d'un quasi-accident, notre utilisateur final n'est pas impacté ! Grâce au travail acharné des personnes impliquées dans le processus d'incident, nous sommes en mesure d'empêcher l'impact de se propager aussi loin.

Les quasi-accidents peuvent prendre diverses formes. En voici quelques exemples :

  • Une erreur dans un système comptable qui a été détectée suffisamment tôt pour être corrigée avant l’envoi des factures.
  • Le système téléphonique d'un centre d'appels était en panne en dehors des heures de bureau. L'équipe interne a pu contourner cette panne à temps pour permettre la réouverture du centre d'appels.
  • Dans les deux cas, grâce à sa réactivité, le système a pu accomplir sa tâche. En fin de compte, il n'est pas nécessaire de définir précisément les quasi-accidents, car leur objectif est de nous permettre d'élargir l'univers des événements dont nous pouvons tirer des enseignements.

Que pouvons-nous apprendre des quasi-accidents ?

Un quasi-accident peut nous en dire autant sur nos systèmes, nos organisations et notre travail qu’un incident de « recette originale ».

Quasi-accidents :
  • Aidez-nous à comprendre ce qui est important pour notre organisation : qui est notre utilisateur final ? Qu’attend-il de nous ? Comment savoir si nous répondons à ce besoin ?
  • Dans l'exemple du centre d'appels, nos utilisateurs peuvent être les employés du centre ou ceux qui tentent de les joindre. Les deux groupes doivent pouvoir utiliser les systèmes téléphoniques pendant les heures d'ouverture, sinon il s'agit d'un incident majeur.
  • Indiquez-nous qui sont les acteurs clés d'un système spécifique : de qui avons-nous besoin lorsque le système cesse de fonctionner ? Comment collaborer avec eux ?
  • Nous pensons peut-être qu’un incident ne nécessite que les ingénieurs de l’équipe comptable, mais nous avons également besoin de personnes capables de contourner les contrôles liés à la publication.
  • Montrez-nous comment nous découvrons les incidents : que regardons-nous ? À quels indicateurs prêtons-nous attention ?
  • Même si le système comptable est opérationnel, comment vérifier l'exactitude des résultats ? Dans l'exemple du centre d'appels, comment différencier une « dysfonctionnement » d'une « dégradation de la qualité des appels » ?
  • Expliquez le fonctionnement du système : à quoi nous attendions-nous ? Que s'est-il passé que nous n'attendions pas ?
  • En examinant l’incident évité de justesse, les gens peuvent mieux comprendre l’architecture derrière les systèmes téléphoniques et l’histoire qui l’entoure.
  • Mettez en évidence tout ce qui a dû se produire pour que l’incident soit évité de justesse et fournissez des exemples qui peuvent être utilisés dans d’autres parties de l’organisation.
  • Peut-être que les développeurs en charge du système comptable entretiennent une relation particulièrement étroite avec les personnes chargées du rapprochement, et que cela devrait être encouragé par les autres équipes. Ou peut-être avions-nous des solutions de contournement rapides pour pouvoir apporter des modifications rapides en cas d'incident. Ces solutions peuvent également être implémentées dans d'autres processus.

Comment examiner les quasi-accidents

Nous pouvons analyser les quasi-accidents de la même manière que nous analysons tout incident. Vous pouvez suivre Procédé Howie Avec un avertissement pour les participants : même si vous comprenez que cet incident n'a pas eu d'impact sur les utilisateurs, il y a beaucoup à apprendre d'eux ! Pour vos premières analyses d'incidents évités de justesse, vous devrez peut-être faire preuve de persuasion. Dans ce cas, nous vous recommandons d'adopter une procédure plus simple et, éventuellement, de ne pas recourir aux entretiens. Une fois que les membres de votre organisation auront compris l'intérêt d'analyser ces incidents évités de justesse, ils seront plus enclins à investir du temps dans ces investigations.

Les quasi-accidents comptent parmi nos occasions d'apprentissage préférées. Nous avons constaté que les participants sont plus disposés à partager leur expérience lorsqu'ils sont dans une ambiance festive et savent qu'ils ne risquent rien. L'analyse des quasi-accidents est un excellent moyen de tirer les leçons des incidents, car elle apporte la sécurité psychologique nécessaire à l'instauration d'une culture d'apprentissage au sein d'une organisation.