Les systèmes complexes sont interconnectés. Lorsqu'un incident survient, il n'est pas déclenché par un événement unique, mais plutôt par une série d'événements qui y mènent. Pourtant, les équipes utilisent l'analyse des causes profondes (ACR) comme principal moyen d'identifier une cause ultime et suffisante.
Robert Blumen, ingénieur DevOps principal chez Salesforce, explique que ce n'est pas la cause première unique, mais plutôt la succession d'événements qu'il convient d'examiner de plus près. Il analyse les raisons pour lesquelles l'analyse des causes profondes (ACR) nous attire instinctivement, présente des recherches et des exemples d'analyse d'événements, et soutient que c'est le « comment » – et non le « pourquoi » – qu'il faut explorer en cas de défaillance d'un système.
Objectifs d'apprentissage :
- Apprenez à identifier les problèmes sans analyse des causes profondes
- Découvrez comment explorer les systèmes lorsqu'ils échouent.
« La PagerDuty Operations Cloud est essentielle pour TUI. C'est ce qui va réellement nous permettre de nous développer en tant qu'entreprise et de garantir des services de qualité à nos clients. »
- Yasin Quareshy, responsable de la technologie chez TUI