Qu'est-ce qu'un Runbook ?

Dans le secteur des opérations, le travail mêle tâches planifiées et imprévues. Il arrive souvent que nous rencontrions des incidents ou des tickets pour lesquels nous ne connaissons pas immédiatement la solution. Trouver une solution peut alors impliquer une recherche rapide sur Google, la consultation du wiki ou de la documentation de l'entreprise, la recherche de scripts partagés, la demande à un collègue ou l'escalade du problème à un autre service. Nous pouvons passer des heures à tenter de résoudre un problème et à proposer une solution qui n'est pas forcément la meilleure pratique de l'entreprise.

C’est là que les manuels d’exploitation entrent en jeu. manuel d'exploitation Il s'agit d'un processus opérationnel mis en œuvre lorsque ces problèmes et tâches courants surviennent, afin de fournir à l'opérateur des instructions standardisées et détaillées pour résoudre rapidement et efficacement le problème.

Qu'est-ce qu'un Runbook ?

Un manuel d'exploitation est un guide pratique détaillé décrivant la procédure à suivre pour réaliser une tâche ou une procédure courante au sein du processus d'exploitation informatique d'une entreprise (par exemple, le provisionnement, les mises à jour et le déploiement de logiciels, la modification des configurations et l'ouverture de ports). Les manuels d'exploitation sont conçus pour fournir à tous les membres de l'équipe, qu'ils soient nouveaux ou expérimentés, les connaissances et les étapes nécessaires pour résoudre rapidement et précisément un problème donné. Par exemple, un manuel d'exploitation peut décrire des tâches d'exploitation courantes telles que l'application de correctifs à un serveur ou le renouvellement du certificat SSL d'un site web.

Considérez un manuel d'exploitation comme une recette. Il fournit des instructions détaillées pour accomplir une tâche spécifique rapidement et efficacement, en s'appuyant sur l'expérience acquise lors de la résolution de problèmes similaires. Les manuels d'exploitation permettent aux membres les plus expérimentés de l'équipe de partager leurs connaissances afin que les nouveaux membres ou les moins expérimentés puissent résoudre plus facilement les problèmes courants. Ils permettent également à tous les membres de l'équipe de se rafraîchir rapidement la mémoire et de suivre des étapes détaillées sans avoir à mémoriser d'innombrables procédures individuelles.

Quand faut-il utiliser les manuels d'exploitation ?

Les manuels d'exploitation sont extrêmement utiles pour la gestion des incidents. En créant des manuels pour des incidents spécifiques, on mutualise les connaissances et l'expertise qui, autrement, resteraient l'apanage des seuls experts. Grâce à des manuels détaillés et à jour, le besoin d'escalade est réduit et les entreprises peuvent souvent fonctionner avec des équipes informatiques d'astreinte plus restreintes.

Les manuels d'exploitation peuvent également servir aux activités opérationnelles informatiques quotidiennes, comme la maintenance régulière des systèmes et applications. Par exemple, un manuel d'exploitation peut décrire des tâches courantes telles que la création de sauvegardes de bases de données ou la mise à jour des autorisations d'accès.

Un manuel d'exploitation peut également être :

  1. Manuel: Instructions étape par étape suivies par l'opérateur
  2. Semi-automatisé : Une combinaison d'étapes suivies par un opérateur et d'étapes automatisées
  3. Entièrement automatisé : Toutes les étapes sont automatisées et ne nécessitent aucun opérateur.

Une fois créée, une procédure opérationnelle standard (ou manuel d'exploitation) doit être constamment mise à jour afin de garantir son efficacité optimale. Elle doit toujours contenir les informations les plus récentes et prendre en compte les nouvelles méthodologies mises en œuvre dans les opérations de l'entreprise.

Les manuels d'exploitation les plus performants et les plus efficaces sont ceux qui évoluent constamment en fonction des changements de produits et de processus, et qui s'adaptent facilement aux nouveaux déploiements.

Quelle est la différence entre un Runbook et un Playbook ?

Dans le monde informatique, les manuels d'exploitation et les playbooks sont souvent confondus. Pourtant, ils sont bien différents. Un playbook décrit les réponses globales aux problèmes et événements majeurs, et peut inclure plusieurs manuels d'exploitation et membres de l'équipe dans le cadre du flux de travail complet.

Pour reprendre notre analogie précédente, si un manuel d'organisation est une recette, alors le guide pratique serait le manuel d'instructions pour organiser un événement social donné. La recette est indispensable pour bien préparer les repas, mais la nourriture ne représente qu'un aspect de l'événement dans son ensemble.

Le plan de jeu global prend en compte la situation dans son ensemble, tandis que les manuels d'exécution détaillent les tâches individuelles plus petites.

Création d'un modèle de manuel d'exploitation pour votre entreprise

Étape 1 : Planification d'un nouveau manuel d'exploitation

Lors de la planification d'un nouveau manuel d'exploitation, il est important de prendre en compte deux éléments :

  1. Quels sont les incidents ou les tâches les plus fréquents auxquels votre équipe est confrontée ?
  2. Quelles ont été les meilleures solutions pour gérer efficacement ces situations par le passé ?

L’examen des rapports d’incidents détaillés et des analyses post-mortem peut vous révéler certains aspects de vos processus où un manuel d’exploitation peut être mis en œuvre efficacement. Vous pouvez également consulter votre système de gestion des tickets pour identifier les tâches courantes et récurrentes assignées à votre équipe. L'ajout de procédures pour ces tâches ou problèmes récurrents contribuera à accélérer vos opérations et à garantir leur exactitude et leur efficacité.

Par exemple, si votre équipe doit régulièrement renouveler le certificat SSL d'un site web, une procédure d'exécution (runbook) fournira à l'opérateur des instructions détaillées pour effectuer cette tâche correctement et de manière optimale. Une telle procédure peut même être entièrement automatisée et ne nécessiter aucune intervention humaine (par exemple, pour réaliser un audit de site web).

Une fois que vous avez identifié une tâche pour laquelle un manuel d'exploitation pourrait être établi, il est important de trouver et de documenter la solution optimale. Consultez les rapports d'incidents et les analyses post-mortem pour voir comment cette tâche a été résolue par le passé et identifier la méthode la plus efficace et la plus précise. Souvent, un expert peut fournir des informations utiles grâce à son expérience dans la gestion de problèmes similaires. Dans ce cas, documentez ce qu'il considère comme la meilleure pratique pour résoudre le problème ou accomplir la tâche. Le manuel d'exploitation doit inclure la solution optimale convenue et la présenter clairement à l'opérateur.

Étape 2 : Rédigez votre manuel d’exploitation

Une fois que vous avez déterminé la procédure de votre manuel d'exploitation, vous pouvez commencer à la documenter. Voici quelques points à retenir lors de la création de votre nouveau manuel d'exploitation :

  • Soyez clair et simple – omettez les détails inutiles
  • Utilisez un langage de documentation facile à comprendre et à suivre.
  • Adaptez-le spécifiquement et de manière unique à vos processus
  • Il doit être flexible et adaptable aux changements de vos systèmes et applications.

Vos manuels d'exploitation doivent être cohérents pour toutes les applications. Assurez-vous qu'ils soient structurés de la même manière et qu'ils fournissent à l'opérateur toutes les informations nécessaires. Par exemple, uniformisez la dénomination et les en-têtes.

Une fois le manuel d'exploitation finalisé, il est important de tester sur le terrain le processus documenté et d'apporter les mises à jour ou modifications nécessaires.

Selon Tom Limoncelli, auteur et ancien administrateur système chez Google, chaque manuel d'exploitation que vous créez devrait comporter sept sections importantes :

  1. Aperçu du service
  2. Informations sur la construction du service
  3. Instructions pour le déploiement du logiciel
  4. Instructions pour les tâches courantes
  5. « Guide des alertes » (Présentation de toutes les alertes possibles du système de surveillance et instructions étape par étape pour leur déclenchement)
  6. Plans de reprise après sinistre
  7. Accord de niveau de service

Vous pouvez en savoir plus sur ces sept sections ici sur le site web de Tom.

Étape 3 : Tester, mettre à jour et améliorer vos manuels d’exploitation

Une fois un manuel d'exploitation créé, il ne suffit pas de le configurer et de l'oublier. Il est essentiel de le tester et de le mettre à jour régulièrement pour garantir un fonctionnement optimal, même en cas d'évolution de vos systèmes ou applications. Un manuel d'exploitation est performant lorsqu'il est flexible et facilement adaptable à l'environnement en constante évolution des opérations informatiques.

Vous pouvez automatiser vos manuels d'exploitation grâce à PagerDuty Runbook Automation. Pour en savoir plus sur la façon dont PagerDuty peut vous aider à mettre en œuvre des processus efficaces tels que les manuels d'exploitation et leur automatisation, contactez votre responsable de compte. Planifiez une démonstration ou un essai dès aujourd'hui .