Blog

Temps de paix ou temps de guerre dans DevOps : leçons tirées des pompiers

par Vivian Au 19 novembre 2013 | 5 minutes de lecture

Article de blog invité de Ron Vidal, Rob Schnepp et Chris Hawley de Blackrock 3 Partenaires LLC. Blackrock 3 Partners est un expert en gestion des incidents, combinant des décennies d'expérience dans les services d'incendie, les forces de l'ordre et la lutte antiterroriste dans la gestion des urgences de sécurité publique à grande échelle avec des décennies d'expérience dans la gestion des opérations Web, des infrastructures critiques, des marchés financiers et des activités de fusions et acquisitions pour les opérateurs internationaux de réseaux à large bande et les sociétés de calcul haute performance.

C'est une journée calme et ensoleillée, comme tant d'autres journées calmes et ensoleillées. Temps de paix jours…

Puis, quelqu’un voit des flammes et de la fumée sortir d’un bâtiment… Temps de guerre…  

Appelez le 911… De l’aide est en route !

fire department En quelques secondes, le centre de communication 911 dépêche des camions de pompiers, des ambulances, des équipes de secours et des commandants d'intervention sur les lieux de l'urgence. En environ 4 minutes, les 25 premiers pompiers formés arrivent sur les lieux avec leurs véhicules, leurs outils et leurs compétences spécialisés. Le commandant d'intervention établit le commandement, évalue la situation, fixe les objectifs tactiques, lance les opérations, évalue les ressources nécessaires et organise la résolution efficace de l'urgence.

Cela ressemble-t-il à la façon dont votre équipe DevOps réagit aux incidents de haute gravité ?

Si vous avez des opérations, vous aurez également des opérations d'urgence. À l'instar d'une alarme déclenchée dans une caserne de pompiers, qui déclenche immédiatement l'intervention des pompiers, les équipes DevOps doivent réagir avec la même urgence pour résoudre leur situation. Dans les deux cas, le temps presse. Le problème ne s'améliorera probablement pas tant que les ressources adéquates ne seront pas déployées et n'interviendront pas au bon moment, sous la direction d'un leader prenant les bonnes décisions, le tout dans un cadre organisationnel cohérent.

Le passage de Temps de paix à Temps de guerre

Temps de paix Il s'agit du mode de fonctionnement habituel de toute organisation informatique. Les développeurs écrivent le code. Les opérations assurent le fonctionnement de l'infrastructure. Les activités se déroulent comme d'habitude. En d'autres termes, une organisation parfaite. Temps de paix jour.

Voici à quoi ressemble un Temps de paix l'organigramme ressemble à ceci :

peacetime org chart

Temps de guerre Il s'agit du mode de fonctionnement qui se produit lorsque les systèmes ne fonctionnent pas normalement. Le service des opérations a déclaré un événement de niveau SEV et a lancé une conférence téléphonique d'incident. Des ingénieurs experts d'astreinte interrogent les alertes et analysent les données de performance. Les clients sont hors service. L'activité est anormale. Nous avons un problème grave et il doit être résolu immédiatement. En d'autres termes, Temps de guerre Incident.

Au sein du service d'incendie, le passage de Temps de paix à Temps de guerre se produit lorsqu'une urgence est signalée. Temps de guerre C'est différent. Les gens se comportent différemment. Leur langage et leurs méthodes de communication sont différents. Les conversations sont généralement beaucoup plus courtes, plus directes et visent à résoudre des problèmes dans un délai serré. Pour les non-initiés, cela semble abrupt. Cela semble saccadé. Cela semble stérile. Et c'est normal.

Comme 60 minutes Dans son interview du 17 mars 2013 avec Jack Dorsey, le magazine rapportait : « Le jeune Jack était intrigué par les messages qu'il entendait en provenance du centre de répartition des urgences de Saint-Louis. Chez lui, il les écoutait sur un scanner de la police. Il était également frappé par le fait que tout le monde parlait par courtes rafales de son – un système de communication qui l'a plus tard inspiré à inventer Twitter. »

Dans Temps de guerre Le commandant d'intervention réfléchit plus vite que l'urgence ne se déroule. Pour ce faire, les communications doivent être directes, claires et nettes, comme un « Twitter vocal ».

Compréhension Temps de guerre Communication

Le Temps de guerre l'organigramme sera différent de celui Temps de paix organigramme. En fait, le PDG ( Temps de paix (le leader) est exactement la mauvaise personne pour diriger l'urgence ( Temps de guerre ) réponse, car quelqu'un gère toujours l'entreprise et les parties non affectées de l'organisation. Rôles et responsabilités, chaîne de commandement et attribution des tâches Temps de guerre seront très différents de ce qu'ils sont dans Temps de paix .

Voici ce qu'un Temps de guerre l'organisation ressemble à :

Wartime org

Voici une comparaison de la manière dont un service d'incendie et DevOps réagissent à une urgence :

Pompiers DevOps
1 Appelez le 911 Notification d'alerte
2 Répartition radio Notifier et rassembler les ressources techniques
3 Taille supérieure Déclarer le niveau de gravité
4 Canaux de communication radio tactiques Canaux de communication tactiques
5 Établir le commandement Lancer un pont de conférence
6 Définir des objectifs tactiques Élaborer un plan
7 Éteindre le feu Systèmes de fixation
8 Commande de dissolution Retour aux opérations normales

En bref, résoudre Temps de guerre problèmes nécessite un Temps de guerre mentalité et un processus défini de gestion des incidents. Les services d'incendie ont développé un système utilisé depuis plus de 40 ans et qui a géré des dizaines de millions d'incidents. Temps de guerre incidents. Sans aucun doute, les équipes DevOps sont des organisations d'intervention d'urgence, tout comme les pompiers.

Lorsqu'une urgence est signalée, c'est un signal clair pour tous que l'organisation est passée de Temps de paix à Temps de guerre . Tous les intervenants doivent comprendre et accepter le sentiment d’urgence et de responsabilité qui accompagne le passage à Temps de guerre et exécuter les tâches qui leur sont assignées en conséquence.

Chaque urgence ( Temps de guerre ) La réponse dépend absolument de communications robustes tout au long de l'incident, des notifications d'alerte à la répartition, en passant par les canaux tactiques dédiés, l'escalade et la responsabilité des ressources. Temps de paix dispose d'un fouillis de multiples systèmes de communication qui distraient Temps de guerre intervenants. Temps de guerre exige une communication claire pour chaque incident et chaque intervenant d'urgence, et un système centralisé de gestion des incidents permettra de réduire les interférences. Chaque élément de l'urgence ( Temps de guerre ) La réponse dépend d'une communication efficace et fiable. Sans une communication solide, la gestion des incidents échoue.

Alors, la prochaine fois que vous voyez un camion de pompiers se diriger vers une urgence de code 3 (gyrophares et sirène), rappelez-vous simplement qu'ils sont en Temps de guerre et en utilisant les mêmes outils et systèmes que ceux que vous pouvez utiliser pour gérer vos incendies DevOps.

Pour plus d'informations sur Blackrock 3 Partners LLC, veuillez visiter www.blackrock3.com .