Toutes les entreprises technologiques, quel que soit le service proposé (gratuit ou payant), partagent un objectif similaire : offrir la meilleure expérience possible afin d’attirer et de fidéliser les utilisateurs. Car sans utilisateurs, le service n’a aucune raison d’être (ni aucun intérêt financier).
Lorsqu'on utilise un service, on souhaite pouvoir compter sur sa fiabilité. Si Google devenait soudainement célèbre pour ses pannes et ses ralentissements, on assisterait probablement à un exode massif d'utilisateurs à la recherche d'un nouveau moteur de recherche. Pourtant, grâce à sa capacité à répondre constamment aux attentes des utilisateurs et à garantir une disponibilité d'au moins 99,99 % mois après mois, le géant de la recherche continue de dominer le marché avec plus de 70 000 recherches par seconde.
Maintenir ces taux de disponibilité élevés n'est pas simplement un objectif que Google se fixe chaque mois pour faire bonne figure. Son taux de disponibilité mensuel est un indicateur clé qui permet de déterminer s'il tient ses promesses envers ses utilisateurs – en l'occurrence, un moteur de recherche qui fonctionne comme prévu 99,99 % du temps. Pas mal, Google, vraiment pas mal.
Ces différents engagements ou accords que les entreprises technologiques prennent envers leurs clients sont souvent définis dans un accord de niveau de service (SLA). Ces SLA comprennent différents objectifs de niveau de service (SLO) qui sont suivis et contrôlés par la mesure d'indicateurs de niveau de service (SLI) spécifiques.
Entreprises définir Les fournisseurs de services suivent et contrôlent ces SLA, SLO et SLI afin d'offrir un service plus fiable à leurs clients. Mais que signifient exactement ces termes et comment sont-ils liés entre eux ?
Qu'est-ce qu'un accord de niveau de service (SLA) ?
Un SLA, ou Accord de Niveau de Service, est un contrat conclu entre une entreprise et les utilisateurs d'un service donné. Le SLA définit les différents engagements pris par l'entreprise envers les utilisateurs concernant des indicateurs spécifiques, tels que la disponibilité du service. Par exemple, le SLA de Google, mentionné précédemment, garantit à l'utilisateur un taux de disponibilité mensuel d'au moins 99,99 %.
Défis liés aux SLA. Malheureusement, les SLA sont souvent rédigés par les équipes commerciales ou juridiques de l'entreprise, sans ou presque sans la contribution des équipes techniques. Sans l'implication de ces dernières dans le processus de rédaction, un SLA peut omettre des aspects importants et s'avérer extrêmement difficile à évaluer.
Pour éviter cela, il est important que les équipes commerciales et juridiques collaborent avec les équipes techniques lors de l'élaboration des SLA. Cela permettra de créer des SLA qui reflètent mieux les réalités du terrain.
Quand utiliser les SLA. Les SLA sont conclus entre les fournisseurs (entreprises proposant le service) et les utilisateurs payants. Les services gratuits n'ont pas besoin de SLA.
Qu’est-ce qu’un objectif de niveau de service (SLO) ?
Un SLO, ou objectif de niveau de service, est la promesse qu'une entreprise fait à ses utilisateurs concernant une mesure spécifique telle que la réponse aux incidents ou disponibilité Les SLO existent au sein d'un SLA sous forme de promesses individuelles contenues dans l'intégralité du contrat utilisateur.
L'objectif de niveau de service (SLO) est le niveau de fiabilité minimal que le service doit atteindre pour être conforme au contrat de niveau de service (SLA). Selon Jay Judkowitz et Mark Carter, chefs de produit chez Google, un SLO doit « définir le niveau de fiabilité minimal acceptable pour chaque service ». Dans le SLA de Google, qui garantit une disponibilité mensuelle de 99,99 %, le SLO est de 99,99 %.
Défis des SLO. Un problème fréquent avec les SLO est leur manque de clarté, leur complexité ou leur caractère non mesurable. Les SLO doivent toujours être simples, clairement définis et facilement mesurables afin de déterminer si l'objectif est atteint. Cela évitera également à vos ingénieurs de se heurter à des blocages lorsque quelque chose leur paraît incohérent.
Quand utiliser les SLO. Les SLO peuvent être utiles aussi bien pour les services payants que pour les services gratuits, car ils peuvent aider les entreprises à améliorer la qualité et la fiabilité globales de leur service.
SLA vs. SLO : quelle est la différence ?
Les SLA sont utilisés en externe pour définir un accord entre le service d'une entreprise et ses utilisateurs payants. Les SLO sont des objectifs mesurés en interne pour déterminer si le SLA est respecté. En cas de non-respect des termes d'un SLO, les équipes doivent réagir rapidement pour éviter toute rupture du SLA.
Ces SLO sont mesurés en surveillant de près les indicateurs clés de niveau de service (SLI).
Qu’est-ce qu’un indicateur de niveau de service (SLI) ?
Un SLI, ou indicateur de niveau de service, est un indicateur clé permettant de déterminer si l'objectif de niveau de service (SLO) est atteint. Il correspond à la valeur mesurée de l'indicateur décrit dans le SLO. Ainsi, si le SLO de Google est de 99,99 %, le SLI représente la valeur mesurée à un instant donné. Pour rester conforme au SLA, la valeur du SLI doit toujours être égale ou supérieure à celle définie par le SLO. Un plan de réponse aux incidents efficace est essentiel pour résoudre rapidement toute interruption de service.
Défis SLI. Pour éviter de complexifier inutilement les choses, il est important de privilégier la simplicité et de choisir les indicateurs clés pertinents à suivre. Suivre trop d'indicateurs ne fera qu'alourdir le travail sans apporter grand-chose à l'utilisateur.
Quand utiliser les SLI. Les indicateurs de niveau de service (SLI) sont essentiels pour contrôler l'efficacité avec laquelle un service atteint ses objectifs de niveau de service (SLO). Sans eux, il est impossible de mesurer précisément les performances.
Pourquoi les SLA, les SLO et les SLI sont importants
Les SLA, SLO et SLI permettent aux entreprises de définir, suivre et contrôler les engagements pris envers leurs utilisateurs concernant un service. Ensemble, les SLA, SLO et SLI devraient aider les équipes à renforcer la confiance des utilisateurs dans leurs services, en mettant l'accent sur l'amélioration continue des processus de gestion et de réponse aux incidents.