Les Service Level Agreements (SLA) définissent les attentes de disponibilité entre fournisseurs et clients. Un SLA bien conçu protège les deux parties avec des métriques claires et des conséquences définies.
De nombreux SLA échouent en raison d'un langage vague ou de métriques mal définies.
Qu'est-ce qu'un SLA de Disponibilité
Un SLA de disponibilité est un engagement formel spécifiant le niveau de disponibilité qu'un fournisseur promet de délivrer.
Composantes essentielles
| Composante | Description |
|---|---|
| Objectif | Pourcentage de disponibilité (ex: 99,9%) |
| Période | Mensuelle, trimestrielle, annuelle |
| Définition | Ce qui constitue un temps d'arrêt |
| Méthodologie | Comment la disponibilité est mesurée |
| Exclusions | Ce qui ne compte pas |
| Recours | Conséquences en cas de non-respect |
| Procédures | Reporting et réclamations |
Exemple de formulation
Le Fournisseur s'engage à maintenir une disponibilité de 99,9%
du Service, mesurée mensuellement, ce qui correspond à un
temps d'arrêt maximum de 43 minutes et 50 secondes par mois.
Pourquoi les SLA Bien Définis Comptent
Des SLA bien conçus servent des fonctions critiques pour les deux parties.
Pour les clients
| Bénéfice | Description |
|---|---|
| Garanties | Niveaux de service prévisibles |
| Recours | Compensation en cas de problème |
| Responsabilité | Engagement documenté du fournisseur |
Pour les fournisseurs
| Bénéfice | Description |
|---|---|
| Attentes claires | Évite les demandes irréalistes |
| Cadre décisionnel | Guide les investissements |
| Protection | Limite la responsabilité |
Pour les deux parties
- Accord documenté évitant les malentendus
- Métriques mesurables pour évaluer la performance
- Processus établis pour résoudre les problèmes
Créer des SLA de Disponibilité Efficaces
1. Définir précisément ce qui est mesuré
| Élément | Questions à répondre |
|---|---|
| Services couverts | Quels services exactement ? |
| Méthode de mesure | Quel outil ? Quels emplacements ? |
| Critères de succès | Quel code de réponse ? Quel contenu ? |
Exemple de définition :
Le Service est considéré comme disponible lorsque :
- L'endpoint https://api.example.com/health répond
- Le code de statut HTTP est 200
- Le temps de réponse est inférieur à 5 secondes
- La vérification est effectuée depuis 3 emplacements minimum
2. Définir clairement les exclusions
Les exclusions typiques :
| Type | Exemple |
|---|---|
| Maintenance planifiée | Avec notification 48h à l'avance |
| Force majeure | Catastrophes naturelles |
| Actions du client | Mauvaise configuration |
| Pannes tierces | Fournisseur cloud, DNS |
| Maintenance urgente | Failles de sécurité critiques |
3. Établir les périodes de mesure
| Période | Avantages | Inconvénients |
|---|---|---|
| Mensuelle | Plus commune, granulaire | Variations mensuelles |
| Trimestrielle | Lisse les variations | Moins réactive |
| Annuelle | Vue d'ensemble | Très lente à réagir |
4. Définir les structures de recours
Exemple de structure à plusieurs niveaux :
| Disponibilité atteinte | Crédit accordé |
|---|---|
| 99,9% - 99,0% | 10% du mois |
| 99,0% - 95,0% | 25% du mois |
| < 95,0% | 50% du mois |
| < 90,0% | 100% du mois |
5. Spécifier les procédures de réclamation
- Délai pour soumettre une réclamation (ex: 30 jours)
- Preuves requises
- Format de la demande
- Processus de validation
- Délai de réponse du fournisseur
6. Inclure des provisions de révision
Ce SLA sera révisé annuellement. Les modifications
seront communiquées 30 jours avant leur entrée en vigueur.
Template de SLA Type
Section 1 : Définitions
## 1. Définitions
**"Disponibilité"** : Le pourcentage de temps pendant lequel
le Service est opérationnel et accessible, calculé comme suit :
((Minutes totales - Minutes d'indisponibilité) / Minutes totales) × 100
**"Temps d'arrêt"** : Période pendant laquelle le Service
ne répond pas aux vérifications depuis 2 emplacements sur 3
pendant plus de 2 minutes consécutives.
**"Maintenance planifiée"** : Interruption annoncée au moins
48 heures à l'avance via le canal de communication désigné.
Section 2 : Objectifs de niveau de service
## 2. Objectifs de Niveau de Service
| Service | Objectif mensuel | Temps d'arrêt max |
|---------|-----------------|-------------------|
| API principale | 99,9% | 43 min 50 sec |
| Dashboard | 99,5% | 3h 39 min |
| Documentation | 99,0% | 7h 18 min |
Section 3 : Exclusions
## 3. Exclusions
Les éléments suivants ne sont pas comptabilisés dans le
calcul de disponibilité :
a) Maintenance planifiée notifiée 48h à l'avance
b) Événements de force majeure
c) Problèmes causés par les actions du Client
d) Pannes de fournisseurs tiers (AWS, Cloudflare, etc.)
e) Interventions d'urgence pour failles de sécurité critiques
Section 4 : Crédits de service
## 4. Crédits de Service
En cas de non-respect des objectifs, le Client peut
demander des crédits selon le barème suivant :
| Disponibilité mensuelle | Crédit |
|------------------------|--------|
| < 99,9% et >= 99,0% | 10% |
| < 99,0% et >= 95,0% | 25% |
| < 95,0% | 50% |
Le crédit maximum par mois est limité à 50% de la
facturation mensuelle.
Section 5 : Procédure de réclamation
## 5. Procédure de Réclamation
5.1 Le Client doit soumettre sa demande dans les 30 jours
suivant la fin du mois concerné.
5.2 La demande doit inclure :
- Période concernée
- Description des incidents
- Impact business
5.3 Le Fournisseur répond dans les 10 jours ouvrés.
5.4 Les crédits approuvés sont appliqués à la prochaine
facture.
Bonnes Pratiques des Templates SLA
Précision dans les définitions
| Mauvais | Bon |
|---|---|
| "Disponibilité raisonnable" | "99,9% mensuel" |
| "Réponse rapide" | "< 200ms au 95e percentile" |
| "Maintenance occasionnelle" | "Max 4h/mois, notifié 48h avant" |
Métriques mesurables objectivement
- Les deux parties peuvent accéder aux données
- Outil de surveillance tiers si possible
- Méthodologie de mesure documentée
Objectifs réalistes
| Promesse | Réalité |
|---|---|
| 99,999% | Très difficile sans investissement majeur |
| 99,99% | Atteignable avec bonne architecture |
| 99,9% | Standard pour la plupart des services |
Recours proportionnels
Évitez les approches tout-ou-rien :
| Approche | Problème |
|---|---|
| 100% remboursé si < 99,9% | Trop risqué pour le fournisseur |
| Aucun recours | Pas de responsabilité |
| Gradué | Équilibré |
Communication ouverte
Évitez un langage trop punitif qui incite à cacher les problèmes.
Objectifs différenciés
| Composante | Objectif | Justification |
|---|---|---|
| API critique | 99,99% | Cœur de métier |
| Dashboard | 99,9% | Important mais non critique |
| Docs | 99% | Peut tolérer plus d'arrêt |
Test contre des scénarios réels
Avant de finaliser, testez le SLA contre des scénarios :
- Panne de 30 minutes : quel crédit ?
- Maintenance prolongée : exclue ?
- Panne partielle (50% des utilisateurs) : comment calculer ?
Pièges à Éviter
1. Langage ambigu
| Éviter | Préférer |
|---|---|
| "Best effort" | Objectif chiffré |
| "Dans les meilleurs délais" | "Sous 4 heures" |
| "Haute disponibilité" | "99,9% minimum" |
2. Exclusions trop larges
Des exclusions excessives rendent le SLA sans valeur :
- Tout problème "hors de notre contrôle"
- Toute "circonstance exceptionnelle"
3. Processus de réclamation complexe
| Problème | Solution |
|---|---|
| Délai trop court | 30 jours minimum |
| Documentation excessive | Formulaire simple |
| Validation unilatérale | Processus transparent |
4. Absence de révision
Les SLA doivent évoluer avec les services :
- Clause de révision annuelle
- Processus de modification
- Communication des changements
Checklist de Création de SLA
Préparation
- Analyser les capacités réelles
- Définir les services couverts
- Identifier les dépendances tierces
- Documenter les exclusions nécessaires
Rédaction
- Définitions claires et précises
- Objectifs chiffrés et mesurables
- Méthodologie de mesure documentée
- Structure de recours équitable
- Procédures de réclamation simples
Validation
- Tester contre des scénarios réels
- Revue juridique
- Validation technique de faisabilité
- Approbation des deux parties
Mise en œuvre
- Configurer la surveillance
- Former les équipes
- Communiquer aux parties prenantes
- Planifier les révisions
Conclusion
Les SLA de disponibilité sont des outils essentiels pour définir et gérer les attentes de service. Des SLA bien conçus :
- Protègent les deux parties
- Alignent les incitations
- Fournissent des cadres clairs pour résoudre les problèmes
En suivant les principes de ce guide - définitions claires, métriques mesurables, objectifs réalistes et recours équitables - vous créez des SLA qui améliorent les relations de service.