Bonnes Pratiques31 janvier 2026 10 min de lecture

Comment Monitorer vos Sauvegardes et Recevoir des Alertes

Configurez un monitoring fiable pour vos sauvegardes de bases de données et fichiers. Recevez des alertes instantanées quand les jobs de sauvegarde échouent.

WizStatus Team
Auteur

Les sauvegardes ne sont utiles que si elles s'exécutent réellement. Trop d'organisations découvrent que leur sauvegarde a échoué uniquement quand elles doivent restaurer. Voici comment configurer un monitoring fiable pour tous vos jobs de sauvegarde.

Le Problème du Monitoring de Sauvegardes

Les échecs de sauvegarde sont particulièrement dangereux car :

  1. Ils sont silencieux - Aucun utilisateur ne remarque quand une sauvegarde ne s'exécute pas
  2. Ils sont peu fréquents - Les jobs quotidiens ou hebdomadaires sont faciles à oublier
  3. Ils sont critiques - Découverts trop tard, les conséquences sont graves
  4. Ils sont supposés - "La sauvegarde s'exécute chaque nuit... non ?"

Sans monitoring, les échecs de sauvegarde passent inaperçus pendant des jours, des semaines, ou jusqu'à ce qu'un désastre frappe.

Quoi Monitorer

Completion de la Sauvegarde

Le job de sauvegarde s'est-il terminé avec succès ?

#!/bin/bash
pg_dump database > backup.sql
if [ $? -eq 0 ]; then
  curl https://wizstatus.com/ping/backup-complete
fi

Validité du Fichier de Sauvegarde

A-t-il réellement produit une sauvegarde valide ?

# Vérifier que le fichier existe et a une taille
if [ -s backup.sql ] && [ $(stat -f%z backup.sql) -gt 1000 ]; then
  curl https://wizstatus.com/ping/backup-valid
fi

Durée de la Sauvegarde

Prend-elle plus longtemps que prévu ?

START=$(date +%s)
pg_dump database > backup.sql
END=$(date +%s)
DURATION=$((END - START))

curl "https://wizstatus.com/ping/backup?duration=$DURATION"

Monitoring de Sauvegardes BDD

PostgreSQL

#!/bin/bash
# postgres-backup.sh

BACKUP_DIR="/backup/postgres"
DATE=$(date +%Y%m%d)
BACKUP_FILE="$BACKUP_DIR/prod-$DATE.sql.gz"

# Créer la sauvegarde
pg_dump production | gzip > "$BACKUP_FILE"

# Vérifier
if [ $? -eq 0 ] && [ -s "$BACKUP_FILE" ]; then
  # Tester l'intégrité de la sauvegarde
  gunzip -t "$BACKUP_FILE"
  if [ $? -eq 0 ]; then
    curl -fsS https://wizstatus.com/ping/postgres-backup
  fi
fi

MySQL/MariaDB

#!/bin/bash
# mysql-backup.sh

mysqldump --all-databases | gzip > /backup/mysql-$(date +%Y%m%d).sql.gz

if [ ${PIPESTATUS[0]} -eq 0 ] && [ -s /backup/mysql-$(date +%Y%m%d).sql.gz ]; then
  curl -fsS https://wizstatus.com/ping/mysql-backup
fi

Vérification Au-delà du Monitoring

Le monitoring confirme que le job s'est exécuté. Vérifiez aussi :

Tests de Restauration

Restaurez périodiquement les sauvegardes pour vérifier qu'elles fonctionnent :

#!/bin/bash
# Test de restauration mensuel

createdb test_restore
pg_restore -d test_restore /backup/latest.dump

if [ $? -eq 0 ]; then
  # Exécuter quelques requêtes de validation
  psql -d test_restore -c "SELECT count(*) FROM users"
  dropdb test_restore
  curl https://wizstatus.com/ping/restore-test
fi

Bonnes Pratiques

1. Pingez Uniquement en Cas de Succès Vérifié

Ne vérifiez pas seulement le code de sortie. Validez la sauvegarde :

  • Le fichier existe
  • Le fichier a une taille raisonnable
  • Le fichier passe le test d'intégrité (gunzip -t, etc.)

2. Conservez les Logs de Sauvegarde

exec > /var/log/backup-$(date +%Y%m%d).log 2>&1
# Toute la sortie va dans le log

3. Alertez sur les Durées Longues

Si la sauvegarde prend habituellement 30 minutes mais dure 3 heures, enquêtez.

4. Séparez les Environnements

Les sauvegardes de production et staging devraient avoir des moniteurs séparés.

Checklist de Monitoring

  • Toutes les bases de données ont un monitoring de sauvegarde
  • Toutes les sauvegardes de fichiers ont un monitoring
  • Les moniteurs heartbeat correspondent aux plannings de sauvegarde
  • Les périodes de grâce prennent en compte la durée de sauvegarde
  • Les alertes critiques vont à l'astreinte
  • Les tests de restauration mensuels sont planifiés
  • Les logs de sauvegarde sont conservés
  • L'espace disque est monitoré séparément
Ne découvrez jamais un échec de sauvegarde au moment de restaurer. Configurez le monitoring heartbeat pour tous vos jobs de sauvegarde avec WizStatus.

Articles connexes

Comment Monitorer vos Tâches Cron : Guide Étape par Étape
Tutoriels

Comment Monitorer vos Tâches Cron : Guide Étape par Étape

Apprenez à configurer le monitoring pour vos tâches cron. Recevez des alertes quand les tâches planifiées échouent, durent trop longtemps ou ne s'exécutent pas.
10 min de lecture
Dead Man's Switch : Assurez que vos Jobs Critiques n'Échouent Jamais en Silence
Monitoring

Dead Man's Switch : Assurez que vos Jobs Critiques n'Échouent Jamais en Silence

Comprenez le monitoring dead man's switch pour les systèmes critiques. Apprenez à implémenter des alertes fail-safe pour les jobs qui doivent fonctionner de façon fiable.
9 min de lecture
Monitoring de Pipelines ETL : Détecter les Échecs Silencieux
DevOps

Monitoring de Pipelines ETL : Détecter les Échecs Silencieux

Monitorez vos pipelines ETL avec des checks heartbeat. Recevez des alertes quand les pipelines de données échouent ou produisent des résultats inattendus.
11 min de lecture

Commencez à surveiller votre infrastructure dès aujourd'hui

Mettez ces conseils en pratique avec le monitoring WizStatus.

Essayer WizStatus Gratuitement