Monitoring Article pilier31 janvier 2026 14 min de lecture

Guide Complet du Monitoring Heartbeat

Maîtrisez le monitoring heartbeat pour les tâches cron, tâches planifiées et processus en arrière-plan. Apprenez comment le dead man's switch prévient les échecs silencieux.

WizStatus Team
Auteur

Le monitoring uptime traditionnel vérifie si les services sont disponibles. Le monitoring heartbeat fait l'inverse : il attend que vos jobs signalent leur completion. S'ils ne le font pas, quelque chose ne va pas. Ce guide couvre tout sur le monitoring des tâches planifiées et processus en arrière-plan.

Ceci est un article pilier pour le monitoring heartbeat. Consultez les guides connexes sur le monitoring cron, le monitoring de sauvegardes et le monitoring de tâches planifiées.

Qu'est-ce que le Monitoring Heartbeat ?

Le monitoring heartbeat (aussi appelé dead man's switch ou monitoring cron) fonctionne différemment du monitoring traditionnel :

Monitoring traditionnel : "Laissez-moi vérifier si votre service est up" Monitoring heartbeat : "Dites-moi quand vous avez terminé votre job"

Votre tâche planifiée envoie un "ping" au service de monitoring après une completion réussie. Si le ping n'arrive pas dans le délai prévu, vous êtes alerté.

Comment Ça Marche

1. Configurez le planning attendu (ex. "toutes les heures")
2. Définissez la période de grâce (ex. "autoriser 5 minutes de retard")
3. Ajoutez l'URL de ping à votre job
4. Le job s'exécute et ping en cas de succès
5. Si le ping n'arrive pas → Alerte

Pourquoi le Monitoring Traditionnel Échoue pour les Tâches Planifiées

Vous ne pouvez pas monitorer un job cron avec des checks HTTP car :

  • Les jobs cron ne sont pas des services web - Il n'y a pas d'endpoint à vérifier
  • Ils s'exécutent de façon intermittente - Pas disponibles en continu
  • Les échecs sont silencieux - Pas de page d'erreur à détecter
  • Ils peuvent "réussir" mais produire des résultats erronés

Un job de sauvegarde peut planter silencieusement. Une synchronisation de données peut ne pas démarrer. Un processeur de queue email peut bloquer. Sans monitoring heartbeat, vous ne saurez pas jusqu'à ce qu'il soit trop tard.

Les échecs les plus dangereux sont les échecs silencieux. Des jobs qui devraient s'exécuter mais ne le font pas, sans messages d'erreur et sans alertes.

Cas d'Utilisation Courants

Vérification de Sauvegardes

Votre sauvegarde de base de données s'exécute chaque nuit à 2h. S'exécute-t-elle vraiment ?

#!/bin/bash
# backup.sh
pg_dump mydb > backup.sql
if [ $? -eq 0 ]; then
  curl -fsS --retry 3 https://wizstatus.com/ping/votre-token
fi

Si la sauvegarde échoue ou ne s'exécute jamais, vous le saurez.

Traitement de Données Planifié

Jobs ETL, génération de rapports, synchronisation de données :

def rapport_quotidien():
    generer_rapport()
    envoyer_rapport()
    # Signaler la completion réussie
    requests.get("https://wizstatus.com/ping/votre-token")

Santé des Workers de Queue

Assurez-vous que vos workers traitent les jobs :

async function traiterQueue() {
  await traiterBatch();
  await fetch('https://wizstatus.com/ping/votre-token');
}

Tâches de Maintenance Planifiées

Vidage de cache, rotation de logs, scripts de nettoyage :

# cleanup.sh
find /tmp -type f -mtime +7 -delete
curl https://wizstatus.com/ping/votre-token

Configurer le Monitoring Heartbeat

Étape 1 : Créer un Moniteur Heartbeat

  1. Connectez-vous à votre dashboard de monitoring
  2. Créez un nouveau moniteur → Sélectionnez le type "Heartbeat"
  3. Nommez-le de façon descriptive (ex. "Sauvegarde Base de Données - Production")
  4. Configurez le planning

Étape 2 : Définir le Planning Attendu

Options de planning courantes :

PlanningCas d'utilisation
Chaque minuteProcesseurs de queue, sync temps réel
Toutes les 5 minutesJobs batch fréquents
Chaque heureRapports horaires, refresh cache
Chaque jourSauvegardes quotidiennes, rapports
Cron personnaliséPlannings spécifiques

Étape 3 : Définir la Période de Grâce

La période de grâce détermine le retard acceptable d'un ping avant d'alerter. Définissez-la selon :

  • La durée typique du job
  • La tolérance de délai acceptable
  • Une marge pour la latence réseau

Exemple : Le job s'exécute à 2:00 et prend jusqu'à 30 minutes. Définissez la période de grâce à 45 minutes.

Étape 4 : Ajouter le Ping à Votre Job

Ajoutez une simple requête HTTP à la fin de l'exécution réussie :

# Avec curl
curl -fsS --retry 3 https://wizstatus.com/ping/votre-token

# Avec wget
wget -q --spider https://wizstatus.com/ping/votre-token

Important : Ne pingez qu'en cas de completion réussie, pas au démarrage.

Bonnes Pratiques

Pingez Uniquement en Cas de Succès

try:
    faire_travail_important()
    # Pingez uniquement si le travail est terminé avec succès
    requests.get(PING_URL)
except Exception as e:
    log_erreur(e)
    # Ne pingez pas - laissez le timeout déclencher une alerte

Gérer les Échecs Réseau

Le ping lui-même peut échouer. Utilisez des réessais :

curl -fsS --retry 3 --retry-delay 5 $PING_URL

Utilisez des Noms Descriptifs

Mauvais : "Job Cron 1" Bon : "Sauvegarde Quotidienne BDD - PostgreSQL Production"

Conclusion

Le monitoring heartbeat détecte les échecs silencieux que le monitoring traditionnel rate. Tout job qui s'exécute sur un planning - sauvegardes, rapports, processus de sync, tâches de nettoyage - devrait avoir un monitoring heartbeat.

Le principe est simple : si votre job ne se manifeste pas à temps, quelque chose ne va pas. Cet avertissement précoce prévient les échecs en cascade et la perte de données.

Configurez le monitoring heartbeat pour vos jobs planifiés avec WizStatus. Recevez des alertes quand vos tâches cron échouent à se terminer à temps.

Articles connexes

Comment Monitorer vos Sauvegardes et Recevoir des Alertes
Bonnes Pratiques

Comment Monitorer vos Sauvegardes et Recevoir des Alertes

Configurez un monitoring fiable pour vos sauvegardes de bases de données et fichiers. Recevez des alertes instantanées quand les jobs de sauvegarde échouent.
10 min de lecture
Comment Monitorer vos Tâches Cron : Guide Étape par Étape
Tutoriels

Comment Monitorer vos Tâches Cron : Guide Étape par Étape

Apprenez à configurer le monitoring pour vos tâches cron. Recevez des alertes quand les tâches planifiées échouent, durent trop longtemps ou ne s'exécutent pas.
10 min de lecture
Dead Man's Switch : Assurez que vos Jobs Critiques n'Échouent Jamais en Silence
Monitoring

Dead Man's Switch : Assurez que vos Jobs Critiques n'Échouent Jamais en Silence

Comprenez le monitoring dead man's switch pour les systèmes critiques. Apprenez à implémenter des alertes fail-safe pour les jobs qui doivent fonctionner de façon fiable.
9 min de lecture

Commencez à surveiller votre infrastructure dès aujourd'hui

Mettez ces conseils en pratique avec le monitoring WizStatus.

Essayer WizStatus Gratuitement