Aller au contenu principal

Checklist incident

Cette page sert de premier réflexe quand une anomalie apparaît sur Rilindra.

Elle ne remplace pas les runbooks détaillés. Elle aide à trier vite sans casser un service sain.

Règle de départ

Observer avant d'agir.
Ne pas redémarrer, migrer ou modifier une variable avant d'avoir identifié le service touché.

Identifier le périmètre

QuestionAction
Le problème touche Staff Manager ?Vérifier staff.rilindra.fr, logs app staff, DB prod
Le problème touche Commu ?Vérifier commu.rilindra.fr, auth Discord, résultats quiz
Le problème touche le bot ?Vérifier présence Discord, logs bot, commandes récentes
Le problème touche les images ?Vérifier MinIO, CDN cdn.redious.fr, routes images
Le problème touche la DB ?Vérifier logs PostgreSQL, migrations récentes, connexions
Le problème touche le DNS ?Vérifier Cloudflare, proxy, CNAME/A records

Ordre de vérification

  1. Uptime Kuma : https://status.redious.fr
  2. Coolify : état de l'application concernée
  3. Logs récents application
  4. Logs récents DB si l'application lit ou écrit
  5. Dernier commit déployé
  6. Dernière modification Infisical ou Coolify
  7. Dernière action Discord ou bot

Signaux de gravité

NiveauSignaux
P0Auth prod cassée, DB prod inaccessible, bot prod offline, pertes d'écriture
P1Page critique 500, commandes bot critiques HS, backups absents
P2UI partielle cassée, erreurs ponctuelles, images expirées
P3Texte, design, warning cosmétique, dette de logs

Ce qu'il ne faut pas faire en premier

  • redémarrer tous les conteneurs ;
  • modifier les variables Infisical ;
  • relancer une migration ;
  • restaurer un backup ;
  • supprimer une donnée ;
  • changer Cloudflare sans savoir quel domaine est touché.

Vérifications minimales Staff Manager

VérificationSuccès attendu
https://staff.rilindra.fr/tasksRedirection login ou page chargée, pas de 500
Coolify staff-rilindra-prodrunning:healthy
Logs staffPas de Unhandled, panic, ERROR récurrent
Logs DB prodPas d'erreur auth.*, migration ou connexion
DB migrations_schema_migrations cohérent

Vérifications minimales bot

VérificationSuccès attendu
Présence DiscordBot visible en ligne
Coolify bot prodrunning:healthy
Logs botConnexion Discord OK, DB OK
Commande simpleRéponse attendue sans erreur
NotificationsPas de double message ni mauvais salon

Vérifications minimales Commu

VérificationSuccès attendu
https://commu.rilindra.frPage chargée
Auth DiscordLogin possible
QuizRéponse et score persistés
LeaderboardLecture OK
RewardsTransaction attendue en base

Escalade

Préparer avant de demander de l'aide :

  • service touché ;
  • heure exacte ;
  • URL ou commande ;
  • action utilisateur ;
  • dernier déploiement ;
  • extrait court des logs ;
  • impact joueurs ou staff ;
  • action déjà tentée.

Après correction

Toujours vérifier :

  1. service healthy ;
  2. logs propres pendant 10 à 15 minutes ;
  3. parcours métier minimal ;
  4. notification Discord si une maintenance avait été annoncée ;
  5. doc ou runbook mis à jour si la procédure a changé.