Tableau de santé de la plateforme de surveillance
Démo en direct : fusion de données CLI et API REST avec alertes par niveau de sévérité
Cette démo montre un contrôle de santé de la plateforme de surveillance elle-même. Elle joint deux flux de données distincts: les définitions de sessions de sondes récupérées en SSH, puis la télémétrie tirée d'une API REST. En comparant les deux, je pouvais repérer une catégorie de pannes silencieuses qu'on manquait facilement dans les rapports habituels. Certaines sessions existaient, mais ne roulaient pas vraiment. D'autres produisaient des données qui semblaient correctes au premier regard, mais échouaient à la validation du nommage et disparaissaient discrètement des rapports en aval. Le tableau découpe cela en quatre sections pour aider l'équipe à voir où le problème commence et qui doit intervenir.