Bienvenue.
J'ai passé une bonne partie de ma carrière à construire et soutenir des outils de surveillance, d'automatisation et de reporting dans des environnements télécom. Une grande partie de ce qu'on apprend dans ce genre de travail ne se retrouve ni dans la documentation des fournisseurs, ni dans les présentations bien propres. On l'apprend au milieu du vrai travail: données incomplètes, angles morts, processus manuels, et petits correctifs techniques qui finissent par faire une vraie différence.
C'est de cela que j'ai envie de parler ici.
Je vais aussi partager des projets personnels quand ils valent la peine d'être montrés. Certains sont très techniques, d'autres simplement pratiques, et plusieurs commencent parce que j'en avais assez de refaire la même chose à la main.
À quoi s'attendre
Les sujets abordés incluront :
- Automatisation Python pour les opérations réseau - intégrations API, scripts de réconciliation et petits outils capables de tenir la route en production
- Notes sur les plateformes d'observabilité - retours de terrain sur Dynatrace, SevOne, Splunk et l'instrumentation de performance dans de grands réseaux
- Analytique de performance - conception de KPI, pipelines ETL, sondage actif et façons de rendre les données utiles à plus d'une audience
- Fiabilité de service - réponse aux incidents, automatisation préventive et habitudes d'exploitation qui évitent la dérive
À qui s'adresse ce blogue
Principalement aux ingénieurs réseau, aux équipes d'exploitation et aux gestionnaires techniques qui font face au même genre de problèmes que ceux sur lesquels j'ai travaillé pendant des années.
Si une publication vous fait penser à un problème semblable, ou vous donne envie d'en discuter, contactez-moi. C'est toujours un plaisir d'échanger.
- Stéphane Belliveau, ing.