Dans des systèmes devenus toujours plus complexes, souvent organisés en architectures distribuées, le monitoring traditionnel atteint ses limites. Les métriques techniques et la supervision système ne suffisent plus aux équipes de RUN, qu'elles soient côté développement ou opérations, pour garantir la fiabilité du service et établir un lien clair avec le service rendu à l'utilisateur.
Place désormais à l'observabilité. Pourtant, sa mise en œuvre se heurte fréquemment à des obstacles culturels, organisationnels et techniques, qui freinent l'adoption durable de ces nouvelles pratiques.
Cette formation apporte les bases indispensables pour comprendre l'observabilité moderne, en clarifier les apports par rapport au monitoring traditionnel, et maîtriser les principaux signaux de télémétrie: métriques, logs et traces, ainsi que les standards associés, notamment OpenTelemetry. Elle permet également d'acquérir des compétences concrètes pour instrumenter efficacement un système en production, acheminer et enrichir les données via l'OpenTelemetry Collector, et mettre en œuvre des bonnes pratiques opérationnelles. L'apprentissage s'appuie sur un équilibre entre apports théoriques, échanges et travaux pratiques.
Enfin, la formation introduit les principes clés du SRE (Site Reliability Engineering), en particulier le pilotage par SLI/SLO et la gestion de l'error budget, afin d'aider les équipes produit, développement et exploitation à mieux arbitrer entre fiabilité et vitesse de delivery.