Format : Stage pratique

Niveau Fondamentaux

Répartition du temps : 70% exposés
20% pratique
10% échanges

La formation en détails

Description

Selon un des fondateurs de la discipline SRE, le Site Reliability Engineering, c'est “ce qu'il se passe quand on demande à des ingénieurs logiciels de gérer les infrastructures et opérations d'un système IT”. Le SRE consiste à appliquer les techniques éprouvées du développement logiciels aux tâches d'exploitation : monitoring, déploiement, gestion des anomalies, etc.

Une démarche SRE vise à optimiser les équipes ainsi que les systèmes techniques qu'elles opèrent. L'objectif est de développer la capacité d'évolution des systèmes sans sacrifier les exigences de fiabilité et de disponibilité. Pour cela, la démarche s'appuie sur plusieurs piliers tels que la mesure constante de l'état de santé des systèmes, l'automatisation d'un maximum de tâches et l'apprentissage en continu des équipes.

A travers une alternance de modules théoriques, permettant de revenir aux fondations de la démarche, et de travaux pratiques, permettant de mettre en application les concepts, cette formation propose aux participants de mieux appréhender les techniques, méthodes et outils essentiels pour la mise en place d'une démarche SRE dans leur contexte.

Objectifs

Expliquer les principes et pratiques clés du Site Reliability Engineering (SRE) et leurs apports
Identifier les différents rôles d'une équipe SRE
Définir des objectifs de performance et de fiabilité (SLI/SLO) et concevoir les moyens de mise en œuvre pour les atteindre.
Mettre en place et exploiter le monitoring afin de mesurer et analyser la fiabilité de sa plateforme
Piloter un error budget partagé afin d'animer le dialogue entre équipes produit et développement et arbitrer entre fiabilité et vitesse de delivery.
Gérer un incident de bout en bout (diagnostic, résolution, communication) et conduire un post-mortem afin d'en tirer des actions d'amélioration.

Public cible

Toute personne impliquée opérationnellement ou en position de management d'un système informatique en production.

Notamment :

Ops et administrateur système
Manager de systèmes d'information (COO, CTO, etc.)
Développeur
Consultant
Intégrateur
Exploitant

Prérequis

Disposer d'une compréhension et une connaissance de la terminologie et des concepts communs de DevOps ou avoir suivi la formation “DevOps : fondamentaux et retours d'expérience” (SDEVO).

Une première expérience dans l'exploitation d'un système en production

Modalités pédagogiques

Formation avec apports théoriques, échanges sur les contextes des participants et retours d'expérience pratique des formateurs, complétés de travaux pratiques et de mises en situation.

Accessibilité

L'inclusion est un sujet important pour OCTO Academy.
Nos référent·es sont à votre disposition pour faciliter l'adaptation de votre formation à vos besoins spécifiques.

Notre politique accessibilité Contacter nos référent·es

Profil du formateur

Cette formation est dispensée par un·e ou plusieurs consultant·es d'OCTO Technology ou de son réseau de partenaires, expert·es reconnus des sujets traités.

Le processus de sélection de nos formateurs et formatrices est exigeant et repose sur une évaluation rigoureuse leurs capacités techniques, de leur expérience professionnelle et de leurs compétences pédagogiques.

Modalités d'évaluation et de suivi

L'évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique.

Afin de valider les compétences acquises lors de la formation, un formulaire d'auto-positionnement est envoyé en amont et en aval de celle-ci.

En l'absence de réponse d'un ou plusieurs participants, un temps sera consacré en ouverture de session pour prendre connaissance du positionnement de chaque stagiaire sur les objectifs pédagogiques évalués.

Une évaluation à chaud est également effectuée en fin de session pour mesurer la satisfaction des stagiaires et un certificat de réalisation leur est adressé individuellement.

Programme détaillé

Jour 1

Introduction au Site Reliability Engineering

Historique et émergence de la discipline SRE

Chez Google
Intégration avec le mouvement DevOps

Opérer des systèmes en production

Les différents rôles et responsabilités d'une équipe SRE

Garant de la fiabilité des applications et services
Garant du pilotage de l'error budget
Garant de la minimisation du toil

SRE : garant de la fiabilité des services et applications

Le cycle de vie d'un logiciel

Reliability/Fiabilité : définitions

Monitoring

Définition et concepts : monitoring vs. Observabilité
Alertes, tickets, logs
Créer un système d'alertes efficace
Statistiques appliquées au monitoring

Être on-call

Organisation d'une équipe d'astreinte
Diagnostiquer efficacement un incident
Rédiger un rapport d'erreur
Mise en pratique : “Diagnostiquer et corriger un incident de production”

Prendre en charge un service ou une application : Production Readiness Review

Release Engineering : la gestion des changes

Jour 2

SRE : garant du pilotage de l'error budget

La gestion du risque d'un système informatique

Les outils de mesure et de pilotage de l'équipe SRE : SLI, SLO, SLA, Error budget

Mise en pratique : “Mettre en place des SLI/SLO/Error budget pour un service/application”

SRE : garant de l'automatisation de ses services

La contrainte économique - la scalabilité des équipes

Agir sur le toil : les tâches sans valeur ajoutée

Identifier le toil
Bloquer du temps dédié à l'automatisation

Organiser l'automatisation de l'opération de ses systèmes

Mise en pratique : “Identification de tâches automatisables”

Organisation et culture

SRE vs DevOps

L'équipe SRE dans une organisation agile

Intégration
Impact sur le reste de l'organisation

Mettre en place une culture de l'apprentissage

Sécurité psychologique
Blameless postmortem

Intégrer un nouvel SRE

Ce qu'en disent les participants

4.55 / 5

Satisfaction moyenne

Sur la base de 7 avis, collectés en fin de formation durant les 12 derniers mois.

100 %

recommandent cette formation

Sur la base de 7 avis, collectés en fin de formation durant les 12 derniers mois.

Nos autres formations du domaine « Opérations » Toutes les formations du domaine

SDEVO DevOps : fondamentaux et retours d’expérience
S'initier à l'approche et comprendre ses 4 piliers fondateurs

Cloud & Platforms / Opérations

Durée : 7 h / 1 j

Fondamentaux

Prochaine session : 30 novembre 2026

AISRS Atelier d’investigation Système, Réseau et Sécurité
Investiguer pour résoudre les problèmes sur des systèmes défaillants

Cloud & Platforms / Opérations

Durée : 7 h / 1 j

Fondamentaux

Prochaine session : Sur demande

DANSI Automatiser la gestion de serveurs avec Ansible
Mettre en œuvre l’outil pour une gestion industrialisée de son infrastructure

Cloud & Platforms / Opérations

Durée : 14 h / 2 j

Fondamentaux

Prochaine session : 01 décembre 2026

GITLA GitLab CI et CD : Gestion des sources et Intégration continue avec GitLab
Industrialiser son CI/CD avec Gitlab-CI

Cloud & Platforms / Opérations

Durée : 14 h / 2 j

Avancé

Prochaine session : 19 novembre 2026

MONIT Découverte et mise en pratique des bases du monitoring
Assimiler les grands principes et mettre un oeuvre une première solution avec Prometheus et Grafana

Cloud & Platforms / Opérations

Durée : 7 h / 1 j

Fondamentaux

Prochaine session : Sur demande

TERRA Déployer une infrastructure IaaS Open Source avec Terraform
Comprendre et expérimenter les ressources Terraform pour une utilisation en contexte cloud

Cloud & Platforms / Opérations

Durée : 7 h / 1 j

Fondamentaux

Prochaine session : 01 octobre 2026

Besoin d'aide pour trouver votre formation ?

Contactez-nous

Sessions & Inscriptions

Session partagée avec d'autres organisations

Prochaines sessions

du 06 au 07/10/2026

1 740,00 € ^HT
du 23 au 24/11/2026

Présentiel, Paris

1 740,00 € ^HT

Durée

14 h / 2 j

Demander un devis Nous contacter
Télécharger le programme

Organiser une session dédiée à votre organisation

Durée

14 h / 2 j

Vous avez plusieurs collaborateurs à former ?

Cette formation peut être organisée
sous la forme de sessions dédiées
aux membres de votre organisation.

Demander un devis Nous contacter Télécharger le programme

Personnaliser cette formation

Cette formation vous intéresse
et vous souhaitez l'adapter pour
vos collaborateurs ?

Nos formateurs et notre équipe pédagogique sont à
votre disposition pour en discuter
et vous proposer un programme sur-mesure.

Nous contacter Télécharger le programme

PLSRE Pratiquer le Site Reliability Engineering Opérer et piloter sa production comme Google

La formation en détails

Description

Objectifs

Public cible

Prérequis

Modalités pédagogiques

Accessibilité

Profil du formateur

Modalités d'évaluation et de suivi

Programme détaillé

Ce qu'en disent les participants

Nos autres formations du domaine « Opérations » Toutes les formations du domaine

Besoin d'aide pour trouver votre formation ?

Sessions & Inscriptions