En navigant sur ce site, vous acceptez l’utilisation de cookies ou autres traceurs vous permettant une utilisation optimale du site (partages sur les réseaux sociaux, statistiques de visite, etc.)
NEW

Industrialisation avancée d’un projet de Data Science

Orchestration, déploiement et monitoring d’un système de Data Science

Description

Une fois que le code du projet de Data Science a été industrialisé, il reste un certain nombre d’étapes pour industrialiser le système au complet. Il s’agira notamment de mettre en place un mécanisme d’orchestration, mais aussi d’être capable de déployer régulièrement, et de suivre le comportement du système.

Tout au long de cette formation avancée, vous profiterez de la riche expérience de nos consultants-formateurs pour découvrir les systèmes de Data Science industrialisés, et vous pratiquerez les meilleures méthodes pour faire passer votre projet en production.

Objectifs pédagogiques

  • Découvrir le découpage d’un projet de Machine Learning en différentes briques et les organiser
  • Savoir construire l'architecture applicative d'un projet Data Science
  • Déployer son application de Machine Learning en production et interagir avec
  • Faire consommer des données chaque seconde à une application de Machine Learning
  • Mesurer les performances de son application de Machine Learning

Public cible

  • Data Scientist
  • Data Engineer
  • Machine Learning Engineer
  • Développeur d’applications de Data Science
  • Analyste
  • Statisticien

Pré-requis

  • Connaissances de base en programmation et en scripting
  • Avoir suivi la formation "Industrialisation de la Data Science - fondamentaux" ou savoir packager une application Python
  • Avoir suivi la formation "Industrialisation de la Data Science" (DSIND) ou savoir tester une application python
  • Avoir suivi la formation "Fondamentaux de la Data Science" (DSFDX) ou savoir modéliser et développer un problème de Data Science simple

Méthode pédagogique

Une formation alternant théorie et pratique durant laquelle les participants partent d’un modèle de machine learning construit par le formateur qu’ils vont amener en production, étape par étape, en découvrant l’ensemble des briques techniques à mettre en place.

PROFILS DES INTERVENANTS

Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.

MODALITÉS D'ÉVALUATION ET FORMALISATION À L'ISSUE DE LA FORMATION

L'évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud sur la satisfaction des stagiaires est réalisée systématiquement en fin de session et une attestation de formation est délivrée aux participants mentionnant les objectifs de la formation, la nature, le programme et la durée de l'action de formation ainsi que la formalisation des acquis.

FORMALISATION A L'ISSUE DE LA FORMATION

L'évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud sur la satisfaction des stagiaires est réalisée systématiquement en fin de session et une attestation de formation est délivrée aux participants mentionnant les objectifs de la formation, la nature, le programme et la durée de l'action de formation ainsi que la formalisation des acquis.

Programme :

Jour 1

  • Introduction à la CI / CD
    • Les différents environnements nécessaires
    • L’intérêt de l’intégration continue et du déploiement continu
    • Les outils de CI / CD existants
  • Mise en pratique : “Mettre en place un outil d’intégration continue”
  • Pyramide de tests
    • Description des différents types de tests
    • Focus sur les tests d’intégrations et fonctionnels
    • Présentation de framework de tests
  • Cloud
    • Introduction au cloud et aux différents providers
    • Choix d’un cloud provider pour les travaux pratiques
  • Orchestration
    • Le besoin d’orchestration dans un système de Data Science
    • Présentation de différents orchestrateurs
    • Mise en pratique : ”Passer d’un script Python à une série de tâches orchestrées avec Airflow"

Jour 2

  • Architecture
    • Patterns d’architecture technique pour favoriser la mise en production et la maintenabilité du projet
    • Identification des artefacts (modèles, données, code…)
    • Cycles de vie des artefacts
  • Déploiement
    • La démarche
    • Infrastructure as code
  • Exposition
    • Méthodes pour exposer un modèle de Data Science
    • Mise en pratique : “Interagir avec un modèle existant”

Jour 3

  • Mise en pratique : “Passer d’un modèle one-shot à un modèle qui prédit toutes les secondes”
    • A partir d’un flux de données disponibles, mettre en place les outils nécessaires pour faire une prédiction par seconde
  • Feedback loops
    • L’intérêt des boucles de feedback
    • Identifier les différentes boucles de feedbacks
    • Mettre en place les différentes boucles de feedbacks
  • Monitoring
    • L’enjeu du monitoring
    • Les indicateurs à suivre
    • Les pratiques pour mettre en place un monitoring utile tout en respectant les contraintes de SLA
  • Réentraînement des modèles
    • Choisir le bon moment pour réentraîner un modèle
    • Les stratégies à mettre en place pour s’assurer que le modèle en production est toujours pertinent
  • Bilan et clôture
    • Partage et retour d’expérience
    • Questions / réponses
    • Évaluation de la session

Pour aller plus loin :

Type : Stage pratique en présentiel
Code formation : DSIN2
Durée : 3 jours (21 heures)

Sessions inter-entreprises :

Tarif & dates intra-entreprise :
Devis sur demande
Nous Contacter