NEW

Industrialisation d'un projet de Data Science

Description

La maturité du marché sur les sujets de la Data Science ne cesse de grandir chaque jour. C’est pourquoi, il nous semble à présent important d’être capable de déployer les POCs (Proof of Concept) les plus pertinents en production, et enfin voir les applications de data science apporter de la valeur aux entreprises.

Durant cette formation, vous profiterez de la riche expérience de nos consultants pour découvrir la Data Science industrialisée, et vous pratiquerez les meilleures méthodes pour faire passer votre projet du stade de la recherche à celui de l’exploitation en évitant les pièges de l’effet « big bang ».

Objectifs pédagogiques

  • Savoir emmener son modèle en production
  • Apprendre à gérer les nouvelles contraintes
  • Minimiser le coût de transfert de l’exploration à la production
  • Découvrir les concepts de Software Craftsmanship appliqués à la Data Science

Public cible

  • Analyste
  • Statisticien
  • Développeur

Pré-requis

  • Connaissance des bases de la Data Science (modèles, biais, variance, etc.)
  • Connaissance des librairies de manipulation de donnée en python (pandas, numpy, etc.)
  • Connaissance de la ligne de commande linux (bash par exemple)

Méthode pédagogique

Une formation pratique durant laquelle les participants partent d’un code d’exploration préparé par le formateur et qu’ils vont amener en production, étape par étape, en démontrant que la transition doit se faire de manière la plus fluide possible.

PROFILS DES INTERVENANTS

Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.

MODALITÉS D'ÉVALUATION ET FORMALISATION À L'ISSUE DE LA FORMATION

L'évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud sur la satisfaction des stagiaires est réalisée systématiquement en fin de session et une attestation de formation est délivrée aux participants mentionnant les objectifs de la formation, la nature, le programme et la durée de l'action de formation ainsi que la formalisation des acquis.

Programme :

Jour 1

  • INSTALLATION DES ENVIRONNEMENTS
    • Jupyter Notebook
    • PyCharm
    • Environnement anaconda
  • LES CONTRAINTES DE LA PRODUCTION
    • Monitoring
    • Logging
    • Réapprentissage
    • Cycle de vie d’un modèle
  • BONNES PRATIQUES DE CRAFTSMANSHIP
    • Nettoyer son notebook
    • Noms des variables
    • Utilisation de fichiers de configuration
    • Programmation fonctionnelle
    • Immutabilité
    • Créer des fonctions
  • RENDRE SON CODE DÉPLOYABLE
    • Extraire son code en module python
    • Utilisation de setuptools
      • Créer son premier fichier setup.py
      • Connaître les options de base
      • Installer sa première librairie
  • TESTER SON CODE
    • Découverte du TDD
    • Initiation à unittest
      • Les classes de test
      • Ecrire son premier test
      • Les méthodes setup et teardown
    • Intégration à setuptools

Jour 2

  • RAPPELS ET REVISION DU JOUR 1
  • INTEGRATION PAR BASE DE DONNEES
    • Connexion à une base de donnée en python
    • Export de dataset
    • Les limitations de l’intégration par la donnée
  • METHODES DE VISUALISATION
    • Superset
    • Grafana
    • ElasticSearch + Kibana
    • Gephi
  • INTEGRATION PAR SERVICE
    • Introduction à flask
    • Introduction aux APIs
  • LES PRINCIPAUX MODES DE PRODUCTIONS
    • Batch
    • Stream
  • CONCLUSION
    • Synthèse des points abordés
    • Partage sur la formation
    • Questions/Réponses additionnelles

Pour aller plus loin :

Type : Stage pratique en présentiel
Code formation : DSIND
Durée : 2 jours (14 heures)

Sessions inter-entreprises :

Tarif & dates intra-entreprise :
Devis sur demande
Nous Contacter