Accueil / Formations

Formations

Cadrage et pilotage d'un projet de Data Science

Dernière mise à jour : 14/03/2021

Description
La Data Science, en tant que discipline scientifique et mathématique, est aujourd'hui bien connue de ceux qui la pratiquent. Mais savez-vous identifier les pièges et les embûches méthodologiques spécifiques aux projets de Data Science ?

Forts de nos nombreux retours d'expérience et des connaissances pratiques de nos consultants, nous vous convions à découvrir avec nous les enjeux et les approches qui permettront à vos projets de se dérouler en toute sérénité, du cadrage à la phase de pilotage de production..
Objectifs de la formation
Savoir mener une phase de cadrage d'un projet de Data Science
Choisir les mesures de performance en accord avec un objectif métier
Piloter un projet de Data Science en exploration et production
Public visé
Analyste
Statisticien
Développeur
Prérequis
Connaissance des bases de la Data Science (modèles, biais, variance, etc.)
Connaissance des librairies de manipulation de donnée en python (pandas, numpy, etc.)
Programme
Jour 1

1.Rappels sur la data science
1.1.Qu'est-ce-que la Data Science ?
1.2.Qu'est-ce qu'un modèle ?

2.La phase de cadrage
2.1.Cadrage d'un sujet supervisé
2.1.1.Découverte des données
2.1.2.Compréhension des enjeux métier
2.1.3.Choix de l'approche

2.2.Visualiser pour comprendre

2.3.Echantillonnage

2.4.La temporalité dans les données

3.Piloter son projet par la mesure
3.1.L'importance du test
3.1.1.Lien avec les tests d'intégration

3.2.Le choix des métriques à optimiser
3.2.1.Les métriques de régression
3.2.2.Les métriques de classification

3.3.Le choix des métriques d'évaluation

3.4.La validation croisée
3.4.1.Cas nominal
3.4.2.Cas des variables temporelles

3.5.Monitoring des modèles

4.L'agile en data science
4.1.Livrer souvent
4.2.Communiquer avec le client
4.3.Garantir la qualité
4.4.Amélioration continue

5.Optimisation avancée de la performance
5.1.Sélection de variables
5.1.1.Eviter les fuites d'information
5.1.2.Cas des variables textuelles

5.2.Choix des algorithmes

5.3.Tuning des hyperparamètres
5.3.1.Grid search
5.3.2.Hyperopt
5.3.3.Parallélisme

6.    Auditer / comprendre un modèle
6.1.Explicativité des algorithmes
6.1.1.Feature importance
6.1.2.Feature contribution

Jour 2

7.Rappels et révision du jour 1 

8.Cas pratique
8.1.Exposé du problème
8.2.Découverte du dataset
8.3.Choix des métriques
8.4.Réalisation d'un premier modèle
8.5.Optimisation des performances

9.Conclusion
9.1.Synthèse des points abordés
9.2.Partage sur la formation
9.3.Questions/Réponses additionnelles
Modalités pédagogiques
Formation avec apports théoriques, échanges sur les contextes des participants et retours d'expérience pratique du formateur, complétés de travaux pratiques et de mises en situation.
Profil du / des Formateur(s)
Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.
Modalités d'évaluation et de suivi
L'évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud sur la satisfaction des stagiaires est réalisée systématiquement en fin de session et une attestation de formation est délivrée aux participants mentionnant les objectifs de la formation, la nature, le programme et la durée de l'action de formation ainsi que la formalisation des acquis.
Pour aller plus loin
https://www.octo.academy/fr/nos-formations/62-data-science Toutes nos formations Data Science https://www.octo.academy/fr/formation/144-data-science-niveau-avance Formation « Data Science niv

M'inscrire à la formation

Lieu :
Classe virtuelle
PARIS
Détail des horaires :
Ajouter au panier