5 modules – 13,5 jours / 94,5 heures – 9 100 € HT
CODE PMC : PMC-PACIA
Présentation
Le data scientist est parmi les profils les plus recherchés actuellement dans les entreprises. Acteur incontournable de la transformation digitale, son rôle consiste à extraire de l’information et créer de la connaissance à partir du traitement de grands volumes de données. A ce titre, il doit savoir naviguer entre différentes disciplines : mathématiques, statistiques, informatiques.
Mais répondre de façon théorique à un problème fonctionnel grâce à l’utilisation de méthodes statistiques et algorithmiques n’est qu’un aspect du rôle de Data scientist. Il doit également s’assurer de la mise en œuvre de sa solution et choisir les meilleures options techniques (plateformes informatiques, logiciels, etc.) pour une bonne intégration au système d’information, en tenant compte des contraintes de temps et de budget.
Le parcours de formation « Développement et conduite de projets d’intelligence artificielle » vous permettra d’assurer un pilotage efficace à tous les stades de développement d’un projet de Data science, de la phase de cadrage à l’industrialisation. A travers ce parcours, vous découvrirez non seulement la puissance prédictive des modèles statistiques d’apprentissage mais également tout le bénéfice que vous pourrez retirer de la mise en œuvre de l’agilité et des concepts de Software Craftsmanship appliqués à la data science.
A l’issue des 5 modules du parcours, vous serez en mesure de comprendre et de mettre en œuvre les modèles mathématiques, développer correctement vos applications, choisir les architectures les plus appropriées pour exploiter tout le potentiel de vos datas et les mettre au service des besoins métiers.
Durée
Le parcours est composé de modules courts (de 1 à 3 jours) répartis sur une période de 6 mois maximum.
Sa durée totale est de 13,5 jours.
Formalisation à l’issue du parcours
À l’issue du parcours, un certificat de compétence est transmis aux participants en cas de succès à la validation finale.
Public concerné
- Analyste
- Data scientist
- Statisticien
- Architecte
- Développeur
Pré-requis
- Connaissances de base en programmation ou en scripting
- Connaissance des librairies de manipulation de données en python (pandas, numpy, etc.)
- Connaissance de la ligne de commande linux (bash par exemple)
Dates de départ
- 14 septembre 2022 – Paris
- 24 novembre 2022 – Paris
#1 Fondamentaux de la Data Science (3 jours)
- Découvrir le monde de la Data Science et les grandes familles de problèmes
- Savoir modéliser un problème de Data Science
- Créer ses premières variables
- Constituer sa boite à outils de data scientist
#2 Data Science : niveau avancé (3 jours)
- Découvrir et utiliser la puissance prédictive des modèles ensemblistes
- Savoir effectuer un « feature engineering » performant
- Appréhender les techniques de text-mining et de deep-learning à travers des exemples concrets
- Enrichir sa boite à outils de data scientist
#3 Cadrage et pilotage d’un projet de Data Science (2 jours)
- Savoir mener une phase de cadrage d’un projet de Data Science
- Choisir les mesures de performance en accord avec un objectif métier
- Piloter un projet de Data Science en exploration et production
#4 Industrialisation d’un projet de Data Science (2 jours)
- Savoir emmener son modèle en production
- Apprendre à gérer les nouvelles contraintes
- Minimiser le coût de transfert de l’exploration à la production
- Découvrir les concepts de Software Craftsmanship appliqués à la Data Science
#5 Architecture des données : stockage et accès (3 jours)
- Découvrir les notions centrales de stockage de données
- Appréhender les enjeux des nouvelles architectures de données (Hadoop, NoSQL, Spark), et positionner leurs usages au sein de l’univers Big Data
- Savoir manipuler ces technologies et les bases de données de façon conjointe, pour mener à bien des analyses efficaces
#6 Validation des compétences (0,5 jour)
- Le candidat est mis en situation professionnelle de développer un workflow complet de Data Science : Chargement de la donnée, Data Cleaning, Feature Engineering, Données catégorielle, Donnée Textuelle Entrainement d’un modèle bien choisi, Test et Validation.
- Le sujet de la mise en situation est attribué au candidat en démarrage de formation.
- Passage de la certification : Le candidat fait une restitution visuelle de l’approche développée et des résultats obtenus aux évaluateurs sa réalisation. Les membres du jury questionnent le candidat sur sa réalisation. Cette réalisation couvre l’ensemble des compétences de la certification.
- Les membres du jury évaluent les compétences acquises selon une grille d’évaluation reprenant les critères d’évaluation de la certification.
- La validation est obtenue dès que le taux de réussite des épreuves atteint 60%.
Tarifs
- Individuel : 9 100 € HT (en présentiel, pauses et déjeuners offerts)
- Intra-entreprise : Devis sur demande
Financement
Les procédures de prise en charge des parcours varient d’un OPCO à l’autre. Le conseiller formation de votre OPCO est à votre disposition pour vous renseigner et vous orienter.
OCTO Academy a également une équipe dédiée à la gestion des documents administratifs et aux relations avec les OPCO. Vous pouvez poser toutes vos questions au 01 70 36 18 67 ou par mail à : [email protected]