Data Science : pour une éthique des données
Intégrer les problématiques éthiques dans les projets de Data Science
Description
Du règlement général sur la protection des données (RGPD) aux scandales médiatiques, les questions d’éthique en data science défrayent la chronique. Cette formation a pour objectif de sensibiliser les data scientists et leurs managers aux problèmes pouvant émerger de projets impliquant des données personnelles et des modèles de machine learning.
Des illustrations de cas concrets vous permettront de comprendre les enjeux et vos responsabilités dans la chaîne de développement de ces projets. Grâce à des exercices pratiques, vous apprendrez à repérer les biais discriminatoires et à les prévenir.
Objectifs pédagogiques
- Prendre conscience des problèmes d’éthique en Data Science
- Découvrir les différentes typologies de problèmes
- Appréhender les responsabilités de chacun
- Identifier les biais discriminatoires et les prévenir
Public cible
- Data scientist
- Manager
- Analyste
- Statisticien
- Architecte
- Développeur
Pré-requis
- Connaissances en data science et machine learning.
- Connaissances de base en programmation ou scripting.
- Quelques notions de statistiques sont un plus.
Méthode pédagogique
Formation avec apports théoriques, échanges sur la thématique, complétés de travaux pratiques et de mises en situation.
PROFILS DES INTERVENANTS
Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.
MODALITÉS D'ÉVALUATION ET FORMALISATION À L'ISSUE DE LA FORMATION
L'évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud sur la satisfaction des stagiaires est réalisée systématiquement en fin de session et une attestation de formation est délivrée aux participants mentionnant les objectifs de la formation, la nature, le programme et la durée de l'action de formation ainsi que la formalisation des acquis.
Programme :
1.INTRODUCTION
- 1.Présentation croisée et attentes des participants
- Atelier d’échange et de réflexion sur les problèmes d’éthique
- PRÉSENTATION DES DIFFÉRENTES TYPOLOGYES DE PROBLEME
- Responsabilités juridiques
- Protection des données personnelles
- Biais discriminatoires
- Mise en pratique : illustration par des cas concrets
- CONNAITRE SES DONNÉES ET LES MODÈLES
- Les données sensibles et populations à risque
- Les distributions asymétriques
- Le trade-off Performance/Interprétabilité
- La cible à optimiser
- Mise en pratique : démonstration avec un jeu de données
- SAVOIR IDENTIFIER DES PISTES DE SOLUTIONS AUX PROBLÈMES
- Écarter les variables sensibles
- Corriger les inégalités
- Les ‘serments’ de bonne volonté
- Mise en pratique : démonstration sur le jeu de données
- CLÔTURE
- Retour d’expérience
- Questions/Réponses
- Évaluation de la session
Pour aller plus loin :
- Parcours certifiant « Développement et conduite de projets d'intelligence artificielle »
- Toutes nos formations Data Science
- Le Serment d'Hippocrate pour Data Scientist
- Article "Le serment Holberton-Turing pour l’intelligence artificielle"
- Article "Ethique et intelligence artificielle : récit d’une prise de conscience"
- Interview Cathy O’Neil
- Blog Google Research "Attacking discrimination with smarter machine learning"
Partager
Sessions inter-entreprises :
Devis sur demande