Aller directement au contenu

Hier, objets de tous les fantasmes, l’intelligence artificielle et la data science sont aujourd’hui partout : dans notre téléphone, notre voiture, dans notre brosse à dents (connectée évidemment). Ces dernières années, ces disciplines ont fait leur place dans l’entreprise avec l’ambition de répondre à l’une des promesses du Big Data : comprendre plus finement et mieux prévoir les évolutions de son activité. Cette appropriation massive permet à des collaborateurs de tous horizons de devenir acteurs de cette révolution de la donnée.

Pour mieux cerner ces enjeux, Jean-Baptiste Larraufie, consultant et formateur chez OCTO Technology, analyse cette tendance de fond et décrypte la notion de “Citizen Data Scientist”. Il est également co-auteur et animateur de la nouvelle formation “Citizen Data Scientist : niveau 1” proposée par OCTO Academy.

Jean-Baptiste Larraufie, consultant, formateur et co-auteur de la formation "Citizen Data Science : niveau 1"
Jean-Baptiste Larraufie, consultant, formateur et co-auteur de la formation « Citizen Data Science : niveau 1 »

Qu’est-ce qu’un data scientist ? 

D’après la HBR, ce serait le métier le plus sexy du 21eme siècle, ou en tous cas, c’est ce qu’on disait en 2012.

Depuis, ont émergé de nombreux rôles autour de la sphère de la data : data-engineer, data geek, machine learning engineer, data architect..

Plus concrètement, je pense que l’on attend d’un data scientist une double expertise :

  • Mathématiques : le data scientist doit maîtriser les concepts statistiques. Il doit être en capacité de construire un modèle pertinent vis-à-vis de sa problématique et d’en comprendre la théorie sous-jacente pour l’interpréter, l’expliquer et l’utiliser correctement.
  • Informatique : il/elle doit posséder des compétences de programmation, idéalement en python qui reste aujourd’hui le langage usuel pour la data-science. Ses compétences de programmation lui permettent aussi bien de construire les algorithmes que de les mettre en production.

Cela reste une vision extrêmement canonique du rôle, en réalité les missions et challenges du data scientist dépendent grandement des conditions dans lesquelles il/elle évolue. Par exemple, appartenant à une petite équipe, il/elle devra se montrer entreprenant sur des problématiques amont concernant la collecte et préparation des données mais aussi aval, comme l’exploitation et la maintenance de son modèle en production. De plus, selon les données manipulées par son secteur d’activité, il/elle devra se spécialiser sur les méthodes pertinentes vis-à-vis du secteur.

Pour résumer, un bon data scientist est un professionnel des statistiques et probabilités, qui code plutôt proprement et qui s’intéresse aux problématiques d’industrialisation au gré des opportunités. 

On entend de plus en plus parler de la notion de citizen data scientist. A quoi cela correspond-t-il ?

C’est Gartner qui a introduit le concept de “Citizen Data Science” en Décembre 2016 dans un article intitulé “Citizen Data Science Augments Data Discovery and Simplifies Data Science”. Ces cinq dernières années, de nombreux acteurs (entreprises, éditeurs de logiciels, journalistes) se sont intéressés à ce nouveau domaine et ont fait émerger sa déclinaison opérationnelle : le citizen data scientist.

De mon point de vue, cet intérêt grandissant provient majoritairement de trois facteurs :

  • La plus large diffusion et démocratisation de la culture data au sein des organisations. Des collaborateurs issus du “business” s’intéressent naturellement à la data science pour répondre à leur besoins d’analytique,
  • Les impressionnantes avancées technologiques en matière d’automatisation du processus de machine learning, communément appelé “AutoML”,
  • La mise à disposition sur le marché de plateformes analytiques qui cherchent à accélérer et rendre plus accessible tous les maillons du cycle de vie d’un projet de data science.

D’un point de vue plus structurel, les directions métiers cherchent de plus en plus d’autonomie et de réactivité dans l’exécution de leur roadmap data en s’affranchissant des contraintes et plannings de l’IT. 

Finalement, la Citizen Data Science est une opportunité pour les départements métiers de tirer profit de leur connaissance en expérimentant plus librement et plus rapidement grâce à des technologies dédiées.

Par où peut-on commencer lorsqu’on s’intéresse à la Data Science ?

La data science est un domaine relativement complexe et particulièrement en vogue ces dernières années, malgré de premiers travaux datant des années 50.

Au-delà du premier “vernis théorique” indispensable pour pouvoir appréhender les fondamentaux, l’approche low-code a l’avantage de briser une première barrière à l’entrée : les compétences de programmation.

Sur un logiciel comme Dataiku par exemple, on peut aisément et de façon très didactique réaliser un projet simple de data science de bout en bout, sans écrire la moindre ligne de code : de la préparation des données à la réalisation de prédictions.

Il existe une diversité de plateformes de data science et de machine learning, présentant chacune des points forts ou différenciants sur le cycle de vie d’un projet de data-science, à l’instar de DataRobot qui se démarque sur les aspects relatifs au MLOps.

Il est encore illusoire d’imaginer développer des intelligences artificielles complexes sans l’usage de la programmation, mais pour se familiariser avec le sujet, manipuler, expérimenter et mettre en production de premiers cas d’usages, les plateformes analytiques sont une solution qui me semble crédible.

Qu’est-ce que les stagiaires vont apprendre durant la formation « Citizen Data Scientist » ?

Les objectifs de ce séminaire s’articulent autour de l’acculturation et de l’expérimentation du cycle de vie d’un projet de Data Science. Après s’être approprié les fondamentaux du machine learning, ils découvriront nos convictions et notre vision des enjeux et tendances actuelles de la Citizen Data Science.

Finalement, c’est bien la réalisation d’un projet de modélisation de bout en bout qui les occupera durant la majorité du temps de formation, avant de conclure et d’échanger ensemble sur leur retour d’expérience sur la plateforme.


A propos de la formation
« Citizen Data Scientist : niveau 1 »

De nos jours, une majorité d’entreprises dispose d’un patrimoine analytique et souhaite aller plus loin dans l’analyse de leurs données. Tirer davantage de valeur, faciliter la collaboration entre les data scientists, les métiers et l’IT, adresser de nouveaux usages basés sur l’intelligence artificielle (IA) et le machine learning sont typiquement les enjeux auxquels répondent les plateformes analytiques.

Pour les collaborateurs non-avertis à la programmation, qui veulent développer leur business grâce à l’analytique, cette formation leur permettra de découvrir et pratiquer la Data Science au moyen de la plateforme “low-code/no-code” Dataiku.

Grâce à cette formation, les participants seront également sensibilisés aux enjeux et opportunités qu’offre la “Citizen Data Science” pour leur organisation, ainsi qu’aux singularités des différentes plateformes du marché.

Toutes nos formations du domaine « Data Science »

OCTO Academy respecte votre vie privée

Ce site web stocke des informations vous concernant via le dépôt de cookie afin de mesurer l’audience du site. Ces données de navigation sont anonymisées.

En cliquant sur « OK pour moi », vous manifestez votre consentement pour le dépôt de ces cookies.

Lire la politique de confidentialité

À propos des cookies

Sur ce site, nous utilisons des cookies pour mesurer notre audience, entretenir la relation avec vous et vous adresser de temps à autre du contenu qualitif ainsi que de la publicité. Vous pouvez sélectionner ici ceux que vous autorisez à rester ici.

Cookies