Aller directement au contenu

La Data Science et le Machine Learning permettent d’analyser de grands volumes de données et fournir de précieuses informations. Pour autant, le déploiement et la maintenance d’applications de ce type en production engendrent parfois des pertes importantes de temps et d’argent.

En 2022, après avoir largement prouvé sa valeur, il serait temps de faire du Machine Learning en production, n’est-ce pas ?

Dans ce contexte, Aurélien Massiot, consultant et formateur data chez OCTO Technology, présente les avantages que confèrent les outils et pratiques du MLOps dans les projets de Data Science.

Aurélien est notamment animateur de la formation AWS : MLOps Engineering, proposée par OCTO Academy.

Aurélien Massiot, consultant, formateur data et animateur de de la formation « AWS : MLOps engineering »

On entend de plus en plus le terme “MLOps”. D’où vient ce terme ?

MLOps vient de la concaténation de deux termes : ML (Machine Learning) et Ops (Opérations). 

Mais pour comprendre pourquoi nous les avons concaténés, voici un historique sur le domaine de l’IA (Intelligence Artificielle) :

La data science et l’IA, c’est l’art d’extraire des informations utiles de la donnée. Vous savez probablement qu’aujourd’hui il y a de la donnée partout ! Chaque minute, les utilisateurs d’Instagram aiment 3 millions de photos, Google traduit 70 millions de mots, Netflix streame 90 000 heures de vidéo [source]… bref il y a de gigantesques volumes de données sous différents formats : texte, vidéos, images, et le challenge est de réussir à les analyser et en extraire de l’information, chose qu’un humain n’est pas capable de faire. 

En effet, après la découverte d’un potentiel immense dans le domaine de l’intelligence artificielle depuis une dizaine d’années, avec notamment des pionniers comme Google et Amazon, sont arrivées les premières déceptions lorsqu’il a fallu déployer ces modèles d’apprentissage automatique

Seulement 22% des entreprises utilisant le Machine Learning ont réussi à déployer un modèle en production…[source]

Pourquoi est-ce difficile de déployer des modèles de Machine Learning ?

C’est difficile, parce qu’en plus du code, nous avons des modèles et des données qui évoluent au cours du temps. En quelque sorte, c’est comme une application qui “vit”. L’interdépendance entre ces 3 dimensions, le code, les modèles et les données, c’est ce qui rend le Machine Learning difficile à déployer.

A cause de l’interdépendance de ces 3 dimensions, le modèle peut devenir complètement faux. 

Les impacts humains, financiers, éthiques, etc. peuvent être très forts.

Nous l’avons vu avec Zillow par exemple, qui a perdu des centaines de millions de dollars lorsque ses algorithmes se sont trompés [source], ou avec l’accident d’une voiture Uber pilotée automatiquement qui a coûté une vie [source]. Les exemples sont légion !

Il nous faut donc être intransigeants sur ces 3 dimensions et c’est la raison pour laquelle le courant MLOps a émergé.

C’est quoi alors, le MLOps ?

Le MLOps, c’est un ensemble d’outils et de pratiques venues du courant DevOps, adaptés au Machine Learning

Par exemple, des pratiques venues du DevOps, comme l’intégration continue (CI) ou le déploiement continu (CD), rendent le déploiement moins coûteux et permettent une qualité logicielle plus élevée. Ces pratiques s’adaptent aussi bien au développement logiciel “traditionnel” qu’à un projet de Machine Learning.

Mais en plus de cela, le projet de Machine Learning a des spécificités : la performance d’un modèle peut décliner au cours du temps, des flux de données peuvent arriver en retard, des données peuvent êtres fausses ou biaisées… Bref, il y a d’autres défis, et c’est là que l’émergence de pratiques MLOps comme le monitoring de modèles, le réentraînement de modèles ou le versioning des 3 dimensions citées précédemment (modèles, données, code) peut aider.

Qu’est-ce que les stagiaires vont apprendre durant la formation « AWS : MLOps Engineering » ?

Nous allons d’abord démystifier les notions d’Ops, DevOps, MLOps. Puis nous verrons comment entraîner et déployer des modèles de Machine Learning en production dans le cloud, avec des outils comme AWS Sagemaker ou Airflow par exemple. Enfin nous verrons comment surveiller nos modèles dans le temps, les réentraîner si la performance se dégrade, les remplacer via différentes stratégies de déploiement…

Le programme est riche et intéressera toutes les personnes qui touchent de près ou de loin à la Data Science. Il y aura à la fois de la théorie, de la pratique et des retours d’expérience.

Enfin, la formation ne nécessite pas de bien connaître AWS, puisque nous ferons quelques rappels et qu’elle contient énormément de pratiques “agnostiques” de l’environnement cloud utilisé.


A propos de la formation
« AWS : MLOps Engineering »

Ce cours étend les pratiques DevOps répandues dans le développement de logiciels dans le domaine de la Data Science. 

Ainsi, vous pourrez entraîner et déployer des modèles d’apprentissage automatique (Machine Learning) tout en suivant leur performance dans le temps, et ainsi obtenir un système de Data Science en production.

Cette formation met l’accent sur l’importance des données, du modèle et du code pour la réussite des modèles de ML en production. Vous découvrirez les  différents outils et processus d’automatisation ainsi que de la méthodologie et de l’organisation d’équipe pour gérer tout le cycle de vie d’un projet de Data Science. 

Découvrir la formation

Toutes les formations du domaine AWS

OCTO Academy respecte votre vie privée

Ce site web stocke des informations vous concernant via le dépôt de cookie afin de mesurer l’audience du site. Ces données de navigation sont anonymisées.

En cliquant sur « OK pour moi », vous manifestez votre consentement pour le dépôt de ces cookies.

Lire la politique de confidentialité

À propos des cookies

Sur ce site, nous utilisons des cookies pour mesurer notre audience, entretenir la relation avec vous et vous adresser de temps à autre du contenu qualitif ainsi que de la publicité. Vous pouvez sélectionner ici ceux que vous autorisez à rester ici.

Cookies