Jour 1
INTRODUCTION AU DOMAINE DE L’ANALYSE DU TEXTE ET DE LA VOIX
NLP, NLU, Speech processing et understanding
Appréhender les enjeux de la révolution des modèles de langage conversationnel de type ChatGPT
NATURAL LANGUAGE PROCESSING (NLP)
Les bases du NLP : encoding, regex, tokenisation(n-grams) bag of words
NLP : la réduction de dimensions
- Nettoyer le texte : stemming, lemmatisation
- Topic modeling : SVD, NMF, LDA
- Word embedding : Word2vec, FastText, etc.
INFORMATION RETRIEVAL (IR) : CRÉER UN MOTEUR DE RECHERCHE
Indexation de contenu, moteur recherche simple
Réaliser un moteur de recherche intelligent : utilisation de modèles de langage (GPT, Bert, etc.)
Jour 2
LES MÉTHODOLOGIES DE DEEP LEARNING POUR LE TRAITEMENT DU LANGAGE
Les bases des réseaux de neurones
Modèles séquentiels : RNN
Comprendre la révolution "Transformers" : maîtriser le "multi-head attention"
COMPRENDRE LA RÉVOLUTION DES MODÈLES DE LANGAGE POUR LA CONVERSATION : CHATGPT
Introduction aux grands modèles de langage (Large Language Models - LLM) : famille Bert et famille GPT
Introduction au "Reinforcement Learning from Human Feedback" (RLHF)
Apprendre à utiliser ces modèles pour des tâches de NLP : résumé, analyse de sentiment, génération de contenu, etc.
Jour 3
AUDIO PROCESSING
Introduction à la donnée audio : signal numérique, encodage
Structurer la donnée audio : transformée de Fourier, spectogramme mel MFCC, Librosa, PyAudio
Entraîner un modèle de machine learning sur de la donnée audio
SPEECH RECOGNITION
Appliquer un modèle de transcription (Speech to Text)
- Via l'utilisation d'un modèle Open Source : exemple de Whsiper (OpenAi)
- Via l'utilisation d'une API externe
Transcrire en temps réel : enjeux, méthodologie Open Source ou via API externe
Transcrire en prenant en compte un contexte : méthodologie pour "fine-tuner" un modèle Speech to Text
Dissocier les locuteurs : méthodologie de "Speaker Diarization"
Aller plus loin : gestion de l'information temporelle, gestion de la confidence de la transcription
BILAN ET CLÔTURE DE SESSION
Revue et synthèse des concepts abordés
Moment de partage sur la formation
Questions et réponses additionnelles