Accueil / Formations

Formations

Les fondamentaux d’Hadoop Mixte : présentiel / à distance

Dernière mise à jour : 07/06/2021

Type : Stage pratique en présentiel
Description
Cette formation est une initiation aux fondamentaux d'Hadoop. Elle donne aux participants une connaissance théorique et pratique de la plateforme, au travers de plusieurs exercices pratiques appliqués à des cas réels. A l'issue de la session, les participants seront en capacité d'utiliser les outils de l'écosystème Hadoop pour explorer des données stockées sur un entrepôt Big Data.
Objectifs de la formation
  • Appréhender le fonctionnement d'Hadoop
  • Identifier l'écosystème : quels outils pour quels usages ?
  • Manipuler les principales commandes shell d'interaction avec Hadoop
  • Emettre des requêtes SQL avec Hive et HCatalog
  • Créer des traitements de données avec Pig
Public visé
Analyste
Data scientist
Architecte
Développeur
Prérequis
Connaissances de base en programmation ou en scripting.
Modalités pédagogiques
Apports théoriques préalables présentant la plateforme Hadoop, son fonctionnement et son écosystème. Travaux pratiques pour une mise en application immédiate. Les travaux pratiques s'effectueront sur un cluster Apache Hadoop 2.x.
Profil du / des Formateur(s)
Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.

Modalités d'évaluation et de suivi
L'évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud sur la satisfaction des stagiaires est réalisée systématiquement en fin de session et une attestation de formation est délivrée aux participants mentionnant les objectifs de la formation, la nature, le programme et la durée de l'action de formation ainsi que la formalisation des acquis.
Programme
Jour 1

1.    Introduction au Big Data
1.1.    Qu'est-ce que Big Data ?
1.2.    Les grands enjeux métier
1.3.    Paysage technologique : les architectures Big Data

2.    Introduction à Hadoop
2.1.    Historique succinct

2.2.    Le cœur de la plateforme : HDFS et YARN

2.3.    L'écosystème Hadoop
2.3.1.    Frameworks et algorithmes
2.3.2.    Bases de données
2.3.3.    Traitements des données
2.3.4.    Intégration

2.4.    Hadoop et la sécurité des données

3.    Manipuler la ligne de commande Hadoop
3.1.    Présentation des principales commandes
3.2.    Mise en pratique "Manipulation et transfert de fichiers en ligne de commande

4.    Une interface utilisateur pour Hadoop : Hue
4.1.    Présentation de Hue et de ses modules
4.2.    Mise en pratique "Manipulation interactive de données"

5.    Interroger Hadoop avec du SQL : Hive
5.1.    Présentation de Hive
5.2.    Mise en pratique "Manipulation de données avec SQL"
5.2.1.    Créer un modèle de données
5.2.2.    Importer des fichiers sources
5.2.3.    Requêter les données

Jour 2

6.    Transformer des données : le langage Pig

6.1.    Présentation de Pig

6.2.    Mise en pratique "Transformation de données avec Pig"
6.2.1.    Charger des données semi-structurées
6.2.2.    Croiser avec des données Hive
6.2.3.    Sauvegarder le résultat dans HDFS

7.    Ecriture de traitements avancés
7.1.    Présentation du framework Hadoop Streaming
7.2.    Présentation express du langage Python et du squelette de programme pour l'exercice
7.3.    Mise en pratique "Ecriture d'un programme de manipulation complexe"

8.    Composition et ordonnancement de traitements
8.1.    Présentation d'Oozie
8.2.    Mise en pratique "Création d'un pipeline de traitement de données"
Exposé (%)
60
Pratique (%)
30
Echanges (%)
10

M'inscrire à la formation

Lieu :
Classe virtuelle
Détail des horaires :
Demander un devis
Session sélectionnée
  • 22/11/21 → 23/11/21
  • Détails :

    22/11/21 : 09:30 → 12:30
    13:30 → 17:30
    23/11/21 : 09:00 → 12:30
    13:30 → 17:00
Prochaines Sessions
  • Désolé, cette formation n'est pas programmée pour le moment.
    Si vous êtes responsable formation, vous pouvez faire une requête pour l'organiser en INTRA dans votre entreprise.

Catalogue de formation propulsé par Dendreo,
logiciel spécialisé pour centres et organismes de formation

OCTO Academy respecte votre vie privée

Ce site web stocke des informations vous concernant via le dépôt de cookie afin de mesurer l’audience du site. Ces données de navigation sont anonymisées.

En cliquant sur « OK pour moi », vous manifestez votre consentement pour le dépôt de ces cookies.

Lire la politique de confidentialité

À propos des cookies

Sur ce site, nous utilisons des cookies pour mesurer notre audience, entretenir la relation avec vous et vous adresser de temps à autre du contenu qualitif ainsi que de la publicité. Vous pouvez sélectionner ici ceux que vous autorisez à rester ici.

Cookies