Accueil / Formations

Formations

Les fondamentaux d’Hadoop Mixte : présentiel / à distance

Dernière mise à jour : 03/12/2021

Type : Stage pratique
Description
Cette formation est une initiation aux fondamentaux d'Hadoop. Elle donne aux participants une connaissance théorique et pratique de la plateforme, au travers de plusieurs exercices pratiques appliqués à des cas réels. A l'issue de la session, les participants seront en capacité d'utiliser les outils de l'écosystème Hadoop pour explorer des données stockées sur un entrepôt Big Data.
Objectifs de la formation
  • Appréhender le fonctionnement d'Hadoop
  • Identifier l'écosystème : quels outils pour quels usages ?
  • Manipuler les principales commandes shell d'interaction avec Hadoop
  • Emettre des requêtes SQL avec Hive et HCatalog
  • Créer des traitements de données avec Pig
Public visé
  • Analyste
  • Data scientist
  • Architecte
  • Développeur
Prérequis
Connaissances de base en programmation ou en scripting.
Modalités pédagogiques
Apports théoriques préalables présentant la plateforme Hadoop, son fonctionnement et son écosystème. Travaux pratiques pour une mise en application immédiate. Les travaux pratiques s'effectueront sur un cluster Apache Hadoop 2.x.
Profil du / des Formateur(s)
Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.

 
Modalités d'évaluation et de suivi
L'évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud sur la satisfaction des stagiaires est réalisée systématiquement en fin de session et une attestation de formation est délivrée aux participants mentionnant les objectifs de la formation, la nature, le programme et la durée de l'action de formation ainsi que la formalisation des acquis.
 
Programme
Jour 1

INTRODUCTION AU BIG DATA
Qu'est-ce que Big Data ?
Les grands enjeux métier
Paysage technologique : les architectures Big Data

INTRODUCTION À HADOOP
Historique succinct

Le cœur de la plateforme : HDFS et YARN

L'écosystème Hadoop
  • Frameworks et algorithmes
  • Bases de données
  • Traitements des données
  • Intégration

Hadoop et la sécurité des données

MANIPULER LA LIGNE DE COMMANDE HADOOP
Présentation des principales commandes
Mise en pratique "Manipulation et transfert de fichiers en ligne de commande

UNE INTERFACE UTILISATEUR POUR HADOOP : HUE
Présentation de Hue et de ses modules
Mise en pratique "Manipulation interactive de données"

INTERROGER HADOOP AVEC DU SQL : HIVE
Présentation de Hive
Mise en pratique "Manipulation de données avec SQL"
  • Créer un modèle de données
  • Importer des fichiers sources
  • Requêter les données

Jour 2

TRANSFORMER DES DONNÉES : LE LANGAGE PIG

Présentation de Pig

Mise en pratique "Transformation de données avec Pig"
  • Charger des données semi-structurées
  • Croiser avec des données Hive
  • Sauvegarder le résultat dans HDFS

ECRITURE DE TRAITEMENTS AVANCÉS
Présentation du framework Hadoop Streaming
Présentation express du langage Python et du squelette de programme pour l'exercice
Mise en pratique "Ecriture d'un programme de manipulation complexe"

COMPOSITION ET ORDONNANCEMENT DE TRAITEMENTS
Présentation d'Oozie
Mise en pratique "Création d'un pipeline de traitement de données"
Exposé (%)
60
Pratique (%)
30
Echanges (%)
10

M'inscrire à la formation

Cette session se passera en partie à distance et en partie en présentiel
Cette session se passera en partie à distance et en partie en présentiel
Cette session se passera en partie à distance et en partie en présentiel
Lieu(x) :

OCTO Academy - 34, avenue de l'Opéra 75002 PARIS France
OCTO Academy - 34, avenue de l'Opéra 75002 PARIS France
OCTO Academy - 34, avenue de l'Opéra 75002 PARIS France
Détail des horaires :
Demander un devis
Prochaines Sessions
  • 28/03/22 → 29/03/22 Mixte PARIS
  • 16/06/22 → 17/06/22 Mixte PARIS
  • 06/10/22 → 07/10/22 Mixte PARIS

Catalogue de formation propulsé par Dendreo,
logiciel spécialisé pour centres et organismes de formation

OCTO Academy respecte votre vie privée

Ce site web stocke des informations vous concernant via le dépôt de cookie afin de mesurer l’audience du site. Ces données de navigation sont anonymisées.

En cliquant sur « OK pour moi », vous manifestez votre consentement pour le dépôt de ces cookies.

Lire la politique de confidentialité

À propos des cookies

Sur ce site, nous utilisons des cookies pour mesurer notre audience, entretenir la relation avec vous et vous adresser de temps à autre du contenu qualitif ainsi que de la publicité. Vous pouvez sélectionner ici ceux que vous autorisez à rester ici.

Cookies