Format : Stage pratique
Niveau Fondamentaux
 
 
 
 
Répartition du temps : 60% exposés
30% pratique
10% échanges

La formation en détails

Description

Cette formation est une initiation aux fondamentaux d'Hadoop. Elle donne aux participants une connaissance théorique et pratique de la plateforme, au travers de plusieurs exercices pratiques appliqués à des cas réels. A l'issue de la session, les participants seront en capacité d'utiliser les outils de l'écosystème Hadoop pour explorer des données stockées sur un entrepôt Big Data.

Objectifs

  • Appréhender le fonctionnement d'Hadoop
  • Identifier l'écosystème : quels outils pour quels usages ?
  • Manipuler les principales commandes shell d'interaction avec Hadoop
  • Emettre des requêtes SQL avec Hive et HCatalog
  • Créer des traitements de données avec Pig

Public cible

  • Analyste
  • Data scientist
  • Architecte
  • Développeur

Prérequis

Connaissances de base en programmation ou en scripting.

Modalités pédagogiques

Apports théoriques préalables présentant la plateforme Hadoop, son fonctionnement et son écosystème. Travaux pratiques pour une mise en application immédiate. Les travaux pratiques s'effectueront sur un cluster Apache Hadoop 2.x.

Profil du formateur

Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.

 

Modalités d'évaluation et de suivi

L'évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud sur la satisfaction des stagiaires est réalisée systématiquement en fin de session et une attestation de formation est délivrée aux participants mentionnant les objectifs de la formation, la nature, le programme et la durée de l'action de formation ainsi que la formalisation des acquis.
 

Programme détaillé

Jour 1

INTRODUCTION AU BIG DATA
Qu’est-ce que Big Data ?
Les grands enjeux métier
Paysage technologique : les architectures Big Data

INTRODUCTION À HADOOP
Historique succinct

Le cœur de la plateforme : HDFS et YARN

L’écosystème Hadoop
  • Frameworks et algorithmes
  • Bases de données
  • Traitements des données
  • Intégration

Hadoop et la sécurité des données

MANIPULER LA LIGNE DE COMMANDE HADOOP
Présentation des principales commandes
Mise en pratique "Manipulation et transfert de fichiers en ligne de commande

UNE INTERFACE UTILISATEUR POUR HADOOP : HUE
Présentation de Hue et de ses modules
Mise en pratique "Manipulation interactive de données"

INTERROGER HADOOP AVEC DU SQL : HIVE
Présentation de Hive
Mise en pratique "Manipulation de données avec SQL"
  • Créer un modèle de données
  • Importer des fichiers sources
  • Requêter les données

Jour 2

TRANSFORMER DES DONNÉES : LE LANGAGE PIG

Présentation de Pig

Mise en pratique "Transformation de données avec Pig"
  • Charger des données semi-structurées
  • Croiser avec des données Hive
  • Sauvegarder le résultat dans HDFS

ECRITURE DE TRAITEMENTS AVANCÉS
Présentation du framework Hadoop Streaming
Présentation express du langage Python et du squelette de programme pour l’exercice
Mise en pratique "Ecriture d’un programme de manipulation complexe"

COMPOSITION ET ORDONNANCEMENT DE TRAITEMENTS
Présentation d’Oozie
Mise en pratique "Création d’un pipeline de traitement de données"

Nos autres formations du domaine « Data Engineering » Toutes les formations du domaine

CLANA Cloudera Data Analyst
Formation officielle Cloudera Certified Associate Data Analyst
Certifiant
Durée : 28 h / 4 j
Fondamentaux
 
 
 
 
Prochaine session : 03 avril 2023
CLSPH Développer des applications avec Apache Spark
Formation officielle Cloudera Data Engineering: Developing Applications with Apache Spark
Certifiant
Durée : 28 h / 4 j
Avancé
 
 
 
 
Prochaine session : Sur demande
CLADM Administrer la plateforme CDP Private Cloud Base de Cloudera
Formation officielle Administrator Training: CDP Private Cloud Base
Certifiant
Durée : 28 h / 4 j
Fondamentaux
 
 
 
 
Prochaine session : Sur demande
ASPWD Programmer avec Apache Spark de Databricks
Formation officielle Databricks «Apache Spark™ Programming with Databricks »
Exclusivité Certifiant
Durée : 14 h / 2 j
Avancé
 
 
 
 
Prochaine session : 05 juin 2023
SQLNO NoSQL : découverte des solutions et architecture de la donnée
Appréhender les notions relatives aux systèmes distribués et les différentes solutions du marché
Durée : 14 h / 2 j
Fondamentaux
 
 
 
 
Prochaine session : 23 novembre 2023
ELK01 Gérer efficacement ses logs avec la stack ELK
S'approprier les bonnes pratiques de visualisation et supervision avec ElasticSearch, Logstach et Kibana
Durée : 14 h / 2 j
Fondamentaux
 
 
 
 
Prochaine session : 01 juin 2023

Besoin d'aide pour trouver votre formation ?

Contactez-nous

Sessions & Inscriptions

Session partagée avec d'autres organisations

Prochaine session
  • du 20 au 21/11/2023
    Présentiel, Paris
    1 680,00 € HT
Durée
14 h / 2 j

Demander un devis Nous contacter
Télécharger le programme

Organiser une session dédiée à votre organisation

Durée
14 h / 2 j

Vous avez plusieurs collaborateurs à former ?

Cette formation peut être organisée
sous la forme de sessions dédiées
aux membres de votre organisation.

Demander un devis Nous contacter Télécharger le programme

Personnaliser cette formation

Cette formation vous intéresse
et vous souhaitez l'adapter pour
vos collaborateurs ?

Nos formateurs et notre équipe pédagogique sont à
votre disposition pour en discuter
et vous proposer un programme sur-mesure.

Nous contacter Télécharger le programme

OCTO Academy respecte votre vie privée

Ce site web stocke des informations vous concernant via le dépôt de cookie afin de mesurer l’audience du site. Ces données de navigation sont anonymisées.

En cliquant sur « OK pour moi », vous manifestez votre consentement pour le dépôt de ces cookies.

Lire la politique de confidentialité

À propos des cookies

Sur ce site, nous utilisons des cookies pour mesurer notre audience, entretenir la relation avec vous et vous adresser de temps à autre du contenu qualitif ainsi que de la publicité. Vous pouvez sélectionner ici ceux que vous autorisez à rester ici.

Cookies