Analyse de données pour Hadoop 2.X Hortonworks avec HBase

Formation Hadoop officielle Hortonworks "HDP Analyst: Apache HBase Essentials"

Description

Inspirée des publications de Google sur BigTable, HBase est un SGBD non relationnel capable de gérer d'énormes quantités de données. Intégré à l’écosystème Hadoop, il permet de distribuer les données en utilisant le système de fichiers distribué HDFS (Hadoop Distributed File System) du framework. Son fonctionnement, qui repose donc sur le stockage distribué des données sur un cluster de machines physiques, garantit à la fois la haute disponibilité et les hautes performances des bases. Deux arguments de poids qui suffisent à comprendre le succès croissant de la solution. A l’issue de cette formation, les participants disposeront des connaissances et compétences nécessaires à la mise en oeuvre de HBase.

Hortonworks

Objectifs pédagogiques

  • Découvrir le fonctionnement de HBase
  • Savoir configurer et utiliser HBase
  • Modéliser une table HBase
  • Prendre en main et utiliser les différents outils à disposition

Public cible

  • Architecte
  • Administrateur
  • Développeur de logiciel
  • Analyste

Pré-requis

  • Connaissance de l’environnement Linux.
  • Connaissance des bases de données relationnelles.

Méthode pédagogique

Une pédagogie basée sur l'alternance de phases théoriques et de mises en pratique qui permet aux participants d'acquérir une première expérience concrète du stockage de données en environnement HBase. Des échanges avec l’intervenant sur les meilleures pratiques pour garantir la disponibilité des bases et leurs performances.

PROFILS DES INTERVENANTS

Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.

MODALITÉS D’ÉVALUATION

L’évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud est réalisée systématiquement en fin de session.

Programme :

Jour 1

  • GENERALITES
    • Rappels rapides sur l'écosystème Hadoop
    • Hortonworks
    • HDFS
    • Yarn
    • Mise en pratique : lancement d’une tâche MapReduce
  • INTRODUCTION A HBASE
    • Fonctionnement général
    • Mise en pratique :
      • Utilisation du client HBase
      • Importation d’une table MySQL avec Sqoop
  • ARCHITECTURE
    • Fonctionnement et cycle de vie des régions HBase
    • Orchestration du cluster avec Zookeeper
    • Mise en pratique : manipulation des nœuds ZooKeeper
  • SERVICES ET OPERATIONS
    • HMaster et RegionServer
    • Opérations : get, put, scans
    • Mise en pratique : prise en main des fichiers de configuration

Jour 2

  • COMMANDES
    • Manipulation des données
    • Manipulation des tables
    • Réparations
    • Réplication de clusters
    • Mise en pratique : utilisation des commandes
  • CONFIGURATION ET DISTRIBUTIONS
    • Configuration HBase et Zookeeper
    • Distributions HBase
    • Backups
    • Mises en pratique :
      • Backup et snapshots
      • Exports avec Pig, imports avec Importtsv
  • CONCEPTION D’UN SCHEMA HBASE
    • Modèle de données HBase
    • Designer les clés de lignes : patterns et techniques
    • Modèle de table pour une application de messagerie
    • Familles de colonnes
    • Mise en pratique :
      • Familles de colonnes
      • Etude de cas : application de suivi de colis
  • OPTIMISATION
    • Blocs, caches, filtres de bloom, memstore, logs
    • Filtres de colonnes
    • Mise en pratique : manipulation des filtres de bloom
  • DEMONSTRATION : REALISATION D’UN CLIENT JAVA HBASE

Pour aller plus loin :

Type : Stage pratique
Code formation : HWHB1
Durée : 2 jours (14 heures)
Tarif & dates intra-entreprise :
Devis sur demande
Nous Contacter