BEST

Administrer la plateforme Hadoop 2.X Hortonworks : niveau 1

Formation Hadoop officielle Hortonworks "HDP Operations: HDP Administration 1"

Description

Cette session prépare au rôle d’administrateur au sein d’un contexte technologique innovant et en particulier au cours d’un projet Big Data. A travers des exercices concrets, vous apprendrez à installer, configurer et maintenir un cluster Hadoop.

A la fin de cette formation, vous aurez une compréhension solide de comment Hadoop fonctionne avec le Big Data et, à travers nos mises en pratique, vous saurez déployer tout le cycle de vie pour des clusters multi-nœuds.

Hortonworks

Objectifs pédagogiques

  • Dimensionner un cluster Hadoop
  • Installer un cluster Hadoop
  • Configurer un cluster Hadoop
  • Sécuriser un cluster Hadoop
  • Maintenir un cluster Hadoop

Public cible

  • Architecte
  • Administrateur

Pré-requis

Connaissances de l’environnement Linux.

Méthode pédagogique

Formation avec apports théoriques, échanges sur les contextes des participants et retours d’expérience pratique du formateur, complétés de travaux pratiques et de mises en situation.
Cette formation prépare à la certification éditeur Hortonworks.

PROFILS DES INTERVENANTS

Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.

MODALITÉS D’ÉVALUATION

L’évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud est réalisée systématiquement en fin de session.

Programme :

Jour 1

  • Big Data, Hadoop et la plateforme Hortonworks : les bases du Big Data
    • Les produits de la HDP
    • Qu’est-ce que Hadoop ?
    • Une architecture de cluster type
    • Introduction à Ambari
  • Gestion des utilisateurs avec Ambari
    • Gérer les users et les groupes
    • Gérer les permissions
    • Mise en pratique : "Gestion des utilisateurs avec Ambari"
  • Gestion des services Hadoop via Ambari
    • Configuration des services
    • Surveillance des services
    • Maintenance des services
    • Mise en pratique : "Gestion des services Hadoop"
  • Utiliser le stockage HDFS
    • Accéder aux données
    • Gestion des fichiers
    • Mise en pratique : "Utiliser le stockage HDFS"

Jour 2

  • Utiliser le stockage HDFS (suite)
    • Les web services d’HDFS
    • Mise en pratique : "Utiliser WebHDFS"
    • Protéger les accès
    • Mise en pratique : "Utiliser les ACLs HDFS"
  • Gestion du stockage HDFS
    • Architecture HDFS
    • Assurer l’intégrité de la donnée
    • Mise en pratique : "Gestion du stockage sur HDFS"
    • Les quotas HDFS
    • Mise en pratique : "Gestion des quotas sur HDFS"
  • Gestion des ressources avec YARN
    • Architecture de YARN
    • Utilisation de YARN
    • Les différentes façons de gérer YARN
    • Mise en pratique : "Configurer et gérer YARN"
    • Mise en pratique : "Gestion de YARN sans Ambari"

Jour 3

  • Découverte des applications YARN
    • Les bases d’une application YARN
    • Mise en pratique : "Démarrer une application YARN"
  • Gestion des nœuds dans un cluster
    • Ajouter, enlever un nœud du cluster
    • Déplacer des composants
    • Mise en pratique : "Ajouter, décommissionner et recommissionner un nœud"
  • Le capacity scheduler de YARN
    • Contrôler la répartition des ressources grâce aux queues YARN
    • Contrôler les accès sur les queues YARN
    • Mise en pratique : "Configuration des utilisateurs et des groupes pour YARN"
    • Mise en pratique : "Configurer les ressources avec les queues"
    • Mise en pratique : "Tuning de la gestion des ressources"
  • Gestion des racks sur Hadoop
    • Les bénéfices de la "rack awareness"
    • Configurer la "rack awareness"
    • Mise en pratique : "Configurer la rack awareness"

Jour 4

  • Activer la haute disponibilité avec HDFS et YARN
    • Les principes de la haute disponibilité
    • Haute disponibilité du Namenode
    • Haute disponibilité du Resource manager
    • Mise en pratique : "Configurer la haute disponibilité du namenode"
    • Mise en pratique : "Configurer la haute disponibilité du resource manager"
  • Surveillance de cluster
    • Surveillance avec Ambari
    • Lever des alertes avec Ambari
    • Mise en pratique : "Configurer les alertes avec Ambari"
  • Protéger ses données
    • De l’importance des backups
    • Les snapshots HDFS
    • Utiliser DistCP
    • Mise en pratique : "Gestion des snapshots HDFS"
    • Mise en pratique : "Utiliser DistCP"
  • Installer la HDP
    • Identifier les options de déploiement de cluster
    • Planifier un déploiement de cluster
    • Faire une installation avec Ambari
    • Mise en pratique : "Installer la HDP"

Pour aller plus loin :

Type : Stage pratique
Code formation : HWADM
Durée : 4 jours (28 heures)
Certification : 280 € HT

Sessions inter-entreprises :

Tarif & dates intra-entreprise :
Devis sur demande
Nous Contacter