BEST

Administrer la plateforme Hadoop 2.X Hortonworks : fondamentaux

Formation officielle Hortonworks "ADM 221 - HDP Operations: Administration Foundations"

Description

Cette session prépare au rôle d’administrateur au sein d’un contexte technologique innovant et en particulier au cours d’un projet Big Data. A travers des exercices concrets, vous apprendrez à concevoir, installer, configurer et maintenir un cluster Hadoop.

A l'issue de cette formation, vous aurez grâce aux mises en pratique une solide compréhension d'Apache Ambari et vous appréhenderez son utilisation comme outil de gestion de la plateforme Hortonworks.

Hortonworks

Objectifs pédagogiques

  • Dimensionner un cluster Hadoop
  • Installer un cluster Hadoop
  • Configurer un cluster Hadoop
  • Sécuriser un cluster Hadoop
  • Maintenir un cluster Hadoop

Public cible

  • Architecte
  • Administrateur

Pré-requis

  • Connaissances de l’environnement Linux.
  • Capacité à lire et exécuter des scripts shell Linux simples.
  • Il est recommandé d’avoir des connaissances de base autour des requêtes SQL et de l’expérience sur les sujets opérationnels tels que la gestion des incidents et la gestion des versions.

Méthode pédagogique

Formation avec apports théoriques, échanges sur les contextes des participants et retours d’expérience pratique du formateur, complétés de travaux pratiques et de mises en situation.
Cette formation prépare à la certification éditeur Hortonworks.

PROFILS DES INTERVENANTS

Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.

MODALITÉS D'ÉVALUATION ET FORMALISATION À L'ISSUE DE LA FORMATION

L'évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud sur la satisfaction des stagiaires est réalisée systématiquement en fin de session et une attestation de formation est délivrée aux participants mentionnant les objectifs de la formation, la nature, le programme et la durée de l'action de formation ainsi que la formalisation des acquis.

Programme :

Jour 1:

  • Big Data, Hadoop et la plateforme Hortonworks : les bases du Big Data
    • Les produits de la HDP
    • Qu’est-ce que Hadoop ?
    • Introduction à Ambari
  • Installer la HDP
    • Identifier les options de déploiement de cluster
    • Planifier un déploiement de cluster
    • Faire une installation avec Ambari
    • Mise en pratique : « Installer la HDP »
  • Gestion des utilisateurs avec Ambari
    • Gérer les utilisateurs et les groupes
    • Gérer les permissions
    • Mise en pratique : « Gestion des utilisateurs avec Ambari »
  • Gestion des services Hadoop via Ambari
    • Configuration des services
    • Surveillance des services
    • Maintenance des services
    • Mise en pratique : « Gestion des services Hadoop »
  • Utiliser le stockage HDFS
    • Accéder aux données
    • Gestion des fichiers
    • Mise en pratique : « Utiliser le stockage HDFS »
    • Les web services d’HDFS
    • Mise en pratique : « Utiliser WebHDFS »
    • Protéger les accès
    • Mise en pratique : « Utiliser les ACLs HDFS »

Jour 2 :

  • Gestion du stockage HDFS
    • Architecture HDFS
    • Gestion d’HDFS à travers l’interface Ambari Web
    • Gestion d’HDFS en ligne de commande
    • Mise en pratique : « Gestion du stockage sur HDFS »
    • Les quotas HDFS
    • Mise en pratique : « Gestion des quotas sur HDFS »
  • Gestion des racks sur Hadoop
    • Les bénéfices de la « rack awareness »
    • Configurer la « rack awareness »
    • Mise en pratique : « Configurer la rack awareness »
  • Protéger ses données
    • De l’importance des backups
    • Les snapshots HDFS
    • Utiliser DistCP
    • Mise en pratique : « Gestion des snapshots HDFS »
    • Mise en pratique : « Utiliser DistCP »
  • Configurer le stockage hétérogène HDFS
    • Les principes du stockage hétérogène
    • Mise en pratique “Configuration des règles de stockage HDFS”
  • Configurer le cache centralisé HDFS
    • De l’utilité d’un cache HDFS centralisé
    • Définir et gérer des groupes et instructions de cache
    • Mise en pratique « Configuration du cache centralisé HDFS »
  • Gateway NFS sur HDFS
    • Les cas d’utilisations d’une gateway NFS sur HDFS
    • Architecture et opération de la gateway NFS
    • Installer et configurer la gateway NFS
    • Mise en pratique « configurer une gateway NFS sur HDFS »

Jour 3 :

  • Gestion des ressources avec YARN
    • Architecture et Opération de YARN
    • Les différentes façons de gérer YARN
    • La gestion YARN des échecs de composants
    • Mise en pratique : « Configurer et gérer YARN »
    • Mise en pratique : « Gestion de YARN sans Ambari »
  • Découverte des applications YARN
    • Les bases d’une application YARN
    • Mise en pratique : « Démarrer une application YARN »
  • Le capacity scheduler de YARN
    • Contrôler la répartition des ressources grâce aux queues YARN
    • Configuration et gestion des queues YARN
    • Contrôler les accès sur les queues YARN
    • Mise en pratique : « Configurer le capacity scheduler »
    • Mise en pratique : « Gérer les ressources et queues YARN »
    • Mise en pratique : « Gérer les autorisations et les limites utilisateurs pour YARN »
  • Les labels sur les nœuds YARN
    • Principes de base et application
    • Activer et configurer les labels
    • Gestion des labels (ajout, suppression et modification)
    • Configurer les queues pour accéder aux ressources des labels
    • Tester les labels pour valider leur comportement
    • Mise en pratique : « Configurer les labels de nœuds YARN »

Jour 4 :

  • Activer la haute disponibilité avec HDFS et YARN
    • Les principes de la haute disponibilité
    • Haute disponibilité du Namenode
    • Haute disponibilité du Resource manager
    • Mise en pratique : « Configurer la haute disponibilité du namenode »
    • Mise en pratique : « Configurer la haute disponibilité du resource manager »
  • Gestion des nœuds dans un cluster
    • Ajouter, enlever un nœud du cluster
    • Déplacer des composants
    • Mise en pratique : « Ajouter, décommissionner et recommissionner un nœud »
  • Surveillance de cluster
    • Surveillance avec Ambari
    • Lever des alertes avec Ambari
    • Mise en pratique : « Configurer les alertes avec Ambari »
  • Les blueprints Ambari
    • Déploiement de cluster à la volée grâce aux blueprints
    • Mise en pratique : "Déploiement de cluster avec les blueprints Ambari"
  • Montée de version HDP
    • Comprendre la stack HDP et sa version
    • Les types et méthodes de montée de version avec HDP
    • Le processus de montée de version, restrictions et prérequis
    • Mise en pratique : "Faire une montée de version HDP"

Pour aller plus loin :

Type : Stage pratique en présentiel
Code formation : HWADM
Durée : 4 jours (28 heures)
Certification : 300 € HT

Sessions inter-entreprises :

3 - 6 déc. 2018
Complète
Paris
Français
4 à 15 participants
2 600 eur
Note importante : A la demande de l'éditeur, le passage de certification sera suspendu entre le 1er octobre et le 31 décembre 2018. Pour tout renseignement, vous pouvez nous contacter par mail : academy@octo.com.
Tarif & dates intra-entreprise :
Devis sur demande
Nous Contacter