Formation officielle
Format : Classe à distance
Répartition du temps : 40% exposés
50% pratique
10% échanges

La formation en détails

Description

Vous souhaitez exploiter le potentiel de vos données pour créer de la valeur et développer votre activité. Avec Hadoop et son architecture flexible et évolutive, vous pouvez stocker, traiter et analyser vos données à partir d'une plateforme unique fonctionnant sur du matériel standard.

Dès sa création en 2008, Cloudera a lié son histoire à celle de l'écosystème Hadoop. Avec ses fondations composées à 100 % de logiciels open source et de standards ouverts, la plate-forme Cloudera vous assure un meilleur contrôle des coûts, plus de souplesse et des résultats plus performants pour votre organisation. CDH, la plate-forme open source de Cloudera, est ainsi devenue la distribution la plus populaire de Hadoop.

De l'installation à la configuration en passant par l'équilibrage de charge et le réglage, cette formation de quatre jours fournit aux participants une compréhension complète de toutes les étapes nécessaires pour opérer et maintenir un cluster Hadoop à l'aide de Cloudera Manager.

Objectifs

  • Reposer les bases de l'environnement Hadoop, MapReduce, Spark et HDFS
  • Gérer un cluster avec les fonctionnalités de Cloudera Manager
  • Déterminer le matériel et l'infrastructure appropriés pour son cluster
  • Configurer et déployer correctement le cluster pour l'intégration avec le système d'information
  • Charger des données dans le cluster à partir de fichiers générés dynamiquement à l'aide de Flume, ou à partir de SGBDR en utilisant Sqoop
  • Configurer FairScheduler pour répartir les ressources entre plusieurs utilisateurs d'un cluster
  • Préparer et maintenir Apache Hadoop en production en utilisant les bonnes pratiques
  • Dépanner, diagnostiquer, mettre au point et résoudre les problèmes sur Hadoop

Certification

Cette formation permet de préparer la certification CCA Administrator Certification.
L'inscription à la certification vous sera proposée de façon optionnelle au tarif de 300,00 € HT par tentative.

Public cible

  • Administrateur système
  • Responsable informatique
  • Architecte système
  • Développeur
  • Analyste de données
  • Administrateur de bases de données

Prérequis

Connaissance de base de la ligne de commande Linux

Modalités pédagogiques

Formation avec apports théoriques, échanges sur les contextes des participants et retours d'expérience pratique du formateur, complétés de travaux pratiques et de mises en situation. Cette formation permet de préparer l'examen associé au titre de la certification « Cloudera Certified Associate Administrator ».

Profil du formateur

Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.
 

Modalités d'évaluation et de suivi

L'évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud sur la satisfaction des stagiaires est réalisée systématiquement en fin de session et une attestation de formation est délivrée aux participants mentionnant les objectifs de la formation, la nature, le programme et la durée de l'action de formation ainsi que la formalisation des acquis.
 

Programme détaillé

Jour 1

INTRODUCTION

CLOUDERA ENTERPRISE DATA HUB
  • Cloudera Enterprise Data Hub
  • Introduction au CDH
  • Introduction à Cloudera Manager
  • Les responsabilités d’un administrateur Hadoop

INSTALLATION DE CLOUDERA MANAGER ET DU CDH
  • Introduction à l’installation du cluster
  • Installation de Cloudera Manager Installation
  • Installation du CDH
  • Les services du cluster CDH

CONFIGURER UN CLUSTER CLOUDERA
  • Introduction
  • Paramètres de configuration
  • Modifier la configuration des services
  • Fichiers de configuration
  • Gérer les instances de rôle
  • Ajouter des nouveaux services
  • Ajouter et supprimer des hôtes

HADOOP DISTRIBUTED FILE SYSTEM
  • Introduction
  • Topologie et rôles HDFS
  • Modifier les logs et le checkpointing
  • La performance HDFS et la tolérance à la panne
  • Introduction à la sécurité de HDFS et de Hadoop
  • Interfaces utilisateurs web pour HDFS
  • Utiliser la ligne de commande HDFS
  • Autres outils de ligne de commande

Jour 2

INGESTION DE DONNÉES SUR HDFS
  • Introduction à l’ingestion de données
  • Formats de fichiers
  • Ingérer de la donnée en utilisant File Transfer ou les interfaces REST
  • Ingérer de la donnée d’une base de donnée relationnel avec Sqoop
  • Ingérer de la donnée d’une source externe avec Flume
  • Les bonnes pratiques d’ingestion de donnée

HIVE ET IMPALA
  • Apache Hive
  • Apache Impala

YARN ET MAPREDUCE
  • Introduction à YARN
  • Exécuter des applications sur YARN
  • Explorer les applications YARN
  • Les logs d’application YARN
  • Les applications Map Reduce
  • Réglage mémoire et CPU pour YARN

APACHE SPARK
  • Introduction à Spark
  • Les applications Spark
  • Comment les applications Spark s'exécutent sur YARN
  • Monitorer les applications Spark

Jour 3

DIMENSIONNEMENT DE VOTRE CLUSTER HADOOP
  • Considérations générales relatives au dimensionnement
  • Choix du matériel
  • Considérations sur le réseau
  • Options de virtualisation
  • Options de déploiement cloud
  • Configuration des noeuds

CONFIGURATION AVANCÉ DU CLUSTER
  • Configurer les ports de service
  • Paramétrer HDFS et MapReduce
  • Activer la Haute Disponibilité HDFS

GESTION DES RESSOURCES
  • Configuration de cgroups avec des centres de services statiques
  • Le Fair Scheduler
  • Configurer la gestion dynamique des ressources
  • Planification des requêtes Impala

MAINTENANCE DU CLUSTER
  • Vérification du statut HDFS
  • Copier les données entre clusters
  • Rééquilibrage du cluster
  • Snapshots de répertoires
  • Mise à niveau du cluster

Jour 4

MONITORING DU CLUSTER
  • Fonctionnalités de monitoring de Cloudera Manager
  • Tests de santé
  • Événements et alertes
  • Graphiques et rapports
  • Recommandation de monitoring

DIAGNOSTIC DU CLUSTER
  • Introduction
  • Outils de diagnostic
  • Exemples de mauvaises configurations

INSTALLER ET GÉRER HUE
  • Introduction
  • Gérer et configurer Hue
  • Authentification et autorisation Hue

SÉCURITÉ
  • Les concepts de sécurité sur Hadoop
  • Authentification sur Hadoop en utilisant Kerberos
  • Authorisation sur Hadoop
  • Chiffrement sur Hadoop
  • Sécuriser un cluster Hadoop

CONCLUSION

Suppléments sous réserve de temps disponible

APACHE KUDU
  • Introduction à Kudu
  • Architecture
  • Installation et Configuration
  • Outils de monitoring et de gestion

APACHE KAFKA
  • Qu’est-ce que Apache Kafka ?
  • Introduction à Kafka
  • Architecture de cluster Kafka
  • Outils de ligne de commande Kafka
  • Utiliser Kafka avec Flume

STOCKAGE D’OBJETS DANS LE CLOUD
  • Système de stockage d’objet
  • Connecter Hadoop et un système de stockage objet
3.90 / 5

Satisfaction moyenne des participants

Sur la base de 4 avis, collectés en fin de formation.

Nos autres formations du domaine « Cloudera » Toutes les formations du domaine

CLANA Cloudera Data Analyst
Formation officielle Cloudera Certified Associate Data Analyst
Certifiant
Durée : 27 h / 3.75 j
Prochaine session : 07/06/2022
CLSPH Développer des applications pour Spark avec Hadoop Cloudera
Formation officielle Cloudera Developer Training for Spark and Hadoop
Meilleure vente Certifiant
Durée : 28 h / 4 j
Prochaine session : 21/03/2022
HWADM Administrer la plateforme Hadoop 2.X Hortonworks : fondamentaux
Formation officielle Hortonworks ADM 221 - HDP Operations: Administration Foundations
Certifiant
Durée : 28 h / 4 j
Prochaine session : 14/11/2022

Besoin d'aide pour trouver votre formation ?

Contactez-nous

Sessions & Inscriptions

Session partagée avec d'autres organisations

Prochaines sessions
  • du 16 au 19/05/2022
    Présentiel, Paris
    2 695,00 € HT
    Certification en option
    300,00 € HT / tentative
  • du 05 au 08/12/2022
    Présentiel, Paris
    2 695,00 € HT
    Certification en option
    300,00 € HT / tentative
Durée
28 h / 4 j

Demandez un devis Contactez-nous
Télécharger le programme

Organiser une session dédiée à votre organisation

Durée
28 h / 4 j

Vous avez plusieurs collaborateurs à former ?

Cette formation peut être organisée
sous la forme de sessions dédiées
aux membres de votre organisation.

Demandez un devis Contactez-nous Télécharger le programme

Personnaliser cette formation

Cette formation vous intéresse
et vous souhaitez l'adapter pour
vos collaborateurs ?

Nos formateurs et notre équipe pédagogique sont à
votre disposition pour en discuter
et vous proposer un programme sur-mesure.

Contactez-nous Télécharger le programme

OCTO Academy respecte votre vie privée

Ce site web stocke des informations vous concernant via le dépôt de cookie afin de mesurer l’audience du site. Ces données de navigation sont anonymisées.

En cliquant sur « OK pour moi », vous manifestez votre consentement pour le dépôt de ces cookies.

Lire la politique de confidentialité

À propos des cookies

Sur ce site, nous utilisons des cookies pour mesurer notre audience, entretenir la relation avec vous et vous adresser de temps à autre du contenu qualitif ainsi que de la publicité. Vous pouvez sélectionner ici ceux que vous autorisez à rester ici.

Cookies