BIG DATA

HADOOP

Les fondamentaux d’Hadoop

Cette formation est une initiation aux fondamentaux d’Hadoop. Elle donne aux participants une connaissance théorique et pratique de la plateforme, au travers de plusieurs exercices pratiques appliqués à des cas réels. A l’issue de la session, les participants seront en capacité d’utiliser les outils de l’écosystème Hadoop pour explorer des données stockées sur un entrepôt Big Data.

plus d'infos

BESTAdministrer la plateforme Hadoop 2.X Hortonworks : niveau 1

Formation Hadoop officielle Hortonworks "HDP Operations: HDP Administration 1"

Cette session prépare au rôle d’administrateur au sein d’un contexte technologique innovant et en particulier au cours d’un projet Big Data. A travers des exercices concrets, vous apprendrez à installer, configurer et maintenir un cluster Hadoop.

A la fin de cette formation, vous aurez une compréhension solide de comment Hadoop fonctionne avec le Big Data et, à travers nos mises en pratique, vous saurez déployer tout le cycle de vie pour des clusters multi-nœuds.

plus d'infos

EXCLUAdministrer la plateforme Hadoop 2.X Hortonworks : niveau avancé

Formation Hadoop officielle Hortonworks "HDP Administrator: HDP Administration 2"

Cette formation est destinée aux administrateurs de plateforme HDP qui souhaiteraient approfondir leurs connaissances. Le focus est mis sur la haute disponibilité des divers outils, la gouvernance de la donnée, les réglages avancés de la plateforme ainsi que l’automatisation de déploiement de celle-ci.

plus d'infos

EXCLUAdministrer la plateforme Hadoop 2.X Hortonworks : sécurité

Formation Hadoop officielle Hortonworks "HDP Operations: Security"

Cette formation est destinée aux administrateurs de la plateforme HDP qui souhaiteraient approfondir leurs connaissances en matière de sécurité. Le focus est mis sur les outils permettant de sécuriser la plateforme en termes d’authentification, d’autorisation et d’audit.

plus d'infos

Administrer la base de données HBase avec Hadoop 2.X Hortonworks

Formation Hadoop officielle Hortonworks "HDP Operations: Apache HBase Advanced Management"

Inspirée des publications de Google sur BigTable, HBase est un SGBD non relationnel capable de gérer d'énormes quantités de données.

Intégré à l’écosystème Hadoop, il permet de distribuer les données en utilisant le système de fichiers distribué HDFS (Hadoop Distributed File System) du framework. Son fonctionnement, qui repose donc sur le stockage distribué des données sur un cluster de machines physiques, garantit à la fois la haute disponibilité et les hautes performances des bases. Deux arguments de poids qui suffisent à comprendre le succès croissant de la solution.

A l’issue de cette formation, les participants disposeront des connaissances et compétences nécessaires à la mise en œuvre de HBase.

plus d'infos

Analyse de données pour Hadoop 2.X Hortonworks avec HBase

Formation Hadoop officielle Hortonworks "HDP Analyst: Apache HBase Essentials"

Inspirée des publications de Google sur BigTable, HBase est un SGBD non relationnel capable de gérer d'énormes quantités de données. Intégré à l’écosystème Hadoop, il permet de distribuer les données en utilisant le système de fichiers distribué HDFS (Hadoop Distributed File System) du framework. Son fonctionnement, qui repose donc sur le stockage distribué des données sur un cluster de machines physiques, garantit à la fois la haute disponibilité et les hautes performances des bases. Deux arguments de poids qui suffisent à comprendre le succès croissant de la solution. A l’issue de cette formation, les participants disposeront des connaissances et compétences nécessaires à la mise en oeuvre de HBase.

plus d'infos

BESTAnalyse de données pour Hadoop 2.X Hortonworks avec Pig, Hive et Spark

Formation Hadoop officielle Hortonworks "HDP Developer: Apache Pig and Hive"

Cette formation présente les grands outils de l’écosystème Hadoop en se focalisant plus spécifiquement sur Pig et Hive. Le principal objectif est le développement de compétences de data analyst orientées accès et traitement des données sans nécessairement avoir un fort background technique.

plus d'infos

EXCLUDévelopper des applications pour Apache Spark avec Python ou Scala

Formation Hadoop officielle Hortonworks "HDP Developer: Enterprise Apache Spark I"

Spark est né en 2009 dans le laboratoire AMPLab de l’université de Berkeley. Ce framework offre un modèle de programmation plus simple que celui du MapReduce d’Hadoop et surtout plus rapide avec des temps d’exécution jusqu’à 100 fois plus courts. Avec Spark, les développeurs peuvent écrire simplement des applications distribuées complexes qui permettent de prendre des meilleures décisions plus rapidement et des actions en temps réel, appliquées à une grande variété de cas d’utilisations, d’architecture et de secteurs d’activités.
Cette formation s’adresse aux développeurs qui souhaitent créer et déployer des applications Big Data complètes et uniques en combinant batchs, le streaming et analyses interactives sur l’ensemble des données.

plus d'infos

Développer des applications pour Hadoop 2.X Hortonworks avec Java

Formation Hadoop officielle Hortonworks "HDP Developer: Java"

Ce stage de formation présente les grands outils de l’écosystème Hadoop d’un point de vue technique et est orienté développement Java. Les objectifs principaux sont d’avoir une parfaite compréhension et pratique du framework d’exécution de calculs MapReduce ainsi que d’être capable de développer des modules d’extensions de Pig et Hive.

plus d'infos

BESTSpark avec Hadoop pour développeurs de Cloudera

Formation officielle "Cloudera Developer Training for Spark and Hadoop"

Cette formation propose de fournir aux participants les concepts clés et l’expertise nécessaire pour intégrer et enregistrer les données dans un cluster Hadoop avec les techniques et les outils récents.
Les participants utiliseront des projets tels que Spark, Hive, Flume, Sqoop et Impala afin de bénéficier de la meilleure préparation possible pour faire face aux défis quotidiens auxquels sont confrontés les développeurs Hadoop. Ils apprendront à identifier et à utiliser les outils appropriés à chaque situation. Ils découvriront comment importer des données dans leur"cluster" Apache Hadoop et le transformer avec Spark, Hive, Flume, Sqoop, Impala, et d’autres outils de l’écosystème Hadoop.

plus d'infos

Apache Spark pour développeurs de Cloudera

Formation officielle "Cloudera Developer Training for Apache Spark"

Cette formation pose les bases du développement avec Apache Spark, tout en présentant l’écosystème Hadoop dans lequel il s’intègre. Le principal objectif est la prise en main de cet outil incontournable du paysage du Big Data ainsi que l’acquisition de notions essentielles relatives à son architecture. Des éléments de Spark Streaming et Spark SQL sont aussi abordés.

plus d'infos
Télécharger en pdf