BIG DATA

HADOOP HORTONWORKS

Les fondamentaux d’Hadoop

Cette formation est une initiation aux fondamentaux d’Hadoop. Elle donne aux participants une connaissance théorique et pratique de la plateforme, au travers de plusieurs exercices pratiques appliqués à des cas réels. A l’issue de la session, les participants seront en capacité d’utiliser les outils de l’écosystème Hadoop pour explorer des données stockées sur un entrepôt Big Data.

plus d'infos

BESTAdministrer la plateforme Hadoop 2.X Hortonworks : fondamentaux

Formation officielle Hortonworks "ADM 221 - HDP Operations: Administration Foundations"

Cette session prépare au rôle d’administrateur au sein d’un contexte technologique innovant et en particulier au cours d’un projet Big Data. A travers des exercices concrets, vous apprendrez à concevoir, installer, configurer et maintenir un cluster Hadoop.

A l'issue de cette formation, vous aurez grâce aux mises en pratique une solide compréhension d'Apache Ambari et vous appréhenderez son utilisation comme outil de gestion de la plateforme Hortonworks.

plus d'infos

Analyse de données pour Hadoop 2.X Hortonworks avec Pig et Hive

Formation Hadoop officielle Hortonworks "DEV - 302 HDP Developer: Apache Pig and Hive"

Cette formation présente les grands outils de l’écosystème Hadoop en se focalisant plus spécifiquement sur Pig et Hive (une demi-journée est également consacrée à Spark). Le principal objectif est le développement de compétences de data analyst orientées accès et traitement des données sans nécessairement avoir un fort background technique.

plus d'infos

BESTDévelopper des applications pour Apache Spark 2.X avec Python ou Scala

Formation officielle Hortonworks "DEV 343 – HDP Developer: Spark 2.x Developer"

Spark est un framework qui permet d’écrire simplement des applications distribuées complexes qui permettent de prendre des meilleures décisions plus rapidement et des actions en temps réel.
Cette formation s’adresse aux développeurs qui souhaitent créer et déployer des applications Big Data complètes et uniques en combinant batchs, le streaming et analyses interactives sur l’ensemble des données.

La formation couvre une introduction technique sur l’architecture et le fonctionnement de Spark 2.X, les éléments de base de Spark (e.g. RDDs et calcul distribué), ainsi que les abstractions plus haut niveau qui fournissent une interface plus simple et plus complète (e.g. Spark SQL, les Dataframes, les Datasets). Cette formation traitera également des problèmes de performances et stratégies d’optimisation ainsi que de l’utilisation de Spark streaming pour traiter les données en temps réel.

plus d'infos
Télécharger en pdf