Formation officielle
Format : Classe à distance
Niveau Avancé
 
 
 
 
Répartition du temps : 60% exposés
30% pratique
10% échanges

La formation en détails

Description

De nombreuses organisations aujourd'hui se reposent sur Amazon Redshift pour analyser des exaoctets de données et exécuter des requêtes d'analytique, ce qui en fait l'entrepôt des données cloud le plus utilisé.

Ce module permet aux participants d'acquérir les compétences et connaissances nécessaires pour construire une solution d'analyse de données à l'aide d'Amazon Redshift, un service d'entrepôt de données Cloud.

La formation se concentre sur les composants de collecte, d'ingestion, de catalogage, de stockage et de traitement des données du pipeline analytique. Les participants apprendront à intégrer Amazon Redshift à un lac de données pour gérer les charges de travail d'analyse et d'apprentissage automatique, et également pour appliquer les meilleures pratiques de sécurité, de performance et de gestion des coûts au fonctionnement d'Amazon Redshift.

Cette formation vous intéresse ? Bénéficiez d'un tarif préférentiel avec notre offre "Amazon Web Services - Bundle Data"

Objectifs

  • Comparer les caractéristiques et les avantages des entrepôts de données, des lacs de données et des architectures de données modernes
  • Concevoir et mettre en œuvre une solution d'analyse d'entrepôt de données
  • Identifier et appliquer les techniques appropriées, notamment la compression, pour optimiser le stockage des données
  • Sélectionner et déployer les options appropriées pour ingérer, transformer et stocker les données
  • Définir les types d'instances et de nœuds, les clusters, la mise à l'échelle automatique et la topologie réseau appropriés pour un cas d'utilisation particulier
  • Examiner comment le stockage et le traitement des données affectent les mécanismes d'analyse et de visualisation nécessaires pour obtenir des informations commerciales exploitables
  • Identifier comment sécuriser les données au repos et en transit
  • Identifier et résoudre les problèmes en surveillant les charges de travail analytiques
  • Expliquer les meilleures pratiques de gestion des coûts

Public cible

Cette formation s'adresse aux ingénieurs d'entrepôts de données, aux ingénieurs de plateformes de données, ainsi qu'aux architectes et opérateurs qui construisent et gèrent des pipelines d'analyse de données.

Prérequis

Il est préférable de disposer d'une expérience d'un an dans dans la gestion de frameworks de données Open Source tels que Apache Spark ou Apache Hadoop.
Avoir suivi la formation “AWS : Notions techniques Amazon Web Services de base” (AWS00) ou Avoir suivi le cours “AWS : créer des solutions d'analyse de données par lots sur Amazon Web Service” (AWSDA).

Modalités pédagogiques

Formation avec apports théoriques, échanges sur les contextes des participants et retours d'expérience pratique des formateurs, complétés de travaux pratiques et de mises en situation.

Profil du formateur

Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.

Modalités d'évaluation et de suivi

L'évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud sur la satisfaction des stagiaires est réalisée systématiquement en fin de session et une attestation de formation est délivrée aux participants mentionnant les objectifs de la formation, la nature, le programme et la durée de l'action de formation ainsi que la formalisation des acquis.

Programme détaillé

Module A : aperçu de l'analyse des données et du pipeline de données
  • Cas d'utilisation de l'analyse de données
  • Utilisation du pipeline de données pour l'analyse

Module 1 : utilisation d'Amazon Redshift dans le pipeline d'analyse de données
  • Choisir Amazon Redshift pour l'entreposage de données
  • Présentation d'Amazon Redshift

Module 2 : introduction à Amazon Redshift
  • Architecture d'Amazon Redshift
  • Démo interactive 1 : “Visite de la console Amazon Redshift”
  • Caractéristiques d'Amazon Redshift
  • Laboratoire pratique 1 : “Charger et interroger des données dans un cluster Amazon Redshift”

Module 3 : ingestion et stockage
  • Ingestion
  • Démo interactive 2 : “Connecter votre cluster Amazon Redshift à l'aide d'un carnet Jupyter avec Data API”
  • Distribution et stockage des données
  • Démo interactive 3 : “Analyse de données semi-structurées à l'aide du type de données SUPER”
  • Interrogation de données dans Amazon Redshift
  • Laboratoire pratique 2 : “Analyser des données à l'aide d'Amazon Redshift Spectrum”

Module 4 : traitement et optimisation des données
  • Transformation des données
  • Interrogation avancée
  • Labo pratique 3 : “Transformer et interroger de données dans Amazon Redshift”
  • Gestion des ressources
  • Démo interactive 4 : “Appliquer la gestion des charges de travail mixtes sur Amazon Redshift”
  • Automatisation et optimisation
  • Démo interactive 5 : “Redimensionner le cluster Amazon Redshift du cluster dc2.large au cluster ra3.xlplus”

Module 5 : sécurité et surveillance des clusters Amazon Redshift
  • Sécurisation du cluster Amazon Redshift
  • Surveillance et dépannage des clusters Amazon Redshift

Module 6 : conception de solutions analytiques d'entrepôt de données
  • Examen des cas d'utilisation des entrepôts de données
  • Activité : “Concevoir un workflow d'analyse d'entrepôt de données”

Module B : développement d'architectures de données modernes sur AWS
  • Architectures de données modernes

Nos autres formations du domaine « Data » Toutes les formations du domaine

AWSDL AWS Data Lakes : Créer des lacs de données sur Amazon Web Services
Formation officielle Building Data Lakes on AWS
Nouveau
Durée : 7 h / 1 j
Avancé
 
 
 
 
Prochaine session : 27 mai 2024
AWSDA AWS : Créer des solutions d'analyse de données par lots sur Amazon Web Services
Formation officielle Building Batch Data Analytics Solutions on AWS
Nouveau
Durée : 7 h / 1 j
Avancé
 
 
 
 
Prochaine session : 28 mai 2024
AWSSD AWS : Créer des solutions d'analyse de Data Streaming sur AWS
Formation officielle "Building Streaming Data Analytics Solutions on AWS"
Nouveau
Durée : 7 h / 1 j
Avancé
 
 
 
 
Prochaine session : 04 juin 2024
AWS12 AWS : MLOps Engineering
Formation officielle AWS MLOps Engineering on AWS
Durée : 21 h / 3 j
Avancé
 
 
 
 
Prochaine session : Sur demande
AWSPI AWS : utiliser le pipeline de Machine Learning sur AWS
Formation officielle The Machine Learning Pipeline on AWS
Nouveau Certifiant
Durée : 28 h / 4 j
Avancé
 
 
 
 
Prochaine session : 18 mars 2024

Besoin d'aide pour trouver votre formation ?

Contactez-nous

Sessions & Inscriptions

Session partagée avec d'autres organisations

Prochaines sessions
  • le 03/06/2024
    Distanciel
    780,00 € HT
  • le 16/09/2024
    Distanciel
    780,00 € HT
Durée
7 h / 1 j

Demander un devis Nous contacter
Télécharger le programme

Organiser une session dédiée à votre organisation

Durée
7 h / 1 j

Vous avez plusieurs collaborateurs à former ?

Cette formation peut être organisée
sous la forme de sessions dédiées
aux membres de votre organisation.

Demander un devis Nous contacter Télécharger le programme

Personnaliser cette formation

Cette formation vous intéresse
et vous souhaitez l'adapter pour
vos collaborateurs ?

Nos formateurs et notre équipe pédagogique sont à
votre disposition pour en discuter
et vous proposer un programme sur-mesure.

Nous contacter Télécharger le programme

OCTO Academy respecte votre vie privée

Ce site web stocke des informations vous concernant via le dépôt de cookie afin de mesurer l’audience du site. Ces données de navigation sont anonymisées.

En cliquant sur « OK pour moi », vous manifestez votre consentement pour le dépôt de ces cookies.

Lire la politique de confidentialité

À propos des cookies

Sur ce site, nous utilisons des cookies pour mesurer notre audience, entretenir la relation avec vous et vous adresser de temps à autre du contenu qualitif ainsi que de la publicité. Vous pouvez sélectionner ici ceux que vous autorisez à rester ici.

Cookies