Datawarehousing on AWS

  • Formation officielle
  • Débutant
  • Intermédiaire
  • Avancé
  • Spécialité
  • Lieu : Paris et à distance
  • Durée : 3j
  • Horaire :
    09h30 17h30

Description

Dans cette formation Data warehousing on AWS, vous découvrirez de nouveaux concepts, stratégies et bonnes pratiques pour la conception d’une solution de stockage de données dans le cloud avec Amazon Redshift.

Mise à jour du contenu : 18/02/2022

Public visé

Architecte / Administrateurs / Développeurs base de données
Data analysts et Data scientists

Recommandations

Avoir au moins suivi la formation “AWS Technical Essentials”
Être familier avec les concepts/designs de base de données

  • Objectifs

    • Discuter des concepts du Data Warehousing
    • Distinguer le croisement entre les solutions Data warehousing et Big Data
    • Utiliser Amazon Redshift pour implémenter un Data warehouse sur AWS
    • Utiliser les autres services AWS de données et d’analyses (Amazon DynamoDB, Amazon EMR, Kinesis, S3) pour contribuer à la solution Data Warehouse
    • Evaluer l’approche et la méthodologie pour concevoir des Data warehouse
    • Identifier les sources de données et déterminer les prérequis pour l’accès à la donnée
    • Concevoir l’architecture du Data Warehouse
    • Gérer la données avec les commandes COPY, UNLOAD, VACUUM
    • Identifier les problèmes de performances, optimiser les requêtes
    • Utiliser Amazon Redshift Spectrum pour analyser de la donnée stockée dans S3
    • Surveiller et auditer votre Data warehouse en utilisant les services Amazon (Cloudwatch, cloudtrail, Redshift DB Auditing, SNS)
    • Utiliser Amazon QuickSight pour executer des analyses de données et des visualisations sur le “Data warehouse”
  • Programme

    • Jour 1
      • Introduction au “Data warehousing” sur AWS
      • Introduction à Amazon Redshift
      • Lab 1: Introduction à Amazon Redshift
      • Lancement de clusters Redshift
      • Lab 2: Lancement de clusters Redshift
    • Jour 2
      • Conception de schémas de base de données
      • Lab 3: Optimiser les schémas de base données
      •  Identifier les sources de données
      •  Lab 4: Charger des données en temps réel dans la base Redshift
      •  Chargements de données
      • Lab 5 : Charger des données avec la commande COPY
    • Jour 3
      • Ecriture des requêtes et tuning des performances

      • Lab 6: Configurer la gestion des workloads

      • Amazon Redshift Spectrum

      • Lab 7 : Utiliser Amazon Redshift Spectrum

      • Maintenance des clusters

      • Lab 8: Audit et monitoring des clusters

      • Lab 9: Back Up, restauration, et redimensionnement des clusters


Vous souhaitez vérifier votre éligibilité ou faire une demande de formation sur mesure ?

Romain Gros

Training manager

Devoteam Revolve