Etat de l'art Big Data (2 jours)

Objectifs

Cette formation propose un tour d’horizon des problématiques et des principales solutions techniques existantes aujourd’hui pour stocker, traiter et explorer vos données.

Contenu de la formation

Introduction au Big Data
  • Naissance
  • Opportunités
  • Concepts
Le stockage des données
  • Les types de données
  • Les types de stockage : NoSQL ou Data Lake
  • Les principales solutions de stockage
    • Data Lake
      • HDFS
      • Dans le cloud...
      • Les formats de stockage
    • Les bases de données NoSQL
      • Cassandra
      • HBase
  • Questions/Réponses
Le traitement des données
  • Transmission des données avec Kafka
  • Traitement des données
    • Introduction à Spark
    • Streaming et machine learning avec Spark
    • Survol d’Apache Beam
  • Questions/Réponses
Stockage et traitement : un exemple de cas d’usage
L’injection des données
  • Injection dans HDFS
  • Injection dans HBase
  • Injection dans Cassandra
  • Apache Sqoop & Apache Oozie
  • Questions/Réponses
L’exploration des données
  • Analyse de données haut niveau
    • Hadoop Hive
    • Apache Presto
    • Apache Impala
    • Apache Drill
    • Notebooks
  • Rechercher des données
    • Qu’est-ce qu’un moteur de recherches ?
    • ElasticSearch
      • Fonctionnement de l’indexation
      • Les différentes façons d’effectuer une recherche
      • Agrégation de données
  • Accès aux données et sécurité
    • Kerberos
    • Apache Ranger
    • Apache Knox
  • Questions/Réponses