Formation BIG DATA Les fondamentaux
Objectifs
Identifier les concepts fondamentaux du Big Data, y compris ses caractéristiques et ses bénéfices.
Expliquer les dimensions du Big Data (volume, variété, vélocité) et les technologies populaires comme Hadoop et MongoDB.
Utiliser les outils de Data Mining pour analyser des données provenant de différentes sources.
Analyser les données de l’entreprise et des réseaux sociaux pour en extraire des informations pertinentes.
Intégrer les techniques descriptives et prédictives pour résoudre des problèmes spécifiques.
Évaluer les impacts éthiques et de vie privée liés à l’utilisation du Big Data.
Concevoir et configurer un environnement Hadoop pour le traitement des données.
Préparer et passer l’examen de certification Big Data Foundation.
Pré-requis
Participants
Programme de formation
INTRODUCTION
LES FONDAMENTAUX DU BIG DATA
Un peu d'histoire...
Définition, caractéristiques et bénéfices
Les dimensions (volume, variété, vélocité)
Les technologies les plus populaires (Hadoop, MongoDB)
Ethique et vie privée
LES SOURCES DU BIG DATA
Les données de l'entreprise (Oracle, SAP, Microsoft, Data Warehouses, données non-structurées)
Réseaux sociaux (Facebook, Twitter, autres)
Données publiques (économiques, financières, comportementales, etc.)
DATA MINING
Définition
Les techniques descriptives et prédictives (Classification, association, segmentation, etc.)
Exemples d'outils (Weka, KNIME, R)
ZOOM SUR HADOOP
Présentation de Hadoop (Les principaux composants, les extensions)
Installation et configuration
MapReduce
Data Processing avec Hadoop
ZOOM SUR MONGODB
Présentation de MongoDB
Réplication et sharding
Ecosystèmes (langages, drivers, outils, intégration avec Hadoop)
Installation et configuration
Base de données de documents
Modèle de données de documents