Former les étudiants à l'utilisation de HDFS ou à un de ses dérivés pour le nuage (S3, Azure Blob).
Public :
- BUT 3ième année Science des Données (parcours VCOD)
Compétences
- Développer
Objectifs :
L'objectif de cette ressource est d'approfondir les connaissances des étudiants sur le Big Data, en abordant par exemple les problématiques liées aux flux de donnés, aux objets connectés (IoT), aux graphes et réseaux...
Description
Prolongeant les apports de la formation autour du Big Data, cette ressource vise à donner aux étudiants les clés méthodologiques et techniques pour travailler avec la richesse des données accessibles aujourd'hui, résultant des évolutions des solutions d'acquisition ou encore des formats de stockage en lien avec le cloud.
Apprentissages critiques
- AC34.01VCOD : Prendre conscience de la nécessité d’utiliser des moyens spécifiques pour exploiter les Big Data ou les flux de données
- AC34.02VCOD : Défendre ses choix de solution par un argumentaire éclairé
SAÉs associées
- SAÉ 6.VCOD.01 : Développement et test d'un outil décisionnel
Contenus pour répondre à ces objectifs :
- Application : Flux, Réseaux, IoT, ...
- Formats des données
- Contraintes temps réel
- Solutions dédiées
- ETL avec Apache Hadoop, Apache Hive, Apache Drill, Apache Pig et Luigi
- Apache Spark GraphX et Neo4j
- Apache Spark et MongoDB
- Apache Spark et Apache Cassandra
- Le module Apache Spark Streaming et Apache Kafka pour le temps réel
Mots-clés
Flux de données, internet des objets, graphes et réseaux, temps réel
Ce cours a été mis en ligne en 2023-2024.
Accéder au cours en ligne : NetUBS
Se connecter "en tant qu'invité" : Aide à la connexion