''Former les étudiants à l'utilisation du calcul distribué au sein d'un système décisionnel. ''
Public :
Master pro 2 Data Science et Modélisation Statistique
Pré-requis :
- INF 2101 (ou avoir une connaissance de la modélisation conceptuelle, logique et physique des systèmes d’information opérationnels ; avoir une connaissance sur l’utilisation des contraintes, des triggers et des transactions dans les SGBD relationnels);
- INF 2204 (ou avoir une connaissance de la modélisation des entrepôts de données et de leurs architectures);
- INF 2108 (ou avoir une bonne connaissance d’un langage de programmation à objets);
- INF2107 (on avoir une connaissance de XML);
- Une bonne connaissance de la technologie web pour l’accès aux SGBD.
Objectifs principaux :
L’objectif est de présenter d’une part les problématiques d’intégration pour le calcul sur des grappes de serveurs ainsi que la formulation de ces calculs à l'aide des langages R et Python.
Contenus pour répondre à ces objectifs :
- L'Open Data
- Les bases de données NoSQL (Neo4j, Cassandra, MongoDB, HBase, Redis) - modélisation - implantation - requêtage.
- HADOOP (HDFS, Map-Reduce, Sqoop, Hive, Pig, Mahout).
- Spark.
- Cloud computing avec "Microsoft Azure pour les étudiants" ou Azure Dev Tools for Teaching.
Ce cours a été mis en ligne en 2018-2019.
Accéder au cours en ligne : NetUBS
Se connecter "en tant qu'invité" : Aide à la connexion