Michel Dubois : Teaching - No-SQL, Big Data, Open Data

''Former les étudiants à l'utilisation du calcul distribué au sein d'un système décisionnel. ''

Public :

Master pro 2 Data Science et Modélisation Statistique

Pré-requis :

INF 2101 (ou avoir une connaissance de la modélisation conceptuelle, logique et physique des systèmes d’information opérationnels ; avoir une connaissance sur l’utilisation des contraintes, des triggers et des transactions dans les SGBD relationnels);
INF 2204 (ou avoir une connaissance de la modélisation des entrepôts de données et de leurs architectures);
INF 2108 (ou avoir une bonne connaissance d’un langage de programmation à objets);
INF2107 (on avoir une connaissance de XML);
Une bonne connaissance de la technologie web pour l’accès aux SGBD.

Objectifs principaux :

L’objectif est de présenter d’une part les problématiques d’intégration pour le calcul sur des grappes de serveurs ainsi que la formulation de ces calculs à l'aide des langages R et Python.

Contenus pour répondre à ces objectifs :

L'Open Data
Les bases de données NoSQL (Neo4j, Cassandra, MongoDB, HBase, Redis) - modélisation - implantation - requêtage.
HADOOP (HDFS, Map-Reduce, Sqoop, Hive, Pig, Mahout).
Spark.
Cloud computing avec "Microsoft Azure pour les étudiants" ou Azure Dev Tools for Teaching.

Ce cours a été mis en ligne en 2018-2019.

Accéder au cours en ligne : NetUBS

Se connecter "en tant qu'invité" : Aide à la connexion