''Former les étudiants à l'utilisation du calcul distribué au sein d'un système décisionnel. ''

Public :

Master pro 2 Data Science et Modélisation Statistique

Pré-requis :

  • INF 2101 (ou avoir une connaissance de la modélisation conceptuelle, logique et physique des systèmes d’information opérationnels ; avoir une connaissance sur l’utilisation des contraintes, des triggers et des transactions dans les SGBD relationnels);
  • INF 2204 (ou avoir une connaissance de la modélisation des entrepôts de données et de leurs architectures);
  • INF 2108 (ou avoir une bonne connaissance d’un langage de programmation à objets);
  • INF2107 (on avoir une connaissance de XML);
  • Une bonne connaissance de la technologie web pour l’accès aux SGBD.

Objectifs principaux :

L’objectif est de présenter d’une part les problématiques d’intégration pour le calcul sur des grappes de serveurs ainsi que la formulation de ces calculs à l'aide des langages R et Python.

Contenus pour répondre à ces objectifs :

  • L'Open Data
  • Les bases de données NoSQL (Neo4j, Cassandra, MongoDB, HBase, Redis) - modélisation - implantation - requêtage.
  • HADOOP (HDFS, Map-Reduce, Sqoop, Hive, Pig, Mahout).
  • Spark.
  • Cloud computing avec "Microsoft Azure pour les étudiants" ou Azure Dev Tools for Teaching.

Ce cours a été mis en ligne en 2018-2019.

Accéder au cours en ligne : NetUBS

Se connecter "en tant qu'invité" : Aide à la connexion