From Michel Dubois

Teaching: SAÉ Collecte automatisée de données

Former les étudiants à la collecte automatisée d'un site web via Python

Public :

Pré-requis :

Les cours de bases de données du BUT Science des Données année 1.

Compétences

Objectifs :

Les objectifs de cette SAÉ sont les suivants :

Objectifs secondaires :

Si le temps le permet, si l'UE sur le langage R est au premier semestre, voir comment intégrer du HTML5, du CSS3 et du JavaScript (jQuery et D3) dans les solutions web de RStudio.

Description

L'étudiant est mis en situation de collecte et d'intégration des données issues du web dans un entrepôt de données. La SAÉ sollicite l'ensemble des compétences du semestre pour répondre à un besoin d’analyse à des fins décisionnelles, nécessitant de concevoir et mettre en œuvre un entrepôt de données destiné à accueillir des données issues de sources disponibles en ligne. Après avoir modélisé et créé la structure de l’entrepôt, les étudiants devront savoir développer un programme visant à récupérer des données disponibles sur le net (par moissonnage de sites via des API par exemple), à les manipuler (nettoyage, pré-traitement, jointures...) pour les stocker dans l’entrepôt de données créé en amont.

Apprentissages critiques

Ressources associées

Contenus pour répondre à ces objectifs :

Présentation des Technologies Web :

Évaluation :

Ce cours a été mis en ligne en 2022-2023.

Accéder au cours en ligne : NetUBS

Se connecter "en tant qu'invité" : Aide à la connexion

Retrieved from http://michel.dubois.ubs.chez.com/index.php?n=Teaching.SAE301VCODBUT2STID
Page last modified on 05/07/2023 15:20