Cours
- Business Intelligence
- Cours 1 – LA « BI : (bi_cours1_2015_2016)
- Cours 2 – ETL : (bi_etl)
- Cours 3 – Datawarehouse : (bi_dataw)
- Cours 4 – OLAP : (bi_olap)
- Cours 5 – Intervention industrielle : la qualité des données
- Data Mining
Travaux Pratiques
Semaine 1 – Découverte de Pentaho
Pour le TP:
- Installer Penthao PDI (5.0.1) dans le repertoire /tmp de l’ordinateur
- Téléchargez le fichier
http://ftp.mozilla.org/pub/mozilla.org/xulrunner/nightly/2012/03/2012-03-02-03-32-11-mozilla-1.9.2/xulrunner-1.9.2.28pre.en-US.linux-x86_64.tar.bz2
- Décompressez ce fichier dans /tmp – le répertoire /tmp/xulrunner devrait être créé
- Dans le fichier spoon.sh, à la ligne « $OPT= « , rajoutez l’option
-Dorg.eclipse.swt.browser.XULRunnerPath=/tmp/xulrunner
Travail à la maison:
- Proposez 3 visualisation sur les données cancer à l’aide de données générées par Kettle
Semaine 2 – ETL
Objectifs: Maitrise De Keetle, et cosntruction d’un datawarehouse
On veut répondre aux requêtes:
- Donner le nombre de place restantes/occupées à une station velib donnée (nom)
- Donner le nombre de place restantes/occupées dans une rue donnée (nom)
- Donner le nombre de place restantes/occupées dans un arrondissement donné
- Donner le nombre de place restantes/occupées il y a une heure dans paris
Pour cela, vous vous baserez sur les données disponibles ici:
- http://opendata.paris.fr/explore/dataset/stations-velib-disponibilites-en-temps-reel/
- http://opendata.paris.fr/explore/dataset/adresse_paris/
Proposez une visualisation a l’aide de l’API Google
On veut répondre aux requêtes suivantes:
- Argent dépensé en 2014 dans les horodateurs
- Argent dépensé en juin et juillet 2014 dans les horodateurs
- Argent dépensé par type de stationnement
- Argent dépensé par arrondissement
Fichiers:
- http://opendata.paris.fr/explore/dataset/adresse_paris/
- http://opendata.paris.fr/explore/dataset/horodateurs-transactions-de-paiement/
Suite:
* Insérer les données générées dans la base SQL
*Proposez une visualisation a l’aide de l’API Google
* Insérer les données générées dans la base SQL sous forme de schéma en étoile
Semaine 3 – Datawarehouse (en MySQL)
Importez les données issues de data_weed dans Kettle (http://www-connex.lip6.fr/~denoyer/wordpress/wp-content/uploads/2016/01/tp2.zip), créez un datawarehouse, et exporter le datawarehouse dans la base SQL
Semaine 4 – OLAP
* Utilisation d’un cube OLAP existant
- Dezipper le fichier biserver-6.0 de /users/Enseignants/denoyer/AS dans le repertoire /tmp
* Création d’un cube OLAP avec Pentho BI Server
Exercice 3: Créons un cube OLAP
- Démarrez BIServer en local comme vu dans le TP précédent
- Téléchargez l’application de design de cube
- Téléchargez le driver MySQL et copiez le dans le répertoire « drivers » du logiciel : Driver
- Créez une cube sur les données BugReport importées la semaine dernière
Semaine 5 – Projet BI
Semaine 7 – Prise en main de RapidMiner
- Téléchargez RapidMiner (dans /tmp)
- TP bi_rm_1
Semaine 8 – Rapidminer
Semaine 9 – Rapidminer