Cours
- Business Intelligence
- Cours 1 – LA « BI : (bi_cours1_2015_2016)
- Cours 2 – ETL : (bi_etl)
- Cours 3 – Modélisation multidimensionnelle
- Cours 4 – OLAP / Mondrian
- Cours 5 – Qualité des données
- Data Mining
- Cours 1 – Introduction + Règles d’association
- Cours 2 – Visualisation
Projets
- Projet 1 : DW/OLAP – à rendre pour le 19 mars 2017
- Projet 2 : Data Mining – soutenance le 21 avril 2017
Travaux Pratiques
Pré-requis pour les TP Pentaho :
- Installer Penthao PDI (5.0.1) dans le repertoire /tmp de l’ordinateur
- Téléchargez le fichier
http://ftp.mozilla.org/pub/mozilla.org/xulrunner/nightly/2012/03/2012-03-02-03-32-11-mozilla-1.9.2/xulrunner-1.9.2.28pre.en-US.linux-x86_64.tar.bz2
- Décompressez ce fichier dans /tmp – le répertoire /tmp/xulrunner devrait être créé
- Dans le fichier spoon.sh, à la ligne « OPT= »$OPT $PENTAHO_DI_JAVA_OPTIONS », rajoutez l’option
-Dorg.eclipse.swt.browser.XULRunnerPath=/tmp/xulrunner
Semaine 1 – Découverte de Pentaho
- Sujet de TP : TP1
- Jeux de données : noms-prenoms.csv et titanic.csv
Semaine 2 – Pentaho suite… Modélisation et Datawarehouse
- Sujet de TD
- Sujet de TP
- Jeux de données : station-velib.csv
Lien pour réaliser une carte de Paris : https://jsfiddle.net/jo215ogw/
Si beugs pour la connexion à Mysql via Pentaho, vérifier que le driver mysql-connector-java-XXX.jar est bien dans le dossier lib/ de Pentaho PDI.
Conseils : faire à la maison le tutorial (pour révision)
Semaine 3 – Pentaho suite de suite… Modélisation et Datawarehouse
- Sujet de TD/TP
- Jeu de données : med.csv
Semaine 4 – OLAP Mondrian
- Sujet de TP
- Jeu de données : Demo_states.csv
Semaine 5 – Règles d’association
Semaine 6 – Visualisation
- Sujet de TP
- Jeu de données : voiture.xls