Pas de partiel pour FDMS
Important: Les travaux à rendre le seront avant le dimanche soir précédent le cours suivant, par email (olivier[.]schwander[@]lip6.[.]fr), avec le sujet «[FDMS]: Nom étudiant, Semaine XX»
Semaine 1
Cours
- Chaîne de traitement des données
- Sélection de modèles
TME
Le travail personnel cette semaine s’organise sur deux aspects:
-
Apprendre Python : Il est essentiel que vous ayez une connaissance du langage python et des librairies de traitement de données récentes et largement utilisées: numpy, pandas, sklearn principalement. Pour cela, je vous propose de suivre le tutorial suivant: https://github.com/savarin/pyconuk-introtutorial
Travail à rendre: Aucun, si vous le faites pas, vous aurez de grosses difficultés dès le prochain TP
-
Les bases de la data science et du machine learning : Afin de vous familiariser avec les notions sous-jacentes à la data science, je vous propose le travail suivant:
-
Lecture de l’article Statistical Modeling: The Two Cultures de L. Breiman. Cet article donne les clefs pour comprendre les deux types d’approche classiques centrées données: la "data modelling culture" qui correspond aux approches ‘modélisation’ historiques (et sur lesquelles sont par exemple basés les modèles de type météo), et l’approche ici appelée "*Algorithmic Modeling Culture"* qui correspond grosso modo à l’approche machine learning et qui tend à prendre une place de plus importante dans le traitement de données.
Travail à rendre: Vous ferez un résumé (1 à 2 pages) des principes, différences, avantages et inconvénients des deux types d’approches. Vous donnerez des exemples d’applications pour lesquelles vous pensez que l’une ou l’autre des approches et la plus appropriée.
-
Lecture de l’article Model Selection in Data Analysis Competitions qui donne des "recettes de cuisine" classiques utilisées dans le cadre des compétitions de data science.
Travail à rendre: Vous résumerez les 5 points principaux (3.1 à 3.5) en une ou deux phrases
-
Semaine 2
Cours
- Sélection de caractéristiques
- Extraction de caractéristiques
TME
- TP sélection de modèles pdf.
Travail à rendre: sources Python et commentaires.
- Lecture des articles:
Travail à rendre: 1 à 2 pages de résumé de l’un des articles, contenant une conclusion quant au lien entre l’article et le problème de la sélection de modèles.
Semaine 3
Cours
- Combinaison de modèles
- Méthodes d’ensemble
TME
- TP régression L1 pdf.
Travail à rendre: sources Python et commentaires.
Semaine 4
Cours
- Visualisation
- Réduction de dimension
TME
- TP bagging et boosting pdf.
Travail à rendre: sources Python et commentaires.
Semaine 5
Cours
- Systèmes de recommandation
- Filtrage collaboratif
- Factorisation de matrices
TME
- TP visualisation et recommandation pdf.
Travail à rendre: sources Python et commentaires.