Ressources FDMS 2017-2018

Pas de partiel pour FDMS

Important: Les travaux à rendre le seront avant le dimanche soir précédent le cours suivant, par email (olivier[.]schwander[@]lip6.[.]fr), avec le sujet «[FDMS]: Nom étudiant, Semaine XX»

Semaine 1

Cours

pdf

  • Chaîne de traitement des données
  • Sélection de modèles

TME

Le travail personnel cette semaine s’organise sur deux aspects:

  • Apprendre Python : Il est essentiel que vous ayez une connaissance du langage python et des librairies de traitement de données récentes et largement utilisées: numpy, pandas, sklearn principalement. Pour cela, je vous propose de suivre le tutorial suivant: https://github.com/savarin/pyconuk-introtutorial

    Travail à rendre: Aucun, si vous le faites pas, vous aurez de grosses difficultés dès le prochain TP

  • Les bases de la data science et du machine learning : Afin de vous familiariser avec les notions sous-jacentes à la data science, je vous propose le travail suivant:

    • Lecture de l’article Statistical Modeling: The Two Cultures de L. Breiman. Cet article donne les clefs pour comprendre les deux types d’approche classiques centrées données: la "data modelling culture" qui correspond aux approches ‘modélisation’ historiques (et sur lesquelles sont par exemple basés les modèles de type météo), et l’approche ici appelée "*Algorithmic Modeling Culture"* qui correspond grosso modo à l’approche machine learning et qui tend à prendre une place de plus importante dans le traitement de données.

      Travail à rendre: Vous ferez un résumé (1 à 2 pages) des principes, différences, avantages et inconvénients des deux types d’approches. Vous donnerez des exemples d’applications pour lesquelles vous pensez que l’une ou l’autre des approches et la plus appropriée.

    • Lecture de l’article Model Selection in Data Analysis Competitions qui donne des "recettes de cuisine" classiques utilisées dans le cadre des compétitions de data science.

      Travail à rendre: Vous résumerez les 5 points principaux (3.1 à 3.5) en une ou deux phrases

Semaine 2

Cours

pdf

  • Sélection de caractéristiques
  • Extraction de caractéristiques

TME

  • TP sélection de modèles pdf.

Travail à rendre: sources Python et commentaires.

Travail à rendre: 1 à 2 pages de résumé de l’un des articles, contenant une conclusion quant au lien entre l’article et le problème de la sélection de modèles.

Semaine 3

Cours

pdf

  • Combinaison de modèles
  • Méthodes d’ensemble

TME

  • TP régression L1 pdf.

Travail à rendre: sources Python et commentaires.

Semaine 4

Cours

pdf

  • Visualisation
  • Réduction de dimension

TME

  • TP bagging et boosting pdf.

Travail à rendre: sources Python et commentaires.

Semaine 5

Cours

pdf

  • Systèmes de recommandation
  • Filtrage collaboratif
  • Factorisation de matrices

TME

  • TP visualisation et recommandation pdf.

Travail à rendre: sources Python et commentaires.