Ce cours présente les grandes problématiques posées autour du traitement de texte, et plus particulièrement pour la recherche d’information et le traitement automatique du langage. L’objectif de ce cours est donc de présenter et manipuler les principaux modèles pour analyser, synthétiser, exploiter/interroger et produire des documents.
Ce cours aborde notamment :
- Recherche d’information :
- Indexer et interroger une collection de documents –> Développer un moteur de recherche
- Evaluer un moteur de recherche
- Découvrir les avancées récentes dans le domaine sous l’angle du deep learning
- Traitement automatique du langage naturel
- Appréhender les modèles de classification et de fouille de texte (détection de sentiments, …)
- Identifier la sémantique des éléments du texte (extraction de thèmes, représentations latentes et contextuelles, …)
- Enrichir les texte grâce aux bases de connaissances
- Découvrir les avancées récentes dans le domaine sous l’angle du deep learning
Ressources (avant 2018)Ressources (2018-2019)Ressources (2019-2020)Ressources (2020-2021)Ressources (2021-2022)- Ressources (2022-2023)
- Responsable: Nicolas Thome & Benjamin Piwowarski