Cours
- Slides cours Intro + Bandits
- Slides cours Plannification MDP (preuves)
- Slides cours QLearning + DQN (preuves)
- Slides cours Policy Gradients (preuves)
- Slides cours Advanced Policy Gradients (TRPO, PPO,etc.) (preuves)
- Slides cours Off-Policy Policy Gradients + Continuous Actions (preuves)
- Slides cours Curriculum RL / Meta RL / Hierarchical RL / Multi-Agents (preuves)
- Slides cours Model-based RL / Imitation Learning (preuves)
TME
Semaine 1 :
Semaine 2 :
Semaine 3 :
Semaine 4 :
Semaine 5 :
Semaine 6 et 7:
- Sujet TME PPO
- Sujet TME PPO nouvelle version (plus de détails sur les algos)