Apprentissage automatique orienté agent

Home,
Teaching.
Cette page est celle de l'UE MMD3E13 du
master informatique 2 pour l'année 2018/2019. Cette UE fait partie du tronc commun des parcours IAD et Apprentissage du M2. L'objectif de l'UE est l'apprentissage orienté agent: apprentissage par renforcement mono-agent et apprentissage multi-agent. Plan.
- Séance 1b:
Apprentissage par renforcement (1b) [
en francais,
in English]
(le problème,
les Processus Décisionnels de Markov).
- Séance 2:
Apprentissage par renforcement (2) [
en francais,
in English]
(la programmation dynamique, fonction de valeurs V et Q, Value Iteration),
fichiers C.
- Séance 3 bis:
Apprentissage par renforcement avec approximation des fonctions V et Q avec un réseau de neurones (3 bis)
(TD-learning bis, Q-learning bis).
Dernière mise à jour: 3 octobre 2018.