Publications de Baptiste Saintot

Data Science

L’apprentissage par renforcement démystifié

L’apprentissage par renforcement (ou “reinforcement learning”) s’est imposé ces dernières années comme une thématique incontournable de la recherche en intelligence artificielle. Tout comme d’autres méthodes d’apprentissage automatique, les techniques de renforcement utilisées ne datent pas d’hier (l’algorithme de Q-learning a été introduit en 1989), mais se sont révélées aux yeux du monde grâce à des avancées emblématiques. C’est notamment grâce à un seul et unique programme de Q-learning, combiné avec de l’apprentissage profond (“deep learning”), que les ingénieurs de DeepMind ont atteint en 2014 des…

Lire la suite