COMP 579

eCalendar

Summer Studies

Programmes, cours et politiques de l'Universit茅 Automne 2021 鈥� 脡t茅 2022

Minerva Class Scheduling Visit for course dates & times.

Derni猫res mises 脿 jour en lien avec la COVID-19 disponibles ici.
Latest information about COVID-19 available here.

COMP 579 Reinforcement Learning (4 unit茅s)

Nota : Ceci est la version 2021鈥�2022 de l'annuaire 茅lectronique. Veuillez mettre 脿 jour l'ann茅e dans la barre d'adresse de votre navigateur pour une version plus r茅cente de cette page, ou .

Offered by: Informatique (Sciences)

Vue d'ensemble

Informatique (Sci) : Bandit algorithms, finite Markov decision processes, dynamic programming, Monte-Carlo Methods, temporal-difference learning, bootstrapping, planning, approximation methods, on versus off policy learning, policy gradient methods temporal abstraction and inverse reinforcement learning.

Terms: Hiver 2022

Instructors: Precup, Doina (Winter)

Prerequisite: A university level course in machine learning such as COMP 451 or COMP 551. Background in calculus, linear algebra, probability at the level of MATH 222, MATH 223, MATH 323, respectively.

不良研究所

Summer Studies

Main navigation

COMP 579 Reinforcement Learning (4 unit茅s)

Vue d'ensemble

Related Content

Department and University Information

Summer Studies

Faculty Links