Обучение с подкреплением: базовый курс

Данный курс разработан как для студентов вузов, так и для опытных специалистов в области машинного обучения. Он познакомит вас с созданием систем обучения с подкреплением — "машин результатов", которые умеют оптимизировать окружающую среду в соответствии с запросами пользователя.

В ходе обучения вы получите фундаментальные знания о теории обучения с подкреплением, освоите ключевые алгоритмы и научитесь определять, когда и какие из них следует применять.

О курсе

Базовый курс для студентов и специалистов по машинному обучению, который научит создавать системы обучения с подкреплением и применять ключевые алгоритмы в практике.

Авторы поделятся уникальным опытом внедрения методов обучения с подкреплением в продакшн.

Преподаватели

Формат

Курс состоит из 6 недель и включает в себя видеоматериалы, практические тесты и дополнительные материалы. Доступ к курсу предоставляется бесплатно. Сертификат по курсу не выдается.

Информационные ресурсы

Саттон Р. С., Барто Э. Дж. Обучение с подкреплением

Требования

Для успешного освоения курса слушателям потребуются знания принципов машинного обучения и Torch на базовом уровне

Программа курса

Тема 1. Многорукие бандиты

Тема 2. Марковские процессы принятия решений

Тема 3. Аппроксимация в RL

Тема 4. Алгоритмы для непрерывного пространства действий. Методы итерации по стратегиям

Тема 5. Алгоритмы Actor-Critic

Тема 6. Алгоритмы Model-based RL

Результаты обучения

По итогу курса вы научитесь:

Понимать принципы оптимального управления
Понимать подходы обучения с подкреплением
Использовать алгоритмы обучения с подкреплением в прикладных задачах

Направления подготовки

Программы, в которые включён курс

Бесплатные курсы по ИИ от НИУ ВШЭ НИУ ВШЭ
Программа уже началась
с 27 апреля 2026 г.по 1 января 2030 г.