наверх

Обучение с подкреплением: базовый курс

14 ноября 2024 - 30 января 2030 г.
Курс уже начался
1860 дней
До конца записи
  • Русский

    язык курса

  • 6 недель

    длительность курса

  • около 2 часов в неделю

    понадобится для освоения

Данный курс разработан как для студентов вузов, так и для опытных специалистов в области машинного обучения. Он познакомит вас с созданием систем обучения с подкреплением — "машин результатов", которые умеют оптимизировать окружающую среду в соответствии с запросами пользователя.

В ходе обучения вы получите фундаментальные знания о теории обучения с подкреплением, освоите ключевые алгоритмы и научитесь определять, когда и какие из них следует применять.

О курсе

Базовый курс для студентов и специалистов по машинному обучению, который научит создавать системы обучения с подкреплением и применять ключевые алгоритмы в практике. 

Авторы поделятся уникальным опытом внедрения методов обучения с подкреплением в продакшн.

Формат

Курс состоит из 6 недель и включает в себя видеоматериалы, практические тесты и дополнительные материалы. 

Саттон Р. С., Барто Э. Дж. Обучение с подкреплением

Требования

Для успешного освоения курса слушателям потребуются знания принципов машинного обучения и Torch на базовом уровне

Программа курса

Тема 1. Многорукие бандиты

Тема 2. Марковские процессы принятия решений

Тема 3. Аппроксимация в RL

Тема 4. Алгоритмы для непрерывного пространства действий. Методы итерации по стратегиям

Тема 5. Алгоритмы Actor-Critic

Тема 6. Алгоритмы Model-based RL

Результаты обучения

По итогу курса вы научитесь:

  • Понимать принципы оптимального управления

  • Понимать подходы обучения с подкреплением

  • Использовать алгоритмы обучения с подкреплением в прикладных задачах

Направления подготовки

Довгань Сергей Сергеевич


Должность: Руководитель направления по исследованию данных (Сбер), Приглашенный эксперт НИУ ВШЭ

Хусаенов Артём


Должность: Руководитель направления по исследованию данных (Сбер), Приглашенный эксперт НИУ ВШЭ

Похожие курсы