язык курса
длительность курса
понадобится для освоения
Данный курс разработан как для студентов вузов, так и для опытных специалистов в области машинного обучения. Он познакомит вас с созданием систем обучения с подкреплением — "машин результатов", которые умеют оптимизировать окружающую среду в соответствии с запросами пользователя.
В ходе обучения вы получите фундаментальные знания о теории обучения с подкреплением, освоите ключевые алгоритмы и научитесь определять, когда и какие из них следует применять.
Базовый курс для студентов и специалистов по машинному обучению, который научит создавать системы обучения с подкреплением и применять ключевые алгоритмы в практике.
Авторы поделятся уникальным опытом внедрения методов обучения с подкреплением в продакшн.
Курс состоит из 6 недель и включает в себя видеоматериалы, практические тесты и дополнительные материалы.
Саттон Р. С., Барто Э. Дж. Обучение с подкреплением
Для успешного освоения курса слушателям потребуются знания принципов машинного обучения и Torch на базовом уровне
Тема 1. Многорукие бандиты
Тема 2. Марковские процессы принятия решений
Тема 3. Аппроксимация в RL
Тема 4. Алгоритмы для непрерывного пространства действий. Методы итерации по стратегиям
Тема 5. Алгоритмы Actor-Critic
Тема 6. Алгоритмы Model-based RL
По итогу курса вы научитесь:
Понимать принципы оптимального управления
Понимать подходы обучения с подкреплением
Использовать алгоритмы обучения с подкреплением в прикладных задачах
язык курса
длительность курса
понадобится для освоения
Должность: Руководитель направления по исследованию данных (Сбер), Приглашенный эксперт НИУ ВШЭ
Должность: Руководитель направления по исследованию данных (Сбер), Приглашенный эксперт НИУ ВШЭ