course language
course duration
needed to educate
for credit at your university
Курс посвящён изучению основных методов машинного обучения, используемых для факторного, кластерного и классификационного анализов. В ходе обучения, слушатели смогут освоить основные подходы и получить навыки решения практических задач поиска закономерностей в сырых данных.
Обработка и анализ больших данных представляет собой новую практическую задачу, требующую навыков работы с современным инструментарием. В настоящее время данные называют «нефтью 21 века», они накапливаются в корпоративных и государственных информационных системах, социальных сетях, веб-блогах и сайтах и потенциально являются ценным ресурсом для извлечения новых знаний, инсайтов для научных исследований, повышения эффективности и конкурентоспособности предприятий. Методы интеллектуального анализа больших данных, таким образом, представляют собой тот необходимый инструмент для высвобождения этого потенциала.
Курс «Математические и инструментальные методы машинного обучения» входит в число базовых при подготовке современных экономистов-математиков на уровне магистров. Изучение дисциплины позволит студентам получить и развивать навыки анализа и диагностики проблем экономики, современных методов их решения, а также ознакомиться с современной спецификой исследования операций в зарубежных и отечественных организациях.
Целями и задачами курса являются: формирование у будущих магистров фундаментальных общеэкономических и естественнонаучных знаний; освоение магистрантами математических и инструментальных методов машинного обучения; использование современных информационно-коммуникационных технологий в профессиональной деятельности; закрепление профессиональных навыков в области прогнозирования основных социально-экономических показателей деятельности предприятия, отрасли, региона и экономики в целом.
В курсе использованы инновационные подходы: включение в факультетскую систему «ИНФОМИФИСТ» 18 уроков (лекций) курса с тренингами и контрольными вопросами, проведения зачета в электронном формате с индивидуальной идентификацией студентов (логин, пароль) и троекратной возможностью пересдачи.
Компетенции по решению задач в анализе данных с помощью методов машинного обучения, будут получены студентами после прохождения курса «Математические и инструментальные методы машинного обучения». Изучение дисциплины позволит выработать навыки постановки и решения проблем развития организации, развить творческое мышление специалистов в области системного анализа и бизнес-моделирования, выработать умение решать управленческие проблемы в конкретной экономической ситуации.
Мотивационная фраза: «Освоение интеллектуальных методов для решения интеллектуальных задач».
Десять последовательно связанных модулей (наименования есть в программе курса), в каждом модуле 1-2 урока (лекции), контрольные вопросы с четырьмя -шестью вариантами ответов, зачетные материалы в электронной форме.
Платформа RapidMiner
Модуль 1. Задачи и методологии анализа данных (Неделя 1)
Урок 1. Введение в задачи анализа данных. Описание стандартов CRISP-DM, KDD, SEMMA. Основные понятия и методы анализа данных.
Урок 2. Среда интеллектуального анализа данных RapidMiner.
Модуль 2. Подготовка данных (Неделя 2)
Урок 3. Очистка, и обогащение данных.
Урок 4. Метод главных компонент. Матрица нагрузок и матрица счетов. График собственных значений. Критерий Кайзера. Вращение методом Варимакс. Интерпретация результатов факторного анализа.
Модуль 3. Визуализация данных (Неделя 3)
Урок 5. Визуализация данных. Понятие и основные задачи визуализации.
Урок 6. Подходы к визуализации: геометрический, древовидный.
Модуль 4. Понятие описательных статистик (Неделя 4)
Урок 7. Подходы к визуализации: геометрический, древовидный.
Понятие описательных статистик. Вычисление основных показателей положения и вариации. Построение частотных полигонов и гистограмм.
Модуль 5. Анализ связей (Неделя 4)
Урок 8. Корреляционный анализ/Понятие корреляционной связи. Коэффициент корреляции Пирсона. Ранговые коэффициенты. Коэффициенты корреляции для дихотомических и номинальных переменных.
Урок 9. Регрессионный анализ/Простая линейная регрессия. Проверка значимости уравнения линейной регрессии. Оценка качества уравнения линейной регрессии. Коэффициент детерминации. Доверительный интервал линейной регрессии.
Модуль 6. Кластеризация (Неделя 6)
Урок 10. Постановка задачи кластеризации/Понятие кластера. Обзор прикладных задач с использованием методов кластеризации. Обзор основных понятий и методов кластерного анализа.
Урок 11. Иерархические и итеративные методы кластеризации/Иерархическая агломеративная кластеризация. Дендрограммы. Дивизимные методы кластеризации. Метод МакКуина (к-средних).
Модуль 7. Мягкая и жёсткая кластеризация (Неделя 7)
Урок 12. Критерии качества кластеризации.
Модуль 8. Классификация (Неделя 8)
Урок 13. Постановка задачи классификации/Задача классификации с учителем. Понятие и свойства класса. Обзор основных методов классификации. Байесовская наивная классификация/Понятие байесовского классификатора.
Урок 14. Деревья решений в задачах классификации/Понятие деревьев решений. Примеры.
Модуль 9. Методы поиска ассоциативных правил (Неделя 9)
Урок 15. Понятие правил ассоциации. Метод Apriori. Метод FP-Growth. Примеры.
Урок 16. Понятие шаблона последовательных событий. Метод Apriori. Метод GSP.
Модуль 10. Интеллектуальный анализ текста. (Неделя 10)
Урок 17. Токенизация. Векторизация. Регулярные выражения.
Урок 18. Стемминг. Лемматизация. Удаление стоп-слов. Анализ тональности.
Информационные ресурсы – доступ к онлайн-курсам осуществляется с персональных информационных устройств.
Индекс |
Формулировка |
РО-1 |
Знать основные стандарты и методологии анализа и обработки социально-экономических данных |
РО-2 |
Знать основные методы описания и визуализации структуры социально-экономических данных |
РО-3 |
Знать основные методы сокращения размерности многомерных задач |
РО-4 | Знать основные методы поиска закономерностей в массивах социально-экономических данных |
РО-5 | Знать основные методы анализа качественных и текстовых данных |
РО-6 | Уметь описывать и визуализировать исходные социально-экономические данные |
РО-7 | Уметь проводить обработку исходных социально-экономических данных |
РО-8 | Уметь искать закономерности в исходных социально-экономических данных |
РО-9 | Уметь создавать прогнозы на основании исходных социально-экономических данных |
РО-10 | Владеть методами описания и визуализации социально-экономических данных |
РО-11 | Владеть методами анализа и обработки социально-экономических данных |
РО-12 | Владеть методами анализа качественных и текстовых данных |
РО-13 | Владеть инструментальными средствами анализа и обработки социально-экономических данных |
Знать основные стандарты и методологии анализа и обработки социально-экономических данных
Знать основные методы описания и визуализации структуры социально-экономических данных
Знать основные методы сокращения размерности многомерных задач
Знать основные методы поиска закономерностей в массивах социально-экономических данных
Знать основные методы анализа качественных и текстовых данных
Уметь описывать и визуализировать исходные социально-экономические данные
Уметь проводить обработку исходных социально-экономических данных
Уметь искать закономерности в исходных социально-экономических данных
Уметь создавать прогнозы на основании исходных социально-экономических данных
Владеть методами описания и визуализации социально-экономических данных
Владеть методами анализа и обработки социально-экономических данных
Владеть методами анализа качественных и текстовых данных
Владеть инструментальными средствами анализа и обработки социально-экономических данных
course language
course duration
needed to educate
for credit at your university
Кандидат технических наук, Доцент
Position: Доцент отделения интеллектуальных кибернетических систем офиса образовательных программ