up
  • Russian

    course language

  • 10 weeks

    course duration

  • from 2 to 5 hours per week

    needed to educate

  • 4 credit points

    for credit at your university

Курс посвящён изучению основных методов машинного обучения, используемых для факторного, кластерного и классификационного анализов. В ходе обучения, слушатели смогут освоить основные подходы и получить навыки решения практических задач поиска закономерностей в сырых данных.

About

Обработка и анализ больших данных представляет собой новую практическую задачу, требующую навыков работы с современным инструментарием. В настоящее время данные называют «нефтью 21 века», они накапливаются в корпоративных и государственных информационных системах, социальных сетях, веб-блогах и сайтах и потенциально являются ценным ресурсом для извлечения новых знаний, инсайтов для научных исследований, повышения эффективности и конкурентоспособности предприятий. Методы интеллектуального анализа больших данных, таким образом, представляют собой тот необходимый инструмент для высвобождения этого потенциала.

Курс «Математические и инструментальные методы машинного обучения» входит в число базовых при подготовке современных экономистов-математиков на уровне магистров. Изучение дисциплины позволит студентам получить и развивать навыки анализа и диагностики проблем экономики, современных методов их решения, а также ознакомиться с современной спецификой исследования операций в зарубежных и отечественных организациях.

Целями и задачами курса являются: формирование у будущих магистров фундаментальных общеэкономических и естественнонаучных знаний;  освоение магистрантами   математических и инструментальных методов машинного обучения; использование  современных  информационно-коммуникационных технологий в профессиональной деятельности;            закрепление профессиональных навыков в области прогнозирования основных социально-экономических показателей деятельности предприятия, отрасли, региона и экономики в целом.

В курсе использованы инновационные подходы: включение в факультетскую систему «ИНФОМИФИСТ» 18 уроков (лекций)  курса с тренингами и контрольными вопросами, проведения зачета в электронном формате с индивидуальной идентификацией студентов (логин, пароль) и троекратной возможностью пересдачи.

Компетенции по решению задач в анализе данных с помощью методов машинного обучения,  будут получены студентами после прохождения курса «Математические и инструментальные методы машинного обучения». Изучение дисциплины позволит выработать навыки постановки и решения проблем развития организации, развить творческое мышление специалистов в области системного анализа и бизнес-моделирования, выработать умение решать управленческие проблемы в конкретной экономической ситуации.

Мотивационная фраза:  «Освоение интеллектуальных методов для решения интеллектуальных задач».

Format

Десять последовательно связанных модулей (наименования есть в программе курса), в каждом модуле 1-2 урока (лекции), контрольные вопросы с четырьмя -шестью вариантами ответов, зачетные материалы в электронной форме.

Requirements

Платформа RapidMiner

Course program

Модуль 1. Задачи и методологии анализа данных (Неделя 1)

Урок 1.  Введение в задачи анализа данных. Описание стандартов CRISP-DM, KDD, SEMMA. Основные понятия и методы анализа данных.

Урок 2.  Среда интеллектуального анализа данных RapidMiner.

Модуль 2. Подготовка данных (Неделя 2)

Урок 3.  Очистка, и обогащение данных.

Урок 4.  Метод главных компонент. Матрица нагрузок и матрица счетов. График собственных значений. Критерий Кайзера. Вращение методом Варимакс. Интерпретация результатов факторного анализа.

Модуль 3. Визуализация данных (Неделя 3)

Урок 5.  Визуализация данных. Понятие и основные задачи визуализации.

Урок 6.  Подходы к визуализации: геометрический, древовидный.

Модуль 4. Понятие описательных статистик (Неделя 4)

Урок 7.  Подходы к визуализации: геометрический, древовидный.

Понятие описательных статистик. Вычисление основных показателей положения и вариации. Построение частотных полигонов и гистограмм.

Модуль 5. Анализ связей (Неделя 4)

Урок 8.  Корреляционный анализ/Понятие корреляционной связи. Коэффициент корреляции Пирсона. Ранговые коэффициенты. Коэффициенты корреляции для дихотомических и номинальных переменных.

Урок 9.  Регрессионный анализ/Простая линейная регрессия. Проверка значимости уравнения линейной регрессии. Оценка качества уравнения линейной регрессии. Коэффициент детерминации. Доверительный интервал линейной регрессии.

Модуль 6. Кластеризация (Неделя 6)

Урок 10.  Постановка задачи кластеризации/Понятие кластера. Обзор прикладных задач с использованием методов кластеризации. Обзор основных понятий и методов кластерного анализа.

Урок 11. Иерархические  и итеративные методы кластеризации/Иерархическая агломеративная кластеризация. Дендрограммы. Дивизимные методы кластеризации. Метод МакКуина (к-средних).

Модуль 7. Мягкая и жёсткая кластеризация (Неделя 7)

Урок 12. Критерии качества кластеризации.

Модуль 8. Классификация  (Неделя 8)

Урок 13. Постановка задачи классификации/Задача классификации с учителем. Понятие и свойства класса. Обзор основных методов классификации. Байесовская наивная классификация/Понятие байесовского классификатора.

Урок 14. Деревья решений в задачах классификации/Понятие деревьев решений. Примеры.

Модуль 9. Методы поиска ассоциативных правил (Неделя 9)

Урок 15. Понятие правил ассоциации. Метод Apriori. Метод FP-Growth. Примеры.

Урок 16. Понятие шаблона последовательных событий. Метод Apriori. Метод GSP.

Модуль 10. Интеллектуальный анализ текста. (Неделя 10)

Урок 17. Токенизация. Векторизация. Регулярные выражения.

Урок 18. Стемминг. Лемматизация. Удаление стоп-слов. Анализ тональности.

Информационные ресурсы – доступ к онлайн-курсам осуществляется с персональных информационных устройств.

Education results

В результате обучения по курсу слушатель будет 

Знать:

  • Основные стандарты и методологии анализа и обработки социально-экономических данных.
  • Основные методы описания и визуализации структуры социально-экономических данных
  • Основные методы сокращения размерности многомерных задач
  • Основные методы поиска закономерностей в массивах социально-экономических данных
  • Основные методы анализа качественных и текстовых данных

Уметь:

  • Описывать и визуализировать исходные социально-экономические данные
  • Проводить обработку исходных социально-экономических данных
  • Искать закономерности в исходных социально-экономических данных
  • Создавать прогнозы на основании исходных социально-экономических данных

Владеть:

  • Методами описания и визуализации социально-экономических данных
  • Методами анализа и обработки социально-экономических данных
  • Методами анализа качественных и текстовых данных
  • Инструментальными средствами анализа и обработки социально-экономических данных

Education directions

Knowledge

Знать основные стандарты и методологии анализа и обработки социально-экономических данных

Знать основные методы описания и визуализации структуры социально-экономических данных

Знать основные методы сокращения размерности многомерных задач

Знать основные методы поиска закономерностей в массивах социально-экономических данных

Знать основные методы анализа качественных и текстовых данных

Skills

Уметь  описывать и визуализировать исходные социально-экономические данные

Уметь проводить обработку исходных социально-экономических данных

Уметь искать закономерности в исходных социально-экономических данных

Уметь создавать прогнозы на основании исходных социально-экономических данных

Abilities

Владеть методами описания и визуализации социально-экономических данных

Владеть методами анализа и обработки социально-экономических данных

Владеть методами анализа качественных и текстовых данных

Владеть инструментальными средствами анализа и обработки социально-экономических данных

Отзывы о курсе

Киреев Василий Сергеевич

Кандидат технических наук, Доцент
Position: Доцент отделения интеллектуальных кибернетических систем офиса образовательных программ

Similar courses