наверх

Статистические методы анализа данных

  • Русский

    язык курса

  • 5 недель

    длительность курса

  • от 3 до 6 часов в неделю

    понадобится для освоения

  • 2 зачётных единицы

    для зачета в своем вузе

 

В курсе "Статистические методы анализа данных" подробно обсудим, как статистика связана с машинным обучением и какое место она занимает среди наук о данных.

Курс является частью специализации "Машинное обучение: от статистики до нейросетей", состоящей из семи курсов: "Математическая статистика и А‍/‍В тестирование", "Основы машинного обучения (вводный курс)", "Сбор и анализ данных в Python", "Статистические методы анализа данных", "Продвинутые методы машинного обучения", "Основы глубинного обучения" и "Продвинутые методы глубинного обучения".

О курсе

Есть два великих вопроса: «Как устроен мир?» и «Что будет дальше?». В зависимости от того, на какой вопрос мы ищем ответ, мы должны использовать разные методы.

Мы изучим метод максимального правдоподобия, поговорим про статистические свойства различных функций потерь. Поговорим о линейной регрессии и временных рядах. В конце курса мы обсудим байесовский подход к статистике и выясним, чем он отличается от частотного.

 

Формат

Курс длится 6 недель. Каждая неделя содержит видеолекции, тестовые задания и материалы для самостоятельного изучения.

 

  • Чураков Е. П. - Введение в многомерные статистические методы - Издательство "Лань" - 2021 - ISBN: 978-5-8114-2149-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/168986

Требования

Слушатель должен уметь применять знания по математическому анализу и линейной алгебре к решению конкретных задач; владеть навыками решения задач теории вероятности и математической статистики.

Программа курса

1. Метод максимального правдоподобия
Мы обсудим главную рабочую лошадку науки о данных – метод максимального правдоподобия.
2. Статистический взгляд на линейные модели: прогнозы и интерпретация
Мы посмотрим на линейную регрессию с точки зрения статистики. Узнаем, что почти любая функция потерь может быть получена из метода максимального правдоподобия. 
3. Временные ряды - начало
Начнём знакомиться с моделями, которые используются для временных рядов. Мы поговорим про временной ряд как структуру данных. Мы обсудим ETS и начнём говорить про SARIMA.
4. Временные ряды - продолжение
На этой неделе мы закончим строительство SARIMA. После мы обсудим то, как ещё можно подойти к моделированию временных рядов, а также поговорим про ряд других задач, отличающихся от прогнозирования.
5. Байесовские методы
На этой неделе мы немного поговорим про байесовские методы. Мы изучим концепцию байесовского подхода и простейшие модели в python.

Результаты обучения

  • Работать с временными рядами и простейшими байесовскими моделями.
  • Использовать метод максимального правдоподобия для оценки параметров в любых моделях.

Формируемые компетенции

  • Способен работать с информацией из различных источников (ОК-16).
  • Использовать основные методы естественнонаучных дисциплин в профессиональной деятельности для теоретического и экспериментального исследования (ПК-19).
  • Использовать соответствующий математический аппарат и инструментальные средства для обработки, анализа и систематизации информации по теме исследования (ПК-20).

Направления подготовки

Знания

  • Знание, когда и как можно использовать линейные модели для предсказаний на новых данных.
  • Знание альтернативных способов и подходов к статистическому моделированию: байесовские методы, алгоритм случайного леса и т.п.

Умения

  • Применять нейробайесовские методы.
  • Анализировать временные ряды.

Навыки

  • Применять линейные модели финансовых серий, проводить диагностику серий на корректность применения моделей.

Отзывы о курсе

Ульянкин Филипп Валерьевич


Должность: Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук

сертификат об окончании курса

Сертификат

Стоимость доступа ко всем материалам курса, возможности пройти экзамен с прокторингом и получить сертификат составляет 3600 рублей.

Стоимость прохождения процедур оценки результатов обучения с идентификацией личности - 3600 Р.

Программы, в которые включен курс

Новая программа

Похожие курсы