наверх

Прикладная статистика

Дату старта объявим позже

Дата начала записи на курс еще не объявлена

  • 16 недель

    длительность курса

  • от 5 до 8 часов в неделю

    понадобится для освоения

  • 4 зачётных единицы

    для зачета в своем вузе

В этом курсе мы будем смотреть на данные через призму математической статистики. Поговорим о том, какое место она занимает среди наук о данных. Научимся аккуратно переводить повседневные задачи на язык статистики и выбирать методы для проверки своих идей.

О курсе

Математическая статистика - это одна из наук, позволяющих исследовать закономерности в реальных данных.  К концу курса мы научимся формализовывать свои повседневные задачи и грамотно выбирать методы для проверки своих гипотез. Мы научимся оценивать неизвестные параметры различными методами и понимать, насколько удачными получились наши оценки. Мы узнаем как именно математическая статистика связана с машинным обучением и какое место она занимает среди наук о данных. Мы сможем реализовать на python различные процедуры для симуляций, построения точечных оценок, доверительных интервалов для них и проверки гипотез.

Формат

Курс состоит из 16 недель. Каждая включает в себя несколько  коротких видеолекций (суммарная продолжительность – от 60 до 90 минут), тест на знание теоретического материала (5 – 15 вопросов), а также тест, включающий в себя выполнение заданий по программированию и решение теоретических задач. 

На некоторых неделях задание по программированию заменено заданием на взаимное оценивание. В конце курса предусмотрен итоговый экзамен, состоящий из тестовых вопросов. 

Программа курса

  1. Сбор и очистка данных
  2. Распределения и описательные статистики
  3. Исследовательский анализ данных (Exploratory data analysis)
  4. Продолжаем манипулировать данными
  5. Симуляции, ЗБЧ и ЦПТ в картинках
  6. Схема матстата или мощь средних
  7. Свойства оценок
  8. Поиск союзников: ЦПТ, точные доверительные интервалы и критерии
  9. Непараметрические критерии, критерии согласия
  10. АБ-тесты, бутстрап
  11. Метод максимального правдоподобия
  12. Корреляция и причинность
  13. Временные ряды
  14. Ещё больше временных рядов
  15. Байесовская статистика
  16. Хьюстон, у нас проблемы (решение задач)

Ульянкин Филипп Валерьевич


Должность: Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук