up

Статистика для анализа данных

15 November 2021 - 15 November 2031 г.
The course has already started
3577 days
Before the end of the enrollment
  • Russian

    course language

  • 14 weeks

    course duration

  • от 1 до 2 часов в неделю

    needed to educate

About

Курс охватывает все основные статистические концепции. В первой половине курса слушатели знакомятся с основными понятиями из математической статистики и нарабатывают необходимый для их понимания бэкграунд из теории вероятностей. Слушатели научатся делать описательный анализ данных, визуализировать данные и исследовать линейные взаимосвязи.

Вторая часть посвящена более продвинутым темам: параметрическим и непараметрическим тестам, принципу проверки статистических гипотез, а также построению прогностических моделей на основе линейной и логистической регрессии. Кроме того, в течение курса демонстрируется представление результатов анализа данных в графическом виде: рассматриваются как самые простые и классические методы визуализации, так и более сложные.

 

Format

Каждая неделя курса состоит из теоретического блока и практической части. Особенность практической части заключается в том, что она реализуется сразу с использованием двух инструментов: Google Sheets и языка программирования Python. Можно научиться реализации изученных методов с применением обоих инструментов или выбрать один.

Requirements

Для прохождения данного курса не требуется специальная математическая подготовка, поэтому курс подойдет для слушателей любого уровня.

  1. Google Sheets
  2. MS Office (2016 или 2019 года)
  3. Anaconda (Individual Edition)

Course program

  1. Введение в статистику и работа с данными
  2. Генеральная совокупность и выборка. Частоты. Распределения.
  3. Описательные статистики: меры центральной тенденции и разброса
  4. Z-распределение и его свойства
  5. Корреляция
  6. Визуализация данных: часть 1
  7. Повторение
  8. Визуализация данных: часть 2
  9. Введение в статистику выводов: постановка гипотез
  10. Применение параметрических критериев
  11. Непараметрические тесты
  12. Линейная регрессия
  13. Логистическая регрессия
  14. Повторение

Education results

  1. Слушатель знает основные понятия статистики и умеет ими оперировать.
  2. Слушатель умеет загружать и исследовать данные в выбранном ПО.
  1. Слушатель умеет проводить описательный анализ данных.
  2. Слушатель умеет выбирать корректный тип визуализации и визуализировать данные.
  3. Слушатель умеет определять тип распределения по визуализации и интерпретировать его.
  4. Слушатель умеет определять силу и направление корреляции по коэффициенту и визуализации. Умеет интерпретировать корреляцию в данных.
  5. Слушатель умеет построить линейный тренд в данных и интерпретировать его уравнение.
  6. Слушатель умеет поставить гипотезу, выбрать критерий значимости и корректный параметрический или непараметрический тест для проверки гипотезы. 
  7. Слушатель умеет рассчитать и интерпретировать критерий Стьюдента для разных выборок.
  8. Слушатель умеет применять к данным модель линейной регрессии и интерпретировать ее метрики и коэффициенты. Умеет проверить ограничения и допущения для построения такой модели.
  9. Слушатель умеет применять к данным модель логистической регрессии и интерпретировать ее метрики и коэффициенты. Умеет проверить ограничения и допущения для построения такой модели

Education directions

01.03.01 «Математика» 01.03.02 «Прикладная математика и информатика» 01.03.04 «Прикладная математика» 03.03.02 «Физика» 04.03.01 «Химия» 05.03.02 «География» 06.03.01 «Биология» 07.03.04 «Градостроительство» 09.03.01 «Информатика и вычислительная техника» 09.03.04 «Программная инженерия» 10.03.01 «Информационная безопасность» 10.05.01 «Компьютерная безопасность» 11.03.02 «Инфокоммуникационные технологии и системы связи» 37.03.01 «Психология» 38.03.01 «Экономика» 38.03.02 «Менеджмент» 38.03.04 «Государственное и муниципальное управление» 38.03.05 «Бизнес-информатика» 39.03.01 «Социология» 40.03.01 «Юриспруденция» 41.03.01 «Зарубежное регионоведение» 41.03.04 «Политология» 41.03.05 «Международные отношения» 41.03.06 «Публичная политика и социальные науки» 42.03.01 «Реклама и связи с общественностью» 42.03.02 «Журналистика» 42.03.05 «Медиакоммуникации» 45.03.01 «Филология» 45.03.02 «Лингвистика» 45.03.03 «Фундаментальная и прикладная лингвистика» 46.03.01 «История» 47.03.01 «Философия» 50.03.02 «Изящные искусства» 50.03.03 «История искусств» 51.03.01 «Культурология» 54.03.01 «Дизайн» 58.03.01 «Востоковедение и африканистика»

 

 

Бурова Маргарита Борисовна

Магистр
Position: Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук

Рогович Татьяна Владимировна

Магистр
Position: Методист, Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук

course completion certificate

Certificate

A participant certificate is usually issued upon reaching 60 % of the overall rating, subject to the delivery of works before a hard deadline. The honors certificate is usually issued upon reaching 90 % of the overall rating, subject to the delivery of the work before the soft deadline.