наверх

Статистика для анализа данных

  • Русский

    язык курса

  • 14 недель

    длительность курса

  • от 1 до 2 часов в неделю

    понадобится для освоения

  • 2 зачётных единицы

    для зачета в своем вузе

 

Курс "Сбор и анализ данных в Python" поможет овладеть навыками Data Culture.

О курсе

Курс охватывает все основные статистические концепции. В первой половине курса слушатели знакомятся с основными понятиями из математической статистики и нарабатывают необходимый для их понимания бэкграунд из теории вероятностей. Слушатели научатся делать описательный анализ данных, визуализировать данные и исследовать линейные взаимосвязи.
Вторая часть посвящена более продвинутым темам: параметрическим и непараметрическим тестам, принципу проверки статистических гипотез, а также построению прогностических моделей на основе линейной и логистической регрессии. Кроме того, в течение курса демонстрируется представление результатов анализа данных в графическом виде: рассматриваются как самые простые и классические методы визуализации, так и более сложные.

Практические навыки, получаемые в процессе освоения курса: сбор данных, работа с данными, обработка данных, описательная статистика, интерпретация данных, статистический анализ, прогнозирование, анализ временных рядов, регрессионный анализ, статистический контроль качества, тестирование гипотез, визуализация данных, базы данных, анализ, анализ данных, python, статический анализ.

Формат

Каждая неделя курса состоит из теоретического блока и практической части. Особенность практической части заключается в том, что она реализуется сразу с использованием двух инструментов: Google Sheets и языка программирования Python. Можно научиться реализации изученных методов с применением обоих инструментов или выбрать один.

  1. Mirkin B. (2011). Core concepts in data analysis: summarization, correlation and visualization.
  2. Bittman F. (2019). Stata: A Really Short Introduction. De Gruyter Oldenbourg. 
  3. Kothari P. (2015). Data Analysis with Stata. Birmingham, UK: Packt Publishing.
  4. Gravetter F.J. Essentials of statistics for the behavioral sciences. Gravetter F.J., Wallnau L.B. 7th ed. 634 p. Belmont: Wadsworth Cengage Learning, 2008.

Требования

Для прохождения данного курса не требуется специальная математическая подготовка, поэтому курс подойдет для слушателей любого уровня.
Необходимые инструменты:

  1. Google Sheets.
  2. MS Office (2016 или 2019 года).
  3. Anaconda (Individual Edition).

Программа курса

  1. Введение в статистику и работа с данными.
  2. Генеральная совокупность и выборка. Частоты. Распределения.
  3. Описательные статистики: меры центральной тенденции и разброса.
  4. Z-распределение и его свойства.
  5. Корреляция.
  6. Визуализация данных: часть 1.
  7. Повторение.
  8. Визуализация данных: часть 2.
  9. Введение в статистику выводов: постановка гипотез.
  10. Применение параметрических критериев.
  11. Непараметрические тесты.
  12. Линейная регрессия.
  13. Логистическая регрессия.
  14. Повторение.

Результаты обучения

  1. Слушатель знает основные понятия статистики и умеет ими оперировать.
  2. Слушатель умеет загружать и исследовать данные в выбранном ПО.
  3. Слушатель умеет проводить описательный анализ данных.
  4. Слушатель умеет выбирать корректный тип визуализации и визуализировать данные.
  5. Слушатель умеет определять тип распределения по визуализации и интерпретировать его.
  6. Слушатель умеет определять силу и направление корреляции по коэффициенту и визуализации. Умеет интерпретировать корреляцию в данных.
  7. Слушатель умеет построить линейный тренд в данных и интерпретировать его уравнение.
  8. Слушатель умеет поставить гипотезу, выбрать критерий значимости и корректный параметрический или непараметрический тест для проверки гипотезы. 
  9. Слушатель умеет рассчитать и интерпретировать критерий Стьюдента для разных выборок.
  10. Слушатель умеет применять к данным модель линейной регрессии и интерпретировать ее метрики и коэффициенты. Умеет проверить ограничения и допущения для построения такой модели.
  11. Слушатель умеет применять к данным модель логистической регрессии и интерпретировать ее метрики и коэффициенты. Умеет проверить ограничения и допущения для построения такой модели.

Формируемые компетенции

  • Способность самостоятельно осуществлять постановку задачи статистического анализа и оценивания в избранной предметной области, выбор и применение статистического инструментария и программных средств (ПК-2).
  • Способность самостоятельно осваивать новые методы прикладной и математической статистики для их использования в аналитической работе (ПК-3).
  • Способность осознанно применять методы математической и дескриптивной статистики для анализа количественных данных, содержательно интерпретировать результаты (ПК-4).
  • Способен вести исследовательскую деятельность, включая анализ проблем, постановку целей и задач, выделение объекта и предмета исследования, выбор способа и методов исследования, а также оценку его качества (УК-6).

Направления подготовки

01.03.00 Математика. Компьютерные науки
01.03.01 Математика
01.03.02 Прикладная математика и информатика
01.03.04 Прикладная математика
02.06.01 Компьютерные и информационные науки
03.03.02 Физика
04.03.01 Химия
05.03.02 География
06.03.01 Биология
07.03.04 Градостроительство
09.03.01 Информатика и вычислительная техника
09.03.04 Программная инженерия
10.03.01 Информационная безопасность
10.05.01 Компьютерная безопасность
11.03.02 Инфокоммуникационные технологии и системы связи
37.03.01 Психология
38.03.01 Экономика
38.03.02 Менеджмент
38.03.04 Государственное и муниципальное управление
38.03.05 Бизнес-информатика
39.03.01 Социология
40.03.01 Юриспруденция
41.03.01 Зарубежное регионоведение
41.03.04 Политология
41.03.05 Международные отношения
41.03.06 Публичная политика и социальные науки
42.03.01 Реклама и связи с общественностью
42.03.02 Журналистика
42.03.05 Медиакоммуникации
45.03.01 Филология
45.03.02 Лингвистика
45.03.03 Фундаментальная и прикладная лингвистика
46.03.01 История
47.03.01 Философия
50.03.02 Изящные искусства
50.03.03 История искусств
51.03.01 Культурология
54.03.01 Дизайн
58.03.01 Востоковедение и африканистика

Навыки

Курс позволяет освоить следующие компетенции в соответствии с Рекомендациями к дополнительным профессиональным программам ИТ-профиля, реализуемым в рамках проекта "Цифровые кафедры" университета–участника программы стратегического академического лидерства "Приоритет-2030":
Сфера: Искусственный интеллект и машинное обучение.
Компетенция: Применяет математический аппарат для решения задач по оценке и разработки моделей.
Уровень: Базовый.

Отзывы о курсе

После завершения курса мы рекомендуем вам обратить внимание на курсы (в последовательности) Сбор и анализ данных в PythonОсновы машинного обученияМатематическая статистика и А‍/‍В тестированиеПродвинутые методы машинного обучения и Статистические методы анализа данных. Также рекомендуем ознакомиться с курсами Анализ текстовых данных и Компьютерное зрение

Бурова Маргарита Борисовна

Магистр
Должность: Старший преподаватель Департамента больших данных и информационного поиска Факультута компьютерных наук, академический руководитель образовательной программы "Магистр по наукам о данных" Факультета компьютерных наук, преподаватель Центра непрерывного образования Факультета компьютерных наук

Рогович Татьяна Владимировна

Магистр
Должность: Методист, Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук

сертификат об окончании курса

Сертификат

Стоимость доступа ко всем материалам курса, возможности пройти экзамен с прокторингом и получить сертификат составляет 3600 рублей.

Стоимость прохождения процедур оценки результатов обучения с идентификацией личности - 3600 Р.

Похожие курсы