up

Статистика для анализа данных

  • Russian

    course language

  • 14 weeks

    course duration

  • от 1 до 2 часов в неделю

    needed to educate

  • 2 credit points

    for credit at your university

 

Курс "Сбор и анализ данных в Python" поможет овладеть навыками Data Culture.

About

Курс охватывает все основные статистические концепции. В первой половине курса слушатели знакомятся с основными понятиями из математической статистики и нарабатывают необходимый для их понимания бэкграунд из теории вероятностей. Слушатели научатся делать описательный анализ данных, визуализировать данные и исследовать линейные взаимосвязи.
Вторая часть посвящена более продвинутым темам: параметрическим и непараметрическим тестам, принципу проверки статистических гипотез, а также построению прогностических моделей на основе линейной и логистической регрессии. Кроме того, в течение курса демонстрируется представление результатов анализа данных в графическом виде: рассматриваются как самые простые и классические методы визуализации, так и более сложные.

Format

Каждая неделя курса состоит из теоретического блока и практической части. Особенность практической части заключается в том, что она реализуется сразу с использованием двух инструментов: Google Sheets и языка программирования Python. Можно научиться реализации изученных методов с применением обоих инструментов или выбрать один.

  1. Mirkin B. (2011). Core concepts in data analysis: summarization, correlation and visualization.
  2. Bittman F. (2019). Stata: A Really Short Introduction. De Gruyter Oldenbourg. 
  3. Kothari P. (2015). Data Analysis with Stata. Birmingham, UK: Packt Publishing.
  4. Gravetter F.J. Essentials of statistics for the behavioral sciences. Gravetter F.J., Wallnau L.B. 7th ed. 634 p. Belmont: Wadsworth Cengage Learning, 2008.

Requirements

Для прохождения данного курса не требуется специальная математическая подготовка, поэтому курс подойдет для слушателей любого уровня.
Необходимые инструменты:

  1. Google Sheets.
  2. MS Office (2016 или 2019 года).
  3. Anaconda (Individual Edition).

Course program

  1. Введение в статистику и работа с данными.
  2. Генеральная совокупность и выборка. Частоты. Распределения.
  3. Описательные статистики: меры центральной тенденции и разброса.
  4. Z-распределение и его свойства.
  5. Корреляция.
  6. Визуализация данных: часть 1.
  7. Повторение.
  8. Визуализация данных: часть 2.
  9. Введение в статистику выводов: постановка гипотез.
  10. Применение параметрических критериев.
  11. Непараметрические тесты.
  12. Линейная регрессия.
  13. Логистическая регрессия.
  14. Повторение.

Education results

  1. Слушатель знает основные понятия статистики и умеет ими оперировать.
  2. Слушатель умеет загружать и исследовать данные в выбранном ПО.
  3. Слушатель умеет проводить описательный анализ данных.
  4. Слушатель умеет выбирать корректный тип визуализации и визуализировать данные.
  5. Слушатель умеет определять тип распределения по визуализации и интерпретировать его.
  6. Слушатель умеет определять силу и направление корреляции по коэффициенту и визуализации. Умеет интерпретировать корреляцию в данных.
  7. Слушатель умеет построить линейный тренд в данных и интерпретировать его уравнение.
  8. Слушатель умеет поставить гипотезу, выбрать критерий значимости и корректный параметрический или непараметрический тест для проверки гипотезы. 
  9. Слушатель умеет рассчитать и интерпретировать критерий Стьюдента для разных выборок.
  10. Слушатель умеет применять к данным модель линейной регрессии и интерпретировать ее метрики и коэффициенты. Умеет проверить ограничения и допущения для построения такой модели.
  11. Слушатель умеет применять к данным модель логистической регрессии и интерпретировать ее метрики и коэффициенты. Умеет проверить ограничения и допущения для построения такой модели.

Formed competencies

  • Способность самостоятельно осуществлять постановку задачи статистического анализа и оценивания в избранной предметной области, выбор и применение статистического инструментария и программных средств (ПК-2).
  • Способность самостоятельно осваивать новые методы прикладной и математической статистики для их использования в аналитической работе (ПК-3).
  • Способность осознанно применять методы математической и дескриптивной статистики для анализа количественных данных, содержательно интерпретировать результаты (ПК-4).
  • Способен вести исследовательскую деятельность, включая анализ проблем, постановку целей и задач, выделение объекта и предмета исследования, выбор способа и методов исследования, а также оценку его качества (УК-6).

Education directions

01.03.00 Математика. Компьютерные науки
01.03.01 Математика
01.03.02 Прикладная математика и информатика
01.03.04 Прикладная математика
02.06.01 Компьютерные и информационные науки
03.03.02 Физика
04.03.01 Химия
05.03.02 География
06.03.01 Биология
07.03.04 Градостроительство
09.03.01 Информатика и вычислительная техника
09.03.04 Программная инженерия
10.03.01 Информационная безопасность
10.05.01 Компьютерная безопасность
11.03.02 Инфокоммуникационные технологии и системы связи
37.03.01 Психология
38.03.01 Экономика
38.03.02 Менеджмент
38.03.04 Государственное и муниципальное управление
38.03.05 Бизнес-информатика
39.03.01 Социология
40.03.01 Юриспруденция
41.03.01 Зарубежное регионоведение
41.03.04 Политология
41.03.05 Международные отношения
41.03.06 Публичная политика и социальные науки
42.03.01 Реклама и связи с общественностью
42.03.02 Журналистика
42.03.05 Медиакоммуникации
45.03.01 Филология
45.03.02 Лингвистика
45.03.03 Фундаментальная и прикладная лингвистика
46.03.01 История
47.03.01 Философия
50.03.02 Изящные искусства
50.03.03 История искусств
51.03.01 Культурология
54.03.01 Дизайн
58.03.01 Востоковедение и африканистика

Abilities

Курс позволяет освоить следующие компетенции в соответствии с Рекомендациями к дополнительным профессиональным программам ИТ-профиля, реализуемым в рамках проекта "Цифровые кафедры" университета–участника программы стратегического академического лидерства "Приоритет-2030":
Сфера: Искусственный интеллект и машинное обучение.
Компетенция: Применяет математический аппарат для решения задач по оценке и разработки моделей.
Уровень: Базовый.

Отзывы о курсе

После завершения курса мы рекомендуем вам обратить внимание на курсы (в последовательности) Сбор и анализ данных в PythonОсновы машинного обученияМатематическая статистика и А‍/‍В тестированиеПродвинутые методы машинного обучения и Статистические методы анализа данных. Также рекомендуем ознакомиться с курсами Анализ текстовых данных и Компьютерное зрение

Бурова Маргарита Борисовна

Магистр
Position: Старший преподаватель Департамента больших данных и информационного поиска Факультута компьютерных наук, академический руководитель образовательной программы "Магистр по наукам о данных" Факультета компьютерных наук, преподаватель Центра непрерывного образования Факультета компьютерных наук

Рогович Татьяна Владимировна

Магистр
Position: Методист, Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук

course completion certificate

Certificate

Стоимость доступа ко всем материалам курса, возможности пройти экзамен с прокторингом и получить сертификат составляет 3600 рублей.

Similar courses