up

Статистика для анализа данных

15 November 2021 - 15 November 2031 г.
The course has already started
3381 days
Before the end of the enrollment
  • Russian

    course language

  • 14 weeks

    course duration

  • от 1 до 2 часов в неделю

    needed to educate

Курс «Сбор и анализ данных в Python» поможет овладеть навыками Data Culture

About

Курс охватывает все основные статистические концепции. В первой половине курса слушатели знакомятся с основными понятиями из математической статистики и нарабатывают необходимый для их понимания бэкграунд из теории вероятностей. Слушатели научатся делать описательный анализ данных, визуализировать данные и исследовать линейные взаимосвязи.

Вторая часть посвящена более продвинутым темам: параметрическим и непараметрическим тестам, принципу проверки статистических гипотез, а также построению прогностических моделей на основе линейной и логистической регрессии. Кроме того, в течение курса демонстрируется представление результатов анализа данных в графическом виде: рассматриваются как самые простые и классические методы визуализации, так и более сложные.

 

Format

Каждая неделя курса состоит из теоретического блока и практической части. Особенность практической части заключается в том, что она реализуется сразу с использованием двух инструментов: Google Sheets и языка программирования Python. Можно научиться реализации изученных методов с применением обоих инструментов или выбрать один.

Requirements

Для прохождения данного курса не требуется специальная математическая подготовка, поэтому курс подойдет для слушателей любого уровня.

  1. Google Sheets
  2. MS Office (2016 или 2019 года)
  3. Anaconda (Individual Edition)

Course program

  1. Введение в статистику и работа с данными
  2. Генеральная совокупность и выборка. Частоты. Распределения.
  3. Описательные статистики: меры центральной тенденции и разброса
  4. Z-распределение и его свойства
  5. Корреляция
  6. Визуализация данных: часть 1
  7. Повторение
  8. Визуализация данных: часть 2
  9. Введение в статистику выводов: постановка гипотез
  10. Применение параметрических критериев
  11. Непараметрические тесты
  12. Линейная регрессия
  13. Логистическая регрессия
  14. Повторение

Education results

  1. Слушатель знает основные понятия статистики и умеет ими оперировать.
  2. Слушатель умеет загружать и исследовать данные в выбранном ПО.
  1. Слушатель умеет проводить описательный анализ данных.
  2. Слушатель умеет выбирать корректный тип визуализации и визуализировать данные.
  3. Слушатель умеет определять тип распределения по визуализации и интерпретировать его.
  4. Слушатель умеет определять силу и направление корреляции по коэффициенту и визуализации. Умеет интерпретировать корреляцию в данных.
  5. Слушатель умеет построить линейный тренд в данных и интерпретировать его уравнение.
  6. Слушатель умеет поставить гипотезу, выбрать критерий значимости и корректный параметрический или непараметрический тест для проверки гипотезы. 
  7. Слушатель умеет рассчитать и интерпретировать критерий Стьюдента для разных выборок.
  8. Слушатель умеет применять к данным модель линейной регрессии и интерпретировать ее метрики и коэффициенты. Умеет проверить ограничения и допущения для построения такой модели.
  9. Слушатель умеет применять к данным модель логистической регрессии и интерпретировать ее метрики и коэффициенты. Умеет проверить ограничения и допущения для построения такой модели

Education directions

01.03.00 Математика. Компьютерные науки
02.06.01 Компьютерные и информационные науки
01.03.01 «Математика» 01.03.02 «Прикладная математика и информатика» 01.03.04 «Прикладная математика» 03.03.02 «Физика» 04.03.01 «Химия» 05.03.02 «География» 06.03.01 «Биология» 07.03.04 «Градостроительство» 09.03.01 «Информатика и вычислительная техника» 09.03.04 «Программная инженерия» 10.03.01 «Информационная безопасность» 10.05.01 «Компьютерная безопасность» 11.03.02 «Инфокоммуникационные технологии и системы связи» 37.03.01 «Психология» 38.03.01 «Экономика» 38.03.02 «Менеджмент» 38.03.04 «Государственное и муниципальное управление» 38.03.05 «Бизнес-информатика» 39.03.01 «Социология» 40.03.01 «Юриспруденция» 41.03.01 «Зарубежное регионоведение» 41.03.04 «Политология» 41.03.05 «Международные отношения» 41.03.06 «Публичная политика и социальные науки» 42.03.01 «Реклама и связи с общественностью» 42.03.02 «Журналистика» 42.03.05 «Медиакоммуникации» 45.03.01 «Филология» 45.03.02 «Лингвистика» 45.03.03 «Фундаментальная и прикладная лингвистика» 46.03.01 «История» 47.03.01 «Философия» 50.03.02 «Изящные искусства» 50.03.03 «История искусств» 51.03.01 «Культурология» 54.03.01 «Дизайн» 58.03.01 «Востоковедение и африканистика»

Abilities

Курс позволяет освоить следующие компетенции в соответствии с Рекомендациями к дополнительным профессиональным программам ИТ-профиля, реализуемым в рамках проекта «Цифровые кафедры» университета–участника программы стратегического академического лидерства «Приоритет-2030»:

Сфера: Искусственный интеллект и машинное обучение
Компетенция: Применяет математический аппарат для решения задач по оценке и разработки моделей
Уровень: Базовый

После завершения курса мы рекомендуем вам обратить внимание на курсы (в последовательности) Сбор и анализ данных в PythonОсновы машинного обученияМатематическая статистика и А‍/‍В тестированиеПродвинутые методы машинного обучения и Статистические методы анализа данных. Также рекомендуем ознакомиться с курсами Анализ текстовых данных и Компьютерное зрение

Бурова Маргарита Борисовна

Магистр
Position: Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук

Рогович Татьяна Владимировна

Магистр
Position: Методист, Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук

course completion certificate

Certificate

Предусмотрен сертификат.

Similar courses