up

Сбор и анализ данных в Python

Start date will be announced later

Start date for course enrollment has not been announced yet

  • Russian

    course language

  • от 5 до 6 часов в неделю

    needed to educate

Курс «Сбор и анализ данных в Python» поможет овладеть навыками Data Culture

About

В этом онлайн-курсе НИУ ВШЭ мы познакомимся с базовыми понятиями статистики, научимся аккуратно собирать данные, обрабатывать их и визуализировать. Также мы поговорим про базовые теоремы, которые используются в математической статистике: ЗБЧ и ЦПТ.

Format

Курс состоит из 5 недель. Каждая включает в себя несколько  коротких видеолекций (суммарная продолжительность – от 60 до 100 минут), тест на знание теоретического материала (5 – 15 вопросов), а также тест, включающий в себя выполнение заданий по программированию и решение теоретических задач. 
На некоторых неделях задание по программированию заменено заданием на взаимное оценивание. В конце курса предусмотрен итоговый экзамен, состоящий из тестовых вопросов.

Github со всеми материалами курса:  https://github.com/FUlyankin/matstat-AB

Requirements

Перед изучением курса мы рекомендуем вам изучить курсы Цифровая грамотностьОсновы программирования на Python и Статистика для анализа данных.

Course program

1 - Распределения и описательные статистики

 Вспоминаем основные определения из теории вероятностей. Говорим про описательные статистики. Пробуем делать в python простые вещи, связанные с визуализацией, случайными величинами и табличками.

2 - Особенности в данных

Говорим про зависимые случайные величины, нормальное распределение и проблемы в данных.

3 - Сбор и очистка данных

4 - Разведочный анализ данных и визуализация

Анализируем данные по мемам и логи магазина. Смотрим на пайплайн знакомства с данными.

5 - Закон больших чисел и центральная предельная теорема

Говорим о том, какими бывают сходимости случайных величин, учимся решать задачи с помощью симуляций.

Education results

В онлайн-курсе мы изучим основы математической статистики и аккуратную работу с данными.  

Мы научимся собирать и обрабатывать данные с помощью Python, поговорим про их визуализацию и предварительный анализ. 

Мы также познакомимся с основными распределениями и описательными статистиками, с которыми аналитики сталкиваются на повседневной основе. И обсудим теоремы, на которых базируется вся наука о данных: закон больших чисел и центральную предельную теорему.

Abilities

 Курс позволяет освоить следующие компетенции в соответствии с Рекомендациями к дополнительным профессиональным программам ИТ-профиля, реализуемым в рамках проекта «Цифровые кафедры» университета–участника программы стратегического академического лидерства «Приоритет-2030»:

Сфера: Искусственный интеллект и машинное обучение

Компетенция: Использует программные и технические средства для визуализации больших данных

Уровень: Продвинутый

Компетенция: Осуществляет сбор и подготовку данных для обучения моделей искусственного интеллекта

Уровень: Продвинутый

Сфера: Средства программной разработки

Компетенция: Применяет языки программирования

Уровень: Базовый

Компетенция: Применяет интегрированные среды разработки (IDE)

Уровень: Базовый

После завершения курса мы рекомендуем вам обратить внимание на курсы (в последовательности) Основы машинного обученияМатематическая статистика и А‍/‍В тестированиеПродвинутые методы машинного обученияСтатистические методы анализа данных. Также рекомендуем ознакомиться с курсами Анализ текстовых данных и Компьютерное зрение