course language
needed to educate
Курс «Сбор и анализ данных в Python» поможет овладеть навыками Data Culture.
В этом онлайн-курсе НИУ ВШЭ мы познакомимся с базовыми понятиями статистики, научимся аккуратно собирать данные, обрабатывать их и визуализировать. Также мы поговорим про базовые теоремы, которые используются в математической статистике: ЗБЧ и ЦПТ.
Курс состоит из 5 недель. Каждая включает в себя несколько коротких видеолекций (суммарная продолжительность – от 60 до 100 минут), тест на знание теоретического материала (5 – 15 вопросов), а также тест, включающий в себя выполнение заданий по программированию и решение теоретических задач.
На некоторых неделях задание по программированию заменено заданием на взаимное оценивание. В конце курса предусмотрен итоговый экзамен, состоящий из тестовых вопросов.
Github со всеми материалами курса: https://github.com/FUlyankin/matstat-AB
Перед изучением курса мы рекомендуем вам изучить курсы Цифровая грамотность, Основы программирования на Python и Статистика для анализа данных.
1 - Распределения и описательные статистики
Вспоминаем основные определения из теории вероятностей. Говорим про описательные статистики. Пробуем делать в python простые вещи, связанные с визуализацией, случайными величинами и табличками.
2 - Особенности в данных
Говорим про зависимые случайные величины, нормальное распределение и проблемы в данных.
3 - Сбор и очистка данных
4 - Разведочный анализ данных и визуализация
Анализируем данные по мемам и логи магазина. Смотрим на пайплайн знакомства с данными.
5 - Закон больших чисел и центральная предельная теорема
Говорим о том, какими бывают сходимости случайных величин, учимся решать задачи с помощью симуляций.
В онлайн-курсе мы изучим основы математической статистики и аккуратную работу с данными.
Мы научимся собирать и обрабатывать данные с помощью Python, поговорим про их визуализацию и предварительный анализ.
Мы также познакомимся с основными распределениями и описательными статистиками, с которыми аналитики сталкиваются на повседневной основе. И обсудим теоремы, на которых базируется вся наука о данных: закон больших чисел и центральную предельную теорему.
Курс позволяет освоить следующие компетенции в соответствии с Рекомендациями к дополнительным профессиональным программам ИТ-профиля, реализуемым в рамках проекта «Цифровые кафедры» университета–участника программы стратегического академического лидерства «Приоритет-2030»:
Сфера: Искусственный интеллект и машинное обучение
Компетенция: Использует программные и технические средства для визуализации больших данных
Уровень: Продвинутый
Компетенция: Осуществляет сбор и подготовку данных для обучения моделей искусственного интеллекта
Уровень: Продвинутый
Сфера: Средства программной разработки
Компетенция: Применяет языки программирования
Уровень: Базовый
Компетенция: Применяет интегрированные среды разработки (IDE)
Уровень: Базовый
После завершения курса мы рекомендуем вам обратить внимание на курсы (в последовательности) Основы машинного обучения, Математическая статистика и А/В тестирование, Продвинутые методы машинного обучения, Статистические методы анализа данных. Также рекомендуем ознакомиться с курсами Анализ текстовых данных и Компьютерное зрение
course language
needed to educate