язык курса
длительность курса
понадобится для освоения
для зачета в своем вузе
В курсе "Сбор и анализ данных в Python" мы изучим основы математической статистики и аккуратную работу с данными, научимся собирать и обрабатывать данные с помощью Python, поговорим про их визуализацию и предварительный анализ.
Курс является частью специализации "Машинное обучение: от статистики до нейросетей", состоящей из семи курсов: "Математическая статистика и А/В тестирование", "Основы машинного обучения (вводный курс)", "Сбор и анализ данных в Python", "Статистические методы анализа данных", "Продвинутые методы машинного обучения", "Основы глубинного обучения" и "Продвинутые методы глубинного обучения".
Мы познакомимся с базовыми понятиями статистики, научимся аккуратно собирать данные, обрабатывать их и визуализировать. Также мы поговорим про базовые теоремы, которые используются в математической статистике: ЗБЧ и ЦПТ.
Мы изучим основы математической статистики и аккуратную работу с данными, научимся собирать и обрабатывать данные с помощью Python, поговорим про их визуализацию и предварительный анализ.
Мы также познакомимся с основными распределениями и описательными статистиками, с которыми аналитики сталкиваются на повседневной основе. И обсудим теоремы, на которых базируется вся наука о данных: закон больших чисел и центральную предельную теорему.
Курс состоит из 5 недель. Каждая включает в себя несколько коротких видеолекций (суммарная продолжительность – от 60 до 100 минут), тест на знание теоретического материала (5 – 15 вопросов), а также тест, включающий в себя выполнение заданий по программированию и решение теоретических задач. На некоторых неделях задание по программированию заменено заданием на взаимное оценивание. В конце курса предусмотрен итоговый экзамен, состоящий из тестовых вопросов.
Базовые навыки программирования на языке Python. Математика для анализа данных: теория вероятностей, производные, оптимизация, интегралы, матрицы.
1. Распределения и описательные статистики
Вспомним основные определения из теории вероятностей. Поговорим об описательных статистиках. Попробуем сделать в Python простые вещи, связанные с визуализацией, случайными величинами и табличками.
2. Особенности в данных
Поговорим про зависимые случайные величины, нормальное распределение и проблемы в данных.
3. Сбор и очистка данных
4. Разведочный анализ данных и визуализация
Анализируем данные по мемам и логи магазина. Смотрим на пайплайн знакомства с данными.
5. Закон больших чисел и центральная предельная теорема
Говорим о том, какими бывают сходимости случайных величин, учимся решать задачи с помощью симуляций.
язык курса
длительность курса
понадобится для освоения
для зачета в своем вузе
Должность: Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук
Стоимость доступа ко всем материалам курса, возможности пройти экзамен с прокторингом и получить сертификат составляет 3600 рублей.
Стоимость прохождения процедур оценки результатов обучения с идентификацией личности - 3600 Р.