наверх

Аналитика данных

Данные будут работать на вас!

  • Дополнительное профессиональное образование

    уровень образования

  • Русский

    язык программы

  • 19 недель

    длительность программы

  • около 6 часов в неделю

    понадобится для освоения

  • 4 зачётных единицы

    144 академических часа

  • Стоимость 60 000 Р

    старая цена 90 000 Р

О программе


Что это за специальность?

Аналитик данных — ключевой игрок цифровой экономики. Количество вакансий, связанных с аналитикой данных, за 3 года выросло на 433%. Спрос значительно превышает предложение. Ритейл, киберспорт, путешествия, образование, медицина — грамотный Data Scientist востребован в каждой индустрии.

Каждую секунду мы создаем новые данные: общаемся в мессенджерах, выкладываем фотографии, делаем покупки онлайн, бронируем авиабилеты, пользуемся навигаторами. Вся генерируемая в процессе информация накапливается и сохраняется. Но она оказывается полезной лишь в том случае, когда ее удается расшифровать, обработать и интерпретировать. Этими процессами занимается аналитик данных. Он ищет закономерности, визуализирует, интерпретирует, выявляет проблемные места, выдвигает гипотезы и на основе полученной информации предлагает оптимальные решения для улучшения бизнес-процессов.


Для кого эта программа?

Для новичков. Вы получите востребованные и высокооплачиваемые навыки в IT-сфере.
Для практикующих IT-специалистов. Вы получите новую траекторию развития вашей карьеры и станете востребованным специалистом в перспективной сфере.

Что вас ждет во время обучения?

Персонализированное обучение: чат в Telegram для общения с наставниками и обучающимися.
Мастер-классы и консультации от команды преподавателей.
Вебинары с наставниками и практикующими специалистами.
Карьерные консультации. HR-специалисты расскажут о состоянии рынка труда и перспективах трудоустройства в изучаемой области.
Индивидуальные задания. Работа над задачами из реальной практики, решение которых может быть использовано в портфолио.
Оценка и предоставление обратной связи. Рекомендации экспертов по выполнению индивидуальных заданий на протяжении всего обучения.

Чему вы научитесь?

  • Собирать, агрегировать и структурировать данные. 
  • Писать регулярные выражения, создавать сводные таблицы, работать с временными рядами. 
  • Визуализировать данные. 
  • Работать с базами данных. 
  • Освоите работу с реляционными СУБД на примере PostgreSQL и Oracle, научитесь использовать NoSQL хранилища на базе MongoDB, Redis и Neo4J. 
  • Сможете вычислять статистические параметры  наборов данных и узнаете законы распределения. 
  • Научитесь строить доверительный интервал и выдвигать гипотезы.

Формат


1. Первичная обработка данных

Курс дает базовые представления о первичной обработке данных. Вы научитесь обрабатывать данные в электронных таблицах, применять правильные методы визуализации данных, выявлять тренды и прогнозировать поведение временных рядов. После прохождения курса вы сможете выбрать квартиру для своей семьи или школу для ребенка на основе собственных критериев, спрогнозировать потребление электроэнергии в зависимости от сезона, выявить тренды в продажах автомобилей, а также решать другие конкретные задачи профессиональной сферы и повседневной жизни.

2. Хранение больших данных

Курс познакомит вас с современными инструментами хранения и работы с большими объемами сложно структурированных данных, в том числе с музыкой, фотографиями и документами. Вы научитесь проектировать данные, организовывать их хранение и писать запросы. После прохождения курса при работе с базами данных вы сможете быстро находить и агрегировать данные по различным критериям, например, по клиенту проследить историю его заказов; по видам услуг провести анализ спроса; сгруппировать данные по возрасту, полу, месту проживания заказчика.

3. Статистический анализ данных

Курс научит вас работать с приемами и инструментами, которые позволяют находить закономерности в данных, строить прогнозы, определять аномалии и принимать решения практически в любой профессиональной сфере. После прохождения курса вы сможете определять, какое количество товаров стоит закупить во время пикового спроса для обеспечения максимальной прибыли, что повлияло на резкий спад заинтересованности продукцией, увеличилась ли средняя выручка и каков разброс цен на определенный продукт. Решение этих и других задач, рассматриваемых в курсе, помогут добиться успеха как небольшому стартапу, так и при управлении крупным бизнесом.

4. Элементы теории вероятностей (факультативный курс)

Если вы не знакомы с аппаратом теории вероятностей, курс «Элементы теории вероятностей» даст вам необходимый минимум знаний для более глубокого погружения в материалы по статистическому анализу данных.


Программа обучения


Первичная обработка данных: 
( 1 неделя → 5 неделя )

  1. Введение в науку о данных
    • Основные понятия анализа данных
    • Измерения и шкалы. Виды данных
    • Источники данных. Подготовка данных
  2. Инструменты обработки данных
    • Инструменты первичной обработки данных
    • Электронные таблицы
    • Сортировка и фильтрация данных. Сводная таблица
  3. Визуализация данных
    • Задачи визуализации
    • Методы визуализации
    • Визуализация данных в Google-таблицах
  4. Анализ и преобразование данных
    • Описательная статистика
    • Преобразование данных
    • Нормировка данных
    • Целевая функция
  5. Работа с временными рядами
    • Анализ временных рядов
    • Сглаживание временных рядов
    • Определение трендов временных рядов
    • Построение моделей для временных рядов с сезонными составляющими

Хранение больших данных:
( 6 неделя → 9 неделя )

  1. Системы управления базами данных
    • Информационные системы
    • Базы данных: основные функции систем управления данными
    • Архитектура СУБД. Реляционные базы данных
  2. Проектирование структурированных данных
    • Проектирование данных и связей
    • Преобразование ER-модели в БД
    • Создание таблиц. Ограничения целостности
  3. Запросы на языке SQL
    • Оператор SELECT. Условия выборки
    • Агрегатные функции. Вложенные запросы
    • Теоретико-множественные операции. Соединение таблиц
  4. Объекты баз данных
    • Выражения на SQL
    • Встроенные функции на SQL
    • Объекты. Индексы

Статистический анализ данных:
( 10 неделя → 14 неделя )

  1. Обзор задач, решаемых статистикой
    • Введение в статистику
    • Точечное и интервальное оценивание
    • Проверка гипотез
  2. Выборочные характеристики
    • Основные понятия и задачи математической статистики
    • Выборочное распределение
    • Эмпирическая функция распределения
    • Гистограмма
    • Выборочные моменты и квантили
  3. Точечное оценивание
    • Точечные оценки и их свойства
    • Метод моментов
    • Состоятельность оценки метода моментов
    • Метод максимального правдоподобия
  4. Точные и асимптотические доверительные интервалы
    • Интервальное оценивание
    • Точные доверительные интервалы для семейства нормальных распределений
    • Асимптотические доверительные интервалы и примеры их построения
    • Асимптотическая нормальность оценки и построение доверительных интервалов
  5. Проверка гипотез
    • Понятие гипотезы и критерия. Ошибки 1 и 2 рода
    • Уровень значимости и мощность
    • Критерии согласия

Элементы теории вероятностей (факультативный курс):
( 1 неделя → 19 неделя )

  1. Вероятностное пространство
    • Пространство элементарных исходов. События и операции над ними
    • Простейшее вероятностное пространство
    • Классическое определение вероятности
    • Комбинаторика
    • Условная вероятность. Независимость
  2. Простейшие случайные величины
    • Случайные величины и их характеристики
    • Закон больших чисел. Предельные теоремы в схеме Бернулли
    • Неравенства Маркова и Чебышёва
  3. Общее понятие вероятностного пространства
    • Геометрическая вероятность
    • Общее определение вероятностного пространства
    • Случайные величины и их распределения
  4. Типы распределений случайных величин
    • Распределения случайных величин
    • Многомерные распределения
  5. Числовые характеристики, сходимость
    • Начальные сведения о функциях от случайных величин
    • Некоторые числовые характеристики случайных величин
    • Сходимость последовательностей случайных величин

Михайлова Елена Георгиевна

К. ф.-м. н., доцент
Должность: Директор высшей школы цифровой культуры Университета ИТМО

Волчек Дмитрий Геннадьевич

К.т.н.
Должность: доцент высшей школы цифровой культуры Университета ИТМО

Бойцев Антон Александрович

К.ф.-м.н.
Должность: доцент факультета систем управления и робототехники, доцент высшей школы цифровой культуры Университета ИТМО

Графеева Наталья Генриховна

Кандидат физико-математических наук
Должность: доцент высшей школы цифровой культуры Университета ИТМО

Егорова Ольга Борисовна

К.ф.н.
Должность: преподаватель высшей школы цифровой культуры Университета ИТМО

Романов Алексей Андреевич

К.т.н.
Должность: доцент высшей школы цифровой культуры Университета ИТМО

Удостоверение о повышении квалификации государственного образца

Для прохождения обучения необходимо предоставить: документ о среднем/высшем образовании или справку об обучении, СНИЛС, паспорт

Курсы в программе