наверх

Наука о данных: введение

10 июня 2022 - 31 декабря 2024 г.
Курс уже начался
38 дней
До конца записи
  • Русский

    язык курса

  • 134 недели

    длительность курса

  • от 4 до 6 часов в неделю

    понадобится для освоения

  • 2 зачётных единицы

    для зачета в своем вузе

  • Стоимость 3 600 Р

    за обучение

Уважаемые слушатели, некоторые материалы данного курса доступны для ознакомительного просмотра. Чтобы получить доступ ко всем материалам курса, необходимо оплатить доступ к материалам. 

Наука о данных включает большой спектр подходов и методов сбора, обработки, анализа и визуализации массивов данных любого размера. Отдельным практически важным направлением данной науки является работа с большими данными с помощью новых принципов математического и вычислительного моделирования, когда классические методы перестают работать ввиду невозможности их масштабирования.
Настоящий курс призван помочь обучающемуся изучить основы предметной области через постановку и решение типичных задач, с которыми исследователь в области науки о данных может столкнуться в своей работе. Чтобы научить слушателя решать такие задачи, авторы курса предоставляют обучающемуся необходимый теоретический минимум и показывают, как пользоваться инструментальной базой на практике.

О курсе

Основной целью освоения дисциплины «Введение в науку о данных» является приобретение обучающимися знаний об основах предметной области через постановку и решение типичных задач, с которыми исследователь в области науки о данных может столкнуться в своей работе, а также практических навыков работы с инструментами анализа данных, применяемыми в разных сферах человеческой деятельности.

Поставленная цель достигается путем решения следующих задач курса:

1) Ознакомить студентов с основными задачами, решаемыми в области науки о данных, базовыми алгоритмами этой области, а также со сферами практического применения данных алгоритмов;

2) Развить практические навыки работы с реальными инструментами, применяемыми в области науки о данных;

3) Научить решать прикладные задачи по обработке и анализу данных на предмет выявления в них скрытых зависимостей, а также подбирать методы машинного обучения для этих задач.

Формат

Форма обучения заочная (дистанционная). Еженедельные занятия будут включать просмотр тематических видеолекций, изучение дополнительных материалов и выполнение тестовых заданий с автоматизированной проверкой результатов, тестирование по пройденному материалу. Для получения сертификата необходимо выполнить все задания и тесты.

Требования

Курс подходит обучающимся по направлениям подготовки Математика и компьютерные науки

Программа курса

  1. Введение
  2. Математический инструментарий науки о данных
  3. Программный инструментарий науки о данных
  4. Машинное обучение: обучение с учителем
  5. Машинное обучение: обучение без учителя

Результаты обучения

Дисциплина способствует формированию компетенций, предусмотренных действующим Образовательным стандартом СПбГУ

 

Формируемые компетенции

ОПК-4. Способен находить, анализировать, реализовывать программно и использовать на практике математические алгоритмы, в том числе с применением современных вычислительных систем

Направления подготовки

Знания

В результате освоения курса обучающиеся должны знать:

- Методологию работы исследователя в области науки о данных (постановка целей исследования, сбор данных, обработка и преобразования данных, обследование данных, построение моделей и отбор методов, представление и визуализация результатов).

- Способы организации хранения данных.

- Методы и подходы к стандартизации и преобразованию данных.

- Методы машинного обучения (базовые методы классификации и кластеризации).

Умения

В результате освоения курса обучающиеся должны владеть:

- Инструментарием для организации хранения данных.

- Навыками программной реализации на языке Pyton средств обработки и анализа данных.

- Навыками предобработки и визуализации данных  

Навыки

В результате освоения курса обучающиеся должны уметь:

- Решать прикладные задачи по обработке и анализу данных на предмет выявления в них скрытых зависимостей.

- Применять элементы теории вероятностей и математической статистики, лежащие в основе моделей и методов науки о данных

- Правильно подбирать методы машинного обучения для решения практических задач

- Организовывать рабочее окружение исследователя в области науки о данных (Jupyter).

- Использовать пакеты и библиотеки для машинного обучения (Matplotlib, SciPy/NumPy, Pandas, Scikitlearn)

Отзывы о курсе

Севрюков Сергей Юрьевич


Должность: старший преподаватель кафедры технологии программирования, заместитель директора Центра исследования проблем информационной безопасности и цифровой трансформации

Малютин Евгений Алексеевич


Должность: ассистент кафедры технологии программирования

Блеканов Иван Станиславович

Кандидат технических наук, доцент
Должность: заведующий кафедрой технологии программирования, руководитель ИТ-клиники СПбГУ

Коротков Павел Алексеевич


Должность: ст. преподаватель кафедры технологии программирования

Просолупов Евгений Викторович

Канд. физ.-мат. наук
Должность: доцент кафедры технологии программирования

Утешев Алексей Юрьевич

Доктор физико-математических наук
Должность: профессор кафедры управления медико-биологическими системами, заведующий кафедрой фундаментальной информатики и распределенных систем

Вольф Дмитрий Александрович


Должность: ассистент кафедры математического моделирования энергетических систем

Камалов Михаил Валерьевич


Должность: аспирант кафедры технологии программирования

Сертификат

По данному курсу возможно получение сертификата.

Стоимость прохождения процедур оценки результатов обучения с идентификацией личности - 3600 Р.

Программы, в которые включен курс

Похожие курсы