up

Введение в науку о данных

Start date will be announced later

Start date for course enrollment has not been announced yet

  • Russian

    course language

  • 5 weeks

    course duration

  • от 4 до 6 часов в неделю

    needed to educate

  • 2 credit points

    for credit at your university

Наука о данных включает большой спектр подходов и методов сбора, обработки, анализа и визуализации массивов данных любого размера. Отдельным практически важным направлением данной науки является работа с большими данными с помощью новых принципов математического и вычислительного моделирования, когда классические методы перестают работать ввиду невозможности их масштабирования.
Настоящий курс призван помочь обучающемуся изучить основы предметной области через постановку и решение типичных задач, с которыми исследователь в области науки о данных может столкнуться в своей работе. Чтобы научить слушателя решать такие задачи, авторы курса предоставляют обучающемуся необходимый теоретический минимум и показывают, как пользоваться инструментальной базой на практике.

About

Основной целью освоения дисциплины «Введение в науку о данных» является приобретение обучающимися знаний об основах предметной области через постановку и решение типичных задач, с которыми исследователь в области науки о данных может столкнуться в своей работе, а также практических навыков работы с инструментами анализа данных, применяемыми в разных сферах человеческой деятельности.

Поставленная цель достигается путем решения следующих задач курса:

1) Ознакомить студентов с основными задачами, решаемыми в области науки о данных, базовыми алгоритмами этой области, а также со сферами практического применения данных алгоритмов;

2) Развить практические навыки работы с реальными инструментами, применяемыми в области науки о данных;

3) Научить решать прикладные задачи по обработке и анализу данных на предмет выявления в них скрытых зависимостей, а также подбирать методы машинного обучения для этих задач.

Format

Форма обучения заочная (дистанционная). Еженедельные занятия будут включать просмотр тематических видеолекций, изучение дополнительных материалов и выполнение тестовых заданий с автоматизированной проверкой результатов, тестирование по пройденному материалу. Для получения сертификата необходимо выполнить все задания и тесты.

Course program

  1. Введение
  2. Математический инструментарий науки о данных
  3. Программный инструментарий науки о данных
  4. Машинное обучение: обучение с учителем
  5. Машинное обучение: обучение без учителя

Education results

Дисциплина способствует формированию компетенций, предусмотренных действующим Образовательным стандартом СПбГУ

 

Knowledge

В результате освоения курса обучающиеся должны знать:

- Методологию работы исследователя в области науки о данных (постановка целей исследования, сбор данных, обработка и преобразования данных, обследование данных, построение моделей и отбор методов, представление и визуализация результатов).

- Способы организации хранения данных.

- Методы и подходы к стандартизации и преобразованию данных.

- Методы машинного обучения (базовые методы классификации и кластеризации).

Skills

В результате освоения курса обучающиеся должны владеть:

- Инструментарием для организации хранения данных.

- Навыками программной реализации на языке Pyton средств обработки и анализа данных.

- Навыками предобработки и визуализации данных  

Abilities

В результате освоения курса обучающиеся должны уметь:

- Решать прикладные задачи по обработке и анализу данных на предмет выявления в них скрытых зависимостей.

- Применять элементы теории вероятностей и математической статистики, лежащие в основе моделей и методов науки о данных

- Правильно подбирать методы машинного обучения для решения практических задач

- Организовывать рабочее окружение исследователя в области науки о данных (Jupyter).

- Использовать пакеты и библиотеки для машинного обучения (Matplotlib, SciPy/NumPy, Pandas, Scikitlearn)

Севрюков Сергей Юрьевич


Position: старший преподаватель кафедры технологии программирования СПбГУ, начальник Управления – службы информационных технологий СПбГУ

Малютин Евгений Алексеевич


Position: ассистент кафедры технологии программирования

Блеканов Иван Станиславович

Кандидат технических наук
Position: доцент кафедры технологии программирования, заведующий кафедрой технологии программирования

Коротков Павел Алексеевич


Position: ст. преподаватель кафедры технологии программирования

Просолупов Евгений Викторович

Канд. физ.-мат. наук
Position: доцент кафедры технологии программирования

Утешев Алексей Юрьевич

Доктор физико-математических наук
Position: профессор кафедры управления медико-биологическими системами, заведующий кафедрой фундаментальной информатики и распределенных систем

Вольф Дмитрий Александрович


Position: ассистент кафедры математического моделирования энергетических систем

Камалов Михаил Валерьевич


Position: аспирант кафедры технологии программирования