up

Наука о данных: введение

10 June 2022 - 31 December 2024 г.
The course has already started
256 days
Before the end of the enrollment
  • Russian

    course language

  • 134 weeks

    course duration

  • от 4 до 6 часов в неделю

    needed to educate

  • 2 credit points

    for credit at your university

  • Cost 2 800 Р

    for studying

Уважаемые слушатели, некоторые материалы данного курса доступны для ознакомительного просмотра. Чтобы получить доступ ко всем материалам курса, необходимо оплатить доступ к материалам. 

Наука о данных включает большой спектр подходов и методов сбора, обработки, анализа и визуализации массивов данных любого размера. Отдельным практически важным направлением данной науки является работа с большими данными с помощью новых принципов математического и вычислительного моделирования, когда классические методы перестают работать ввиду невозможности их масштабирования.
Настоящий курс призван помочь обучающемуся изучить основы предметной области через постановку и решение типичных задач, с которыми исследователь в области науки о данных может столкнуться в своей работе. Чтобы научить слушателя решать такие задачи, авторы курса предоставляют обучающемуся необходимый теоретический минимум и показывают, как пользоваться инструментальной базой на практике.

About

Основной целью освоения дисциплины «Введение в науку о данных» является приобретение обучающимися знаний об основах предметной области через постановку и решение типичных задач, с которыми исследователь в области науки о данных может столкнуться в своей работе, а также практических навыков работы с инструментами анализа данных, применяемыми в разных сферах человеческой деятельности.

Поставленная цель достигается путем решения следующих задач курса:

1) Ознакомить студентов с основными задачами, решаемыми в области науки о данных, базовыми алгоритмами этой области, а также со сферами практического применения данных алгоритмов;

2) Развить практические навыки работы с реальными инструментами, применяемыми в области науки о данных;

3) Научить решать прикладные задачи по обработке и анализу данных на предмет выявления в них скрытых зависимостей, а также подбирать методы машинного обучения для этих задач.

Format

Форма обучения заочная (дистанционная). Еженедельные занятия будут включать просмотр тематических видеолекций, изучение дополнительных материалов и выполнение тестовых заданий с автоматизированной проверкой результатов, тестирование по пройденному материалу. Для получения сертификата необходимо выполнить все задания и тесты.

Requirements

Курс подходит обучающимся по направлениям подготовки Математика и компьютерные науки

Course program

  1. Введение
  2. Математический инструментарий науки о данных
  3. Программный инструментарий науки о данных
  4. Машинное обучение: обучение с учителем
  5. Машинное обучение: обучение без учителя

Education results

Дисциплина способствует формированию компетенций, предусмотренных действующим Образовательным стандартом СПбГУ

 

Formed competencies

ОПК-4. Способен находить, анализировать, реализовывать программно и использовать на практике математические алгоритмы, в том числе с применением современных вычислительных систем

Education directions

Knowledge

В результате освоения курса обучающиеся должны знать:

- Методологию работы исследователя в области науки о данных (постановка целей исследования, сбор данных, обработка и преобразования данных, обследование данных, построение моделей и отбор методов, представление и визуализация результатов).

- Способы организации хранения данных.

- Методы и подходы к стандартизации и преобразованию данных.

- Методы машинного обучения (базовые методы классификации и кластеризации).

Skills

В результате освоения курса обучающиеся должны владеть:

- Инструментарием для организации хранения данных.

- Навыками программной реализации на языке Pyton средств обработки и анализа данных.

- Навыками предобработки и визуализации данных  

Abilities

В результате освоения курса обучающиеся должны уметь:

- Решать прикладные задачи по обработке и анализу данных на предмет выявления в них скрытых зависимостей.

- Применять элементы теории вероятностей и математической статистики, лежащие в основе моделей и методов науки о данных

- Правильно подбирать методы машинного обучения для решения практических задач

- Организовывать рабочее окружение исследователя в области науки о данных (Jupyter).

- Использовать пакеты и библиотеки для машинного обучения (Matplotlib, SciPy/NumPy, Pandas, Scikitlearn)

Отзывы о курсе

Севрюков Сергей Юрьевич


Position: Старший преподаватель кафедры технологии программирования, заместитель директора Центра исследования проблем информационной безопасности и цифровой трансформации СПбГУ

Малютин Евгений Алексеевич


Position: ассистент кафедры технологии программирования

Блеканов Иван Станиславович

Кандидат технических наук, доцент
Position: заведующий кафедрой технологии программирования, руководитель ИТ-клиники СПбГУ

Коротков Павел Алексеевич


Position: ст. преподаватель кафедры технологии программирования

Просолупов Евгений Викторович

Канд. физ.-мат. наук
Position: доцент кафедры технологии программирования

Утешев Алексей Юрьевич

Доктор физико-математических наук
Position: профессор кафедры управления медико-биологическими системами, заведующий кафедрой фундаментальной информатики и распределенных систем

Вольф Дмитрий Александрович


Position: ассистент кафедры математического моделирования энергетических систем

Камалов Михаил Валерьевич


Position: аспирант кафедры технологии программирования

Certificate

It is possible to get a certificate for this course.

The cost of passing the procedures for assessing learning outcomes with personal identification - 2800 Р.

Programs, which includes this course

Similar courses