up

Введение в науку о данных

Работа с большими данными с помощью новых принципов математического и вычислительного моделирования

10 June 2022 - 11 June 2023 г.
The program has already started
299 days
Before the end of the enrollment
  • Additional education for children and adults

    level of education

  • Russian

    program language

  • 5 weeks

    program duration

  • about 6 hours per week

    needed to educate

  • 2 credit points

    72 academic hour

  • Cost 1800 Р

    for studying

Наука о данных включает большой спектр подходов и методов сбора, обработки, анализа и визуализации массивов данных любого размера. Отдельным практически важным направлением данной науки является работа с большими данными с помощью новых принципов математического и вычислительного моделирования, когда классические методы перестают работать ввиду невозможности их масштабирования.
Настоящий курс призван помочь обучающемуся изучить основы предметной области через постановку и решение типичных задач, с которыми исследователь в области науки о данных может столкнуться в своей работе. Чтобы научить слушателя решать такие задачи, авторы курса предоставляют обучающемуся необходимый теоретический минимум и показывают, как пользоваться инструментальной базой на практике.

About program

Основной целью освоения дисциплины «Введение в науку о данных» является приобретение обучающимися знаний об основах предметной области через постановку и решение типичных задач, с которыми исследователь в области науки о данных может столкнуться в своей работе, а также практических навыков работы с инструментами анализа данных, применяемыми в разных сферах человеческой деятельности.

Поставленная цель достигается путем решения следующих задач курса:

1) Ознакомить студентов с основными задачами, решаемыми в области науки о данных, базовыми алгоритмами этой области, а также со сферами практического применения данных алгоритмов;

2) Развить практические навыки работы с реальными инструментами, применяемыми в области науки о данных;

3) Научить решать прикладные задачи по обработке и анализу данных на предмет выявления в них скрытых зависимостей, а также подбирать методы машинного обучения для этих задач.

Format

Форма обучения заочная (дистанционная). Еженедельные занятия будут включать просмотр тематических видеолекций, изучение дополнительных материалов и выполнение тестовых заданий с автоматизированной проверкой результатов, тестирование по пройденному материалу. Для получения сертификата необходимо выполнить все задания и тесты.

Requirements

  • Этот курс может быть интересен бакалаврам, магистрантам и аспирантам высших учебных заведений, а также всем тем, кому интересна обозначенная тема.
  • Потенциальным работникам курс позволит получить научно-обоснованную информацию, дающую конкурентное преимущество при собственном трудоустройстве.
  • Program's program

    1. Введение
    2. Математический инструментарий науки о данных
    3. Программный инструментарий науки о данных
    4. Машинное обучение: обучение с учителем
    5. Машинное обучение: обучение без учителя

    Education results

    Дисциплина способствует формированию компетенций, предусмотренных действующим Образовательным стандартом СПбГУ:

    В результате освоения курса обучающиеся должны

    знать:

    - Методологию работы исследователя в области науки о данных (постановка целей исследования, сбор данных, обработка и преобразования данных, обследование данных, построение моделей и отбор методов, представление и визуализация результатов).

    - Способы организации хранения данных.

    - Методы и подходы к стандартизации и преобразованию данных.

    - Методы машинного обучения (базовые методы классификации и кластеризации).

    уметь:

    - Решать прикладные задачи по обработке и анализу данных на предмет выявления в них скрытых зависимостей.

    - Применять элементы теории вероятностей и математической статистики, лежащие в основе моделей и методов науки о данных

    - Правильно подбирать методы машинного обучения для решения практических задач

    - Организовывать рабочее окружение исследователя в области науки о данных (Jupyter).

    - Использовать пакеты и библиотеки для машинного обучения (Matplotlib, SciPy/NumPy, Pandas, Scikitlearn)

    владеть:

    - Инструментарием для организации хранения данных.

    - Навыками программной реализации на языке Pyton средств обработки и анализа данных.

    - Навыками предобработки и визуализации данных  

    Севрюков Сергей Юрьевич


    Position: старший преподаватель кафедры технологии программирования СПбГУ, начальник Управления – службы информационных технологий СПбГУ

    Малютин Евгений Алексеевич


    Position: ассистент кафедры технологии программирования

    Блеканов Иван Станиславович

    Кандидат технических наук
    Position: доцент кафедры технологии программирования, заведующий кафедрой технологии программирования

    Просолупов Евгений Викторович

    Канд. физ.-мат. наук
    Position: доцент кафедры технологии программирования

    Утешев Алексей Юрьевич

    Доктор физико-математических наук
    Position: профессор кафедры управления медико-биологическими системами, заведующий кафедрой фундаментальной информатики и распределенных систем

    Коротков Павел Алексеевич


    Position: ст. преподаватель кафедры технологии программирования

    Вольф Дмитрий Александрович


    Position: ассистент кафедры математического моделирования энергетических систем

    Камалов Михаил Валерьевич


    Position: аспирант кафедры технологии программирования

    Courses in program