level of education
program language
program duration
needed to educate
72 academic hour
for studying
Наука о данных включает большой спектр подходов и методов сбора, обработки, анализа и визуализации массивов данных любого размера. Отдельным практически важным направлением данной науки является работа с большими данными с помощью новых принципов математического и вычислительного моделирования, когда классические методы перестают работать ввиду невозможности их масштабирования.
Настоящий курс призван помочь обучающемуся изучить основы предметной области через постановку и решение типичных задач, с которыми исследователь в области науки о данных может столкнуться в своей работе. Чтобы научить слушателя решать такие задачи, авторы курса предоставляют обучающемуся необходимый теоретический минимум и показывают, как пользоваться инструментальной базой на практике.
Основной целью освоения дисциплины «Введение в науку о данных» является приобретение обучающимися знаний об основах предметной области через постановку и решение типичных задач, с которыми исследователь в области науки о данных может столкнуться в своей работе, а также практических навыков работы с инструментами анализа данных, применяемыми в разных сферах человеческой деятельности.
Поставленная цель достигается путем решения следующих задач курса:
1) Ознакомить студентов с основными задачами, решаемыми в области науки о данных, базовыми алгоритмами этой области, а также со сферами практического применения данных алгоритмов;
2) Развить практические навыки работы с реальными инструментами, применяемыми в области науки о данных;
3) Научить решать прикладные задачи по обработке и анализу данных на предмет выявления в них скрытых зависимостей, а также подбирать методы машинного обучения для этих задач.
Форма обучения заочная (дистанционная). Еженедельные занятия будут включать просмотр тематических видеолекций, изучение дополнительных материалов и выполнение тестовых заданий с автоматизированной проверкой результатов, тестирование по пройденному материалу. Для получения сертификата необходимо выполнить все задания и тесты.
Дисциплина способствует формированию компетенций, предусмотренных действующим Образовательным стандартом СПбГУ:
В результате освоения курса обучающиеся должны
знать:
- Методологию работы исследователя в области науки о данных (постановка целей исследования, сбор данных, обработка и преобразования данных, обследование данных, построение моделей и отбор методов, представление и визуализация результатов).
- Способы организации хранения данных.
- Методы и подходы к стандартизации и преобразованию данных.
- Методы машинного обучения (базовые методы классификации и кластеризации).
уметь:
- Решать прикладные задачи по обработке и анализу данных на предмет выявления в них скрытых зависимостей.
- Применять элементы теории вероятностей и математической статистики, лежащие в основе моделей и методов науки о данных
- Правильно подбирать методы машинного обучения для решения практических задач
- Организовывать рабочее окружение исследователя в области науки о данных (Jupyter).
- Использовать пакеты и библиотеки для машинного обучения (Matplotlib, SciPy/NumPy, Pandas, Scikitlearn)
владеть:
- Инструментарием для организации хранения данных.
- Навыками программной реализации на языке Pyton средств обработки и анализа данных.
- Навыками предобработки и визуализации данных
level of education
program language
program duration
needed to educate
72 academic hour
for studying
Position: старший преподаватель кафедры технологии программирования СПбГУ, начальник Управления – службы информационных технологий СПбГУ
Position: ассистент кафедры технологии программирования
Кандидат технических наук
Position: доцент кафедры технологии программирования, заведующий кафедрой технологии программирования
Канд. физ.-мат. наук
Position: доцент кафедры технологии программирования
Доктор физико-математических наук
Position: профессор кафедры управления медико-биологическими системами, заведующий кафедрой фундаментальной информатики и распределенных систем
Position: ст. преподаватель кафедры технологии программирования
Position: ассистент кафедры математического моделирования энергетических систем
Position: аспирант кафедры технологии программирования