Сертификат выдается при выполнении всех контрольных заданий на 60 % и выше
Стоимость прохождения процедур оценки результатов обучения с идентификацией личности - 3600 Р.
Уважаемые слушатели, некоторые материалы данного курса доступны для ознакомительного просмотра. Чтобы получить доступ ко всем материалам курса, необходимо оплатить доступ к материалам.
Наука о данных включает большой спектр подходов и методов сбора, обработки, анализа и визуализации массивов данных любого размера. Отдельным практически важным направлением данной науки является работа с большими данными с помощью новых принципов математического и вычислительного моделирования, когда классические методы перестают работать ввиду невозможности их масштабирования.
Настоящий курс призван помочь обучающемуся изучить основы предметной области через постановку и решение типичных задач, с которыми исследователь в области науки о данных может столкнуться в своей работе. Чтобы научить слушателя решать такие задачи, авторы курса предоставляют обучающемуся необходимый теоретический минимум и показывают, как пользоваться инструментальной базой на практике.
Основной целью освоения дисциплины «Введение в науку о данных» является приобретение обучающимися знаний об основах предметной области через постановку и решение типичных задач, с которыми исследователь в области науки о данных может столкнуться в своей работе, а также практических навыков работы с инструментами анализа данных, применяемыми в разных сферах человеческой деятельности.
Поставленная цель достигается путем решения следующих задач курса:
1) Ознакомить студентов с основными задачами, решаемыми в области науки о данных, базовыми алгоритмами этой области, а также со сферами практического применения данных алгоритмов;
2) Развить практические навыки работы с реальными инструментами, применяемыми в области науки о данных;
3) Научить решать прикладные задачи по обработке и анализу данных на предмет выявления в них скрытых зависимостей, а также подбирать методы машинного обучения для этих задач.
Форма обучения заочная (дистанционная). Еженедельные занятия будут включать просмотр тематических видеолекций, изучение дополнительных материалов и выполнение тестовых заданий с автоматизированной проверкой результатов, тестирование по пройденному материалу. Для получения сертификата необходимо выполнить все задания и тесты.
Курс подходит обучающимся по направлениям подготовки Математика и компьютерные науки
В результате освоения курса обучающиеся должны знать:
- Методологию работы исследователя в области науки о данных (постановка целей исследования, сбор данных, обработка и преобразования данных, обследование данных, построение моделей и отбор методов, представление и визуализация результатов).
- Способы организации хранения данных.
- Методы и подходы к стандартизации и преобразованию данных.
- Методы машинного обучения (базовые методы классификации и кластеризации).
В результате освоения курса обучающиеся должны уметь:
- Решать прикладные задачи по обработке и анализу данных на предмет выявления в них скрытых зависимостей.
- Применять элементы теории вероятностей и математической статистики, лежащие в основе моделей и методов науки о данных
- Правильно подбирать методы машинного обучения для решения практических задач
- Организовывать рабочее окружение исследователя в области науки о данных (Jupyter).
- Использовать пакеты и библиотеки для машинного обучения (Matplotlib, SciPy/NumPy, Pandas, Scikitlearn
В результате освоения курса обучающиеся должны владеть:
- Инструментарием для организации хранения данных.
- Навыками программной реализации на языке Pyton средств обработки и анализа данных.
- Навыками предобработки и визуализации данных
Дисциплина способствует формированию компетенций, предусмотренных действующим Образовательным стандартом СПбГУ
ОПК-4. Способен находить, анализировать, реализовывать программно и использовать на практике математические алгоритмы, в том числе с применением современных вычислительных систем