наверх

Обработка данных на языке Python. Часть 2

19 сентября 2024 - 31 января 2025 г.
Курс уже начался
Запись на курс закрыта
Подпишитесь на новости и узнайте дату следующего запуска
Добавить в избранное
  • Русский

    язык курса

  • от 10 до 16 недель

    длительность курса

  • от 4 до 7 часов в неделю

    понадобится для освоения

  • 2 зачётных единицы

    для зачета в своем вузе

О курсе

В курсе продолжается изучение основных подходов и библиотеки обработки и визуализации данных в языке Python. Слушатели учатся методам работы с разными типами данных – от слабоструктурированных, до табличных, а также учатся решать практические задания по подготовке данных, с использованием открытых наборов данных и API. В курсе слушатели знакомятся с библиотеками, которые необходимы для эффективного решения широкого круга аналитических задач, такими как Ipython, Pandas, Numpy, Matplotlib и Scikit-learn, и др.

Формат

Стоимость доступа к материалам курса за исключением ознакомительной части (включая тестовые материалы и возможность пройти экзамен с прокторингом и получить сертификат) составляет 3600 рублей. Для этого нужно пройти текущее тестирование не меньше чем на 60% и итоговый тест не меньше чем на 60%.

  1. Python for Data Analysis by Wes McKinney (O’Reilly). Copyright 2017 Wes McKinney, 978-1-491-95766-0
  2. Волкова В.М., Программные системы статистического анализа. Обнаружение закономерностей в данных с использованием системы R и языка Python [Электронный ресурс]: учебное пособие / Волкова В.М. - Новосибирск : Изд-во НГТУ, 2017. - 74 с. - ISBN
  3. 978-5-7782-3183-2 - Режим доступа: http://www.studentlibrary.ru/book/ISBN9785778231832.html
  4. www.python.org

Программа курса

Модуль 1. Базовая обработка текстов. Регулярные выражения. Библиотека Re.

Модуль 2. Базовый парсинг сайтов. Библиотекa BS4. Построение дерева тегов статической Html страницы.

Модуль 3. Поиск аномальных значений. Восстановление пропущенных значений.

Модуль 4. Квантование и перекодирование данных. Библиотека Sklearn.

Модуль 5. Регрессионный анализ в Библиотеке Sklearn. Линейная регрессия.

Модуль 6. Продвинутая обработка текстов. Векторизация текстовых данных с библиотекой Sklearn.

Модуль 7. Работа  с языком SQL в файловой СУБД Sqlite3.

Модуль 8. Модуль Random, генерация случайных подвыборок и оценка статистических характеристик исходной выборки.

Результаты обучения

В результате обучения слушатель будет:

Знать:

  • специализированные библиотеки Python для анализа данных.

Уметь:

  • разрабатывать прикладные программы на языке программирования Python.

Владеть:

  • Практическими навыками использования набора библиотек языка Python для прикладных задач в области анализа данных.

Направления подготовки

Знания

Знание специализированных библиотек Python для анализа данных.

Умения

Умение разрабатывать прикладные программы на языке программирования Python.

Навыки

Практический навык использования набора библиотек языка Python для прикладных задач в области анализа данных.

Киреев Василий Сергеевич

Кандидат технических наук, Доцент
Должность: Доцент отделения интеллектуальных кибернетических систем офиса образовательных программ

Похожие курсы