уровень образования
язык программы
длительность программы
72 академических часа
за обучение
В программе изучаются основные подходы и библиотеки обработки и визуализации данных в языке Python. Слушатели учатся методам работы с разными типами данных – от слабоструктурированных, до табличных, а также учатся решать практические задания по подготовке данных, с использованием открытых наборов данных и API. В курсе слушатели знакомятся с библиотеками, которые необходимы для эффективного решения широкого круга аналитических задач, такими как Ipython, Pandas, Numpy, Matplotlib и Scikit-learn, и др.
Модуль 1. Базовая обработка текстов. Регулярные выражения. Библиотека Re.
Модуль 2. Базовый парсинг сайтов. Библиотекa BS4. Построение дерева тегов статической Html страницы.
Модуль 3. Поиск аномальных значений. Восстановление пропущенных значений.
Модуль 4. Квантование и перекодирование данных. Библиотека Sklearn.
Модуль 5. Регрессионный анализ в Библиотеке Sklearn. Линейная регрессия.
Модуль 6. Продвинутая обработка текстов. Векторизация текстовых данных с библиотекой Sklearn.
Модуль 7. Работа с языком SQL в файловой СУБД Sqlite3.
Модуль 8. Модуль Random, генерация случайных подвыборок и оценка статистических характеристик исходной выборки.
В результате обучения слушатель будет:
Знать:
Уметь:
Владеть:
уровень образования
язык программы
длительность программы
72 академических часа
за обучение
Кандидат технических наук, Доцент
Должность: Доцент отделения интеллектуальных кибернетических систем офиса образовательных программ
Успешное прохождение программы с результатом не менее 60%, в том числе - итогового тестирования с прокторингом с результатом не менее 60%