В курсе изучаются основные подходы и библиотеки обработки и визуализации данных в языке Python. Слушатели учатся методам работы с разными типами данных – от слабоструктурированных, до табличных, а также учатся решать практические задания по подготовке данных, с использованием открытых наборов данных и API. В курсе слушатели знакомятся с библиотеками, которые необходимы для эффективного решения широкого круга аналитических задач, такими как Ipython, Pandas, Numpy, Matplotlib и Scikit-learn, и др.
Стоимость доступа к материалам курса за исключением ознакомительной части (включая тестовые материалы и возможность пройти экзамен с прокторингом и получить сертификат) составляет 3600 рублей. Для этого нужно пройти текущее тестирование не меньше чем на 60% и итоговый тест не меньше чем на 60%.
Модуль 1. IPython: интерактивные вычисления и среда разработки. Облачная среда вычислений Google Colab.
Модуль 2. Основы работы с модулем Pandas. Датафреймы и базовые операции над ними.
Модуль 3. Чтение и запись данных, форматы файлов. Библиотека Os.
Модуль 4. Переформатирование данных: очистка, преобразование, слияние, изменение формы .
Модуль 5. Агрегирование данных и групповые операции.
Модуль 6. Основы работы с модулем NumPy: массивы и векторные вычисления.
Модуль 7. Построение графиков и визуализация. Библиотека Matplotlib.
Модуль 8. Временные ряды. Передискретизация периодов. Скользящее среднее.
Знание специализированных библиотек Python для анализа данных.
Умение разрабатывать прикладные программы на языке программирования Python.
Практический навык использования набора библиотек языка Python для прикладных задач в области анализа данных.
В результате обучения по курсу слушатель будет:
Знать:
Уметь:
Владеть:
На текущий момент запись на курс завершена