up

Основы программирования на языке Python для интеллектуального анализа данных

  • Russian

    course language

  • 6 weeks

    course duration

  • from 5 to 6 hours per week

    needed to educate

  • 2 credit points

    for credit at your university

Курс «Основы программирования на языке Python для интеллектуального анализа данных» направлен на изучение базовых положений, принципов и основ интеллектуального анализа данных на примере популярного в IT-индустрии, а также в разных отраслях, языка программирования Python. 

Практическая часть данного курса ориентирована на реальную работу с анализом цифровых данных, основанную на базовых алгоритмических конструкциях с использованием современных средств интеллектуального анализа данных.

Разработка ведётся с применением библиотек numpy, pandas, seaborn  и др. В рамках курса предлагается большое количество практических заданий и примеров, подлежащих как самостоятельному решению, так и демонстрируемых преподавателем.

About

Курс состоит из 6 разделов, изучив которые, слушатель получит необходимый минимум для анализа данных, используя язык программирования Python. Изучение строится на теоретических основах математики, информатики, логики и математической статистики.

Содержание курса включает в себя большую подборку практических примеров, а также заданий для самостоятельного решения, которые помогут лучше понять и отработать пройденный материал. Полученные знания и умения помогут развить навык алгоритмического мышления и работать с большими массивами информации посредством интеллектуального анализа данных.

В курсе собран необходимый теоретический минимум, позволяющий без особого труда погрузиться в сферу разработки и интеллектуального анализа данных, понять основные принципы и отработать их практическими заданиями.

В первом модуле курса объясняется причина выбора языка программирования Python, изложен порядок настройки окружения, готовности рабочего места и указания по исправлению типичных ошибок.

Второй модуль помогает разобраться с представлением и хранением данных в компьютере, базовой математикой в программировании и способах конвертации данных между собой.

Третий модуль показывает способы как избежать рутинных задач по средствам автоматизации выполнения однотипных действий проверки и повтора.

Четвертый модуль направлен на знакомство с базовым принципом программирования - don't repeat yourself и знакомство с "синтаксическим сахаром" языка Python.

Пятый модуль демонстрирует работу с файлами и сторонними библиотеками.

Шестой модуль знакомит с основными библиотеками анализа данных и визуализации и позволяет студентам самостоятельно проанализировать датасет Titanic, являющийся золотым стандартом для первоначального погружения в область интеллектуального анализа данных с помощью современных языков программирования.

Все лекционные материалы, приведенные в курсе, подкрепляются практическими примерами из предметной области и демонстрирующими работу предлагаемых алгоритмов. 

Format

Обучение в онлайн формате. 

видеолекции продолжительностью до 15 минут

анимационные ролики с инфографикой

материалы для самостоятельного изучения 

тесты в конце разделов для закрепления знаний

 

1. Марк Лутц, Изучаем Python. Том 2, Издание 5-е, перевод с английского. СПб.: ООО "Диалектика", 2020. — 720 с. 

2. Постолит А. В., Основы искусственного интеллекта в примерах на Python. Самоучитель. СПб.: БХВ-Петербург, 2021. - 448 с.

3. https://api.telegram.org/

4. https://docs.python.org/3/

5. https://pypi.org/

Requirements

Для полноценного освоения учебного материала по дисциплине студент должен:

- знать основы теории множеств, начальный уровень;
- знать школьную алгебру и начала анализа, начальный уровень;
- знать основы математической статистики, начальный уровень;
- быть уверенным пользователем компьютера;

Course program

Раздел 1. Введение в язык программирования Python и интеллектуальный анализ данных
1.1 Введение. Цели, задачи, структура и технология изучения курса. 
1.2. Почему выбрали Python
1.3 Обзор методов и задач интеллектуального анализа данных для их решения с помощью Python
1.4 Базовые понятия программирования. Подготовка рабочего места для MS Windows и macOS (практическая часть)
1.5 Структура программы на языке Python. Первые программы. (практическая часть)
1.6 Ключевые слова, идентификаторы, литералы (практическая часть)
1.7 Триумвират программирования: алгоритм, блок-схема, программа (практическая часть)

Раздел 2. Основные типы данных и математические операции для анализа данных на Python
2.1 Введение в данные и отличия разных типов данных (практическая часть)
2.2 Операторы (практическая часть)
2.3 Числа (практическая часть)
2.4 Строки (практическая часть)
2.5 Списки, индексы и срезы (практическая часть)
2.6 Множества, кортежи и словари (практическая часть)
2.7 Пользовательский ввод и преобразование типов (практическая часть)

Раздел 3. Логические операции, операторы ветвления, циклы и сортировки в анализе данных на Python
3.1 Увлекательная математическая логика
3.2 Логические связки (практическая часть)
3.3 Операторы if-else, elif (практическая часть)
3.4 Цикл while (практическая часть)
3.5 Цикл for (практическая часть)
3.6 Сортировки (практическая часть)
3.7 Знакомство с теорией алгоритмов (практическая часть)

Раздел 4. Основы функционального программирования на Python для решения задач анализа данных
4.1 Виды функций (практическая часть)
4.2 Область видимости переменных (практическая часть)
4.3 Аргументы функций (практическая часть)
4.4 Оператор return (практическая часть)
4.5 Рекурсия (практическая часть)
4.6 Документирование (практическая часть)
4.7 lambda (практическая часть)
4.8 List comprehension (практическая часть)

Раздел 5. Работа с базами данных и различными текстовыми форматами данных для решения задач анализа данных на Python
5.1 Дополнительные средства для работы с Python. Терминал (консоль) (практическая часть)
5.2 Виртуальное окружение
5.3 Сторонние пакеты и pip (практическая часть)
5.4 Текстовые данные (практическая часть)
5.5 CSV-файлы (практическая часть)
5.6 Необычный текст: JavaScript Object Notation (практическая часть)
5.7 Подключения к хранилищам данных (практическая часть)

Раздел 6. Практическое применение интеллектуального анализа данных на примере реального проекта над набором данных Titanic
6.1 Основы работы с открытыми источниками данных в Интернете
6.2 Введение в библиотеку numpy (практическая часть)
6.3 Практическая реализация методов библиотеки numpy (подсчёт базовых математических статистик) (практическая часть)
6.4 Введение в библиотеку pandas (практическая часть)
6.5 Практическая реализация методов библиотеки pandas (обработка данных) (практическая часть)
6.6 Введение в библиотеку seaborn (практическая часть)
6.7 Практическая реализация методов библиотеки seaborn (построение разных типов графиков) (практическая часть)
 

Education results

В ходе освоения курса обучаемый будет знать:

- классические алгоритмы поиска и способ их использования в готовых библиотеках;

- классические алгоритмы упорядочивания и способ их использования в готовых библиотеках;

- основные варианты постановок задач связанных с разработкой чат-ботов;

- современные программные средства для решения задач интеллектуального анализа цифровых данных;

- современные программные средства для решения задач визуализации цифровых данных;

Formed competencies

ОПК-2: Способен разрабатывать оригинальные алгоритмы и программные средства, в том числе с использованием современных интеллектуальных технологий, для решения профессиональных задач
ОПК-4: Способен применять на практике новые научные принципы и методы исследований
УК-1: Способен демонстрировать глубокое знание и понимание фундаментальных наук, а также знания в междисциплинарных областях профессиональной деятельности
ОПК-2: Способен разрабатывать оригинальные алгоритмы и программные средства, в том числе с использованием современных интеллектуальных технологий, для решения профессиональных задач
ПК-3: Способен на деятельность, направленную на решение задач аналитического характера, предполагающих выбор и многообразие актуальных способов решения задач
УК-3: Способен: - проектировать и разрабатывать продукцию, процессы и системы в условиях неопределенности и альтернативных решений в рамках междисциплинарных областей; - выбрать и применять передовые методы и технологии проектирования или использовать творческий подход для разработки новых и оригинальных методов проектирования и разработки
 

Education directions

Отзывы о курсе

Павлов Илья Андреевич


Position: Старший аналитик. Группа разработки платформы аналитики.

Similar courses