наверх
  • Русский

    язык курса

  • 8 недель

    длительность курса

  • около 4 часов в неделю

    понадобится для освоения

  • 3 зачётных единицы

    для зачета в своем вузе

О курсе

Углубленный курс по основам программирования на языке Python для всех, кто работает с текстами (скачивает, обрабатывает, анализирует их).

Цели курса:

  • Овладеть базовыми навыками Python для работы с текстовыми данными
  • Научиться автоматическому сбору информации из интернета
  • Применять сетевой анализ, тематическое моделирование, находить тональность текстов с помощью Python

Формат

Курс состоит из 8 недель. Каждая неделя содержит видеолекции, задания и материалы для самостоятельного изучения. В открытом доступе вы можете ознакомиться с видеолекциями первых двух недель, остальные материалы станут доступны после оплаты курса.

Базовый учебник:

Chhibber, A. (2017). Natural Language Processing (NLP) Using Python.

Основная литература:

NLP with Python: Introduction to NLTK. (2020).

Дополнительная литература:

NLP with Python: Introduction to Bag of Words. (2020).

NLP with Python: Introduction to n-Grams. (2020).

NLP with Python: Text Cleaning. (2020).

NLP with Python: Text Classification. (2020).

Mastering NLP from Foundations to LLMs: Apply advanced rule-based techniques to LLMs and solve real-world business problems using Python. Institute of Electrical and Electronics Engineers - IEEE; 2024.

Требования

Предварительные требования к слушателям:

  • Владение базовым Python приветствуется, но не является обязательным.

Необходимое материальное и программное обеспечение:

  • IDE Jupyter Notebook, VSCode
  • NLP (обработка естественного языка)
  • Анализировать комментарии и отзывы на продукты
  • Автоматически собирать данных из интернета
  • Делать частотный анализ текстов
  • Делать сетевой анализ и тематическое моделирование

Программа курса

Неделя 1. Обработка естественного языка

Неделя 2. Анализ комментариев

Неделя 3. Автоматический сбор данных из интернета

Неделя 4. Работа с API

Неделя 5. Анализ больших текстов

Неделя 6. Сетевой анализ

Неделя 7. Тематическое моделирование

Неделя 8. Подготовка к экзамену

Экзамен

Результаты обучения

Слушатель узнает:

  • Как программно скачивать и обрабатывать большие объемы текстовых данных
  • Как анализировать части речи, удалять стоп-слова, исправлять орфографию
  • Как работать с англоязычными и русскоязычными текстами
  • Как визуализировать и интерпретировать полученные результаты

Формируемые компетенции

Способен осуществлять поиск, критический анализ и синтез информации, применять системный подход для решения поставленных задач (УК-1).

Способен определять круг задач в рамках поставленной цели и выбирать оптимальные способы их решения, исходя из действующих правовых норм, имеющихся ресурсов и ограничений (УК-2).

Способен к ведению профессиональной деятельности с опорой на основы математических дисциплин, необходимых для формализации лингвистических знаний и процедур анализа и синтеза лингвистических структур (ОПК-2)

Направления подготовки

 

Для кого подойдет курс:
1. Бизнес, которому важна коммуникация с клиентами (отзывы, тональность);
2.Социологи, которым нужно находить, собирать и обрабатывать большие объемы текстовых и табличных данных (количественная/качественная информация);
3. Маркетологи, которым нужно собирать информацию о потенциальных клиентах;
4. Академическое сообщество, которое занимается анализом больших данных (как количественных, так и качественных).

Бурова Маргарита Борисовна

Магистр
Должность: Старший преподаватель Департамента больших данных и информационного поиска Факультута компьютерных наук, академический руководитель образовательной программы "Магистр по наукам о данных" Факультета компьютерных наук, преподаватель Центра непрерывного образования Факультета компьютерных наук

Касьяненко Дарья Алексеевна


Должность: Старший преподаватель департамента больших данных и информационного поиска ФКН НИУ ВШЭ //Эксперт центра непрерывного образования ФКН

Похожие курсы