наверх

Анализ текстовых данных

Дату старта объявим позже

Дата начала записи на курс еще не объявлена

  • 12 недель

    длительность курса

  • около 5 часов в неделю

    понадобится для освоения

  • 5 зачётных единиц

    для зачета в своем вузе

Онлайн-курс  «Анализ текстовых данных» посвящён обработке текстов методами машинного обучения. В ходе обучения слушатели курса узнают о различных задачах, связанных с анализом текстов, освоят методы предобработки текстовых данных, изучат основные подходы к решению задач на основе классического машинного обучения и глубоких нейронный сетей.

О курсе

Целью курса является изучение подходов к решению основных задач автоматической обработки текстов на основе классического машинного обучения и глубоких нейронный сетей. В ходе курса слушатели освоят методы предобработки текстовых данных и научатся применять на практике основные методы классификации и кластеризации текстов, методы поиска и / или генерации ответа на вопрос и базовые методы машинного перевода.  Слушателям будут предложены тестовые задания на понимание материала, а также практические задания на программирование. 

Курс рассчитан на слушателей, имеющих базовые знания об анализе данных и машинном обучении и готовых освоить одно из наиболее перспективных и активно развивающихся направлений в этих областях. Для эффективного усвоения курса требуется базовое владение языком программирования Python и возможность проводить вычисления на графических процессорах.

Формат

Курс состоит из видеолекций, разбитых на короткие фрагменты от 8 до 15 минут длиной. Каждая лекция сопровождается оцениваемым тестом из 15-20 вопросов. В конце курса слушателей, претендующих на получение сертификата, ждет итоговый экзамен по всем материалам курса. 

Программа курса

  1. Введение + предобработка и базовые признаки
  2. Векторные представления слов
  3. Классификация текстов
  4. Синтаксис
  5. Разметка последовательности
  6. Seq2seq, MT, attention, transfromer
  7. Глубокие модели эмбеддингов текстов
  8. Улица Сезам 1
  9. Глубокие модели эмбеддингов текстов
  10. Улица Сезам 2
  11. Тематическое моделирование
  12. Суммаризация текстов
  13. QA-системы, чат-боты
  14. Графы знаний

Саркисян Вероника Вагановна


Должность: Стажер-исследователь, Научно-учебная лаборатория моделей и методов вычислительной прагматики, Факультет компьютерных наук

Артемова Екатерина Леонидовна

Кандидат технических наук, Доцент
Должность: Доцент Департамента больших данных и информационного поиска, Факультет компьютерных наук