course language
course duration
needed to educate
for credit at your university
Курс «Анализ текстовых данных» поможет овладеть навыками Data Culture.
Онлайн-курс «Анализ текстовых данных» посвящён обработке текстов методами машинного обучения. В ходе обучения слушатели курса узнают о различных задачах, связанных с анализом текстов, освоят методы предобработки текстовых данных, изучат основные подходы к решению задач на основе классического машинного обучения и глубоких нейронный сетей. В ходе обучения слушатели курса узнают о различных задачах, связанных с анализом текстов. Целью курса является изучение подходов к решению основных задач автоматической обработки текстов на основе классического машинного обучения и глубоких нейронный сетей. В ходе курса слушатели освоят методы предобработки текстовых данных и научатся применять на практике основные методы классификации и кластеризации текстов, методы поиска и / или генерации ответа на вопрос и базовые методы машинного перевода. Слушателям будут предложены тестовые задания на понимание материала, а также практические задания на программирование.
Курс рассчитан на слушателей, имеющих базовые знания об анализе данных и машинном обучении и готовых освоить одно из наиболее перспективных и активно развивающихся направлений в этих областях. Для эффективного усвоения курса требуется базовое владение языком программирования Python и возможность проводить вычисления на графических процессорах.
Курс состоит из 12 недель. Каждая неделя содержит видеолекции, тестовые задания и материалы для самостоятельного изучения. В открытом доступе вы можете ознакомиться с видеолекциями, доступ к оцениваемым заданиям и экзамену с прокторингом станет доступен после оплаты курса.
Перед изучением курса мы рекомендуем вам изучить курсы Основы машинного обучения и Продвинутые методы машинного обучения, а также Python как иностранный или Основы программирования на Python.
1. Введение в анализ текстов, базовые методы предобработки и выделения признаков
2. Неглубокие векторные представления слов
3. Классификация текстов
4. Разметка последовательности
5. Seq2seq, MT, attention, transformer
6. Предобученные языковые модели. Улица Сезам, часть 1
7. Предобученные языковые модели. Улица Сезам, часть 2
8. Синтаксис в рамках грамматики зависимостей
9. Тематическое моделирование
10. Суммаризация и симплификация текстов
11. QA-системы, чат-боты
12. Графы знаний
Знает:
Умеет:
Владеет:
Курс позволяет освоить следующие компетенции в соответствии с Рекомендациями к дополнительным профессиональным программам ИТ-профиля, реализуемым в рамках проекта «Цифровые кафедры» университета–участника программы стратегического академического лидерства «Приоритет-2030»:
Сфера: Искусственный интеллект и машинное обучение
Компетенция: Применяет искусственный интеллект и машинное обучение
Уровень: Продвинутый
Сфера: Искусственный интеллект и машинное обучение
Компетенция: Применяет математический аппарат для решения задач по оценке и разработки моделей
Уровень: Продвинутый
Сфера: Искусственный интеллект и машинное обучение
Компетенция: Решает задачи искусственного интеллекта (ИИ)
Уровень: Экспертный
Сфера: Искусственный интеллект и машинное обучение
Компетенция: Разрабатывает и применяет методы машинного обучения (МО) для решения задач
Уровень: Экспертный
После завершения курса мы рекомендуем вам обратить внимание на курс Компьютерное зрение.
course language
course duration
needed to educate
for credit at your university
Position: Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук
Кандидат технических наук, Доцент
Position: Доцент Департамента больших данных и информационного поиска, Факультет компьютерных наук
Position: Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук
Position: Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук
Position: Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук
Стоимость доступа к оцениваемым заданиям и возможности пройти экзамен с прокторингом для получения сертификата по курсу составляет 3600 рублей.
The cost of passing the procedures for assessing learning outcomes with personal identification - 3600 Р.