up

Анализ текстовых данных

1 November 2022 - 1 November 2030 г.
The course has already started
2693 days
Before the end of the enrollment
  • Russian

    course language

  • 12 weeks

    course duration

  • about 5 hours per week

    needed to educate

  • 5 credit points

    for credit at your university

Курс «Сбор и анализ данных в Python» поможет овладеть навыками Data Culture

About

Онлайн-курс «Анализ текстовых данных» посвящён обработке текстов методами машинного обучения. В ходе обучения слушатели курса узнают о различных задачах, связанных с анализом текстов, освоят методы предобработки текстовых данных, изучат основные подходы к решению задач на основе классического машинного обучения и глубоких нейронный сетей. В ходе обучения слушатели курса узнают о различных задачах, связанных с анализом текстов.Целью курса является изучение подходов к решению основных задач автоматической обработки текстов на основе классического машинного обучения и глубоких нейронный сетей. В ходе курса слушатели освоят методы предобработки текстовых данных и научатся применять на практике основные методы классификации и кластеризации текстов, методы поиска и / или генерации ответа на вопрос и базовые методы машинного перевода. Слушателям будут предложены тестовые задания на понимание материала, а также практические задания на программирование. 

Курс рассчитан на слушателей, имеющих базовые знания об анализе данных и машинном обучении и готовых освоить одно из наиболее перспективных и активно развивающихся направлений в этих областях. Для эффективного усвоения курса требуется базовое владение языком программирования Python и возможность проводить вычисления на графических процессорах.

Format

Курс состоит из 12 недель. Каждая неделя содержит видеолекции, тестовые задания и материалы для самостоятельного изучения. В открытом доступе вы можете ознакомиться с видеолекциями, остальные материалы станут доступны после оплаты курса. 

Requirements

Course program

1. Введение в анализ текстов, базовые методы предобработки и выделения признаков

2. Неглубокие векторные представления слов

3. Классификация текстов

4. Разметка последовательности

5. Seq2seq, MT, attention, transformer

6. Предобученные языковые модели. Улица Сезам, часть 1

7. Предобученные языковые модели. Улица Сезам, часть 2

8. Синтаксис в рамках грамматики зависимостей

9. Тематическое моделирование

10. Суммаризация и симплификация текстов

11. QA-системы, чат-боты

12. Графы знаний

Education directions

Abilities

 Курс позволяет освоить следующие компетенции в соответствии с Рекомендациями к дополнительным профессиональным программам ИТ-профиля, реализуемым в рамках проекта «Цифровые кафедры» университета–участника программы стратегического академического лидерства «Приоритет-2030»:

Сфера: Искусственный интеллект и машинное обучение
Компетенция: Применяет искусственный интеллект и машинное обучение
Уровень: Продвинутый

Сфера: Искусственный интеллект и машинное обучение
Компетенция: Применяет математический аппарат для решения задач по оценке и разработки моделей
Уровень: Продвинутый

Сфера: Искусственный интеллект и машинное обучение
Компетенция: Решает задачи искусственного интеллекта (ИИ)
Уровень: Экспертный

Сфера: Искусственный интеллект и машинное обучение
Компетенция: Разрабатывает и применяет методы машинного обучения (МО) для решения задач
Уровень: Экспертный

После завершения курсы мы рекомендуем вам обратить внимание на курс Компьютерное зрение.

Апишев Мурат Азаматович


Position: Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук

Артемова Екатерина Леонидовна

Кандидат технических наук, Доцент
Position: Доцент Департамента больших данных и информационного поиска, Факультет компьютерных наук

Саркисян Вероника Вагановна


Position: Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук

Кирьянов Денис Павлович


Position: Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук

Аксёнов Сергей Андреевич


Position: Приглашенный преподаватель Департамента больших данных и информационного поиска, Факультет компьютерных наук

course completion certificate

Certificate

Стоимость доступа к тестовым материалам, возможность пройти экзамен с прокторингом и получить сертификат составляет 3600 рублей.

 

Similar courses