наверх

Введение в анализ данных на R для гуманитарных и социальных наук

31 июля 2024 - 1 января 2030 г.
Курс уже начался
1940 дней
До конца записи
  • Русский

    язык курса

  • 9 недель

    длительность курса

  • от 2 до 4 часов в неделю

    понадобится для освоения

  • 3 зачётных единицы

    для зачета в своем вузе

 

Курс знакомит слушателей с основами анализа и визуализации разных типов данных (табличные данные, тексты, время, географические данные). Курс рассчитан на студентов социальных и гуманитарных специальностей и не предполагает никаких предварительных знаний по программированию. В курсе будет небольшой фрагмент посвященный применению некоторых статистических методов, однако он не подойдет для изучения статистики.

О курсе

Курс предназначен для студентов в области социальных и гуманитарных наук, которые хотят научиться использовать язык программирования R для анализа и визуализации данных. Курс включает в себя следующие темы: введение в R, загрузка и трансформация данных, визуализация данных, обработка текстовых данных, работа со временем, визуализация географических данных и основы регрессионного анализа. В противовес стандартным курсам по R, обычно основанным на статистической обработке данных и их визуализации, значительная часть курса посвящена работе с различными типами данных и их визуализации, так как именно разведочная визуализация, а не применение статистических методов, имеет значение для гуманитарных и социальных специальностей. Обсуждение основ регрессионного анализа станет хорошей основой для дальнейшего изучение статистического анализа и методов машинного обучения на последующих курсах. Для работы на курсе необходимо будет установить программы R и RStudio. Пакеты, необходимые для установки, будут перечислены в ходе лекций.

Формат

Курс состоит из 9 недель. Каждая неделя содержит видеолекции, а в восьми неделях есть тестовые задания. В открытом доступе вы можете ознакомиться с видеолекциями первых двух недель, остальные материалы станут доступны после оплаты курса.

  1. Chang, Winston. R graphics cookbook: practical recipes for visualizing data. O'Reilly Media, 2018.
  2. Lovelace, Robin, Jakub Nowosad, and Jannes Muenchow. Geocomputation with R. Chapman and Hall/CRC, 2019.
  3. Silge, Julia, and David Robinson. Text mining with R: A tidy approach. O'Reilly Media, Inc., 2017.
  4. Wickham, Hadley. Ggplot2: Elegrant graphics for data analysis. Springer, 2016.
  5. Wickham, Hadley, Mine Çetinkaya-Rundel, and Garrett Grolemund. R for data science. O'Reilly Media, Inc., 2023

Требования

Обучение ведется с нуля, однако базовые элементы статистики, такие как среднее, медиана, дисперсия, подробно объясняться не будут. Знание языков программирования не является обязательным.

Программа курса

  1. Введение в R.
  2. Трансформация данных.
  3. Визуализация данных.
  4. Работа со строками.
  5. Работа с текстами.
  6. Работа со временем.
  7. Работа с геоданными.
  8. Основа регрессионного анализа.
  9. Введение в Quarto.

Результаты обучения

Вы научитесь

  • экспортировать и импортировать данные в R;
  • трансформировать данные, объединять таблицы, переводить в длинный/короткий формат;
  • визуализировать данные разных типов (категориальные, числовые) и различные отношения между ними;
  • работать со строками;
  • работать с текстовыми данными;
  • операциям с временными данными и их визуализации;
  • операциям с геоданными и их визуализации;
  • создавать документы в публикационной системе quarto;
  • основам регрессионного анализа.

Формируемые компетенции

  • Способен осуществлять поиск, критический анализ и синтез информации, применять системный подход для решения поставленных задач (УК-1).
  • Способен самостоятельно представлять научные результаты, составлять научные документы и отчеты (ОПК-3).
  • Способен разрабатывать алгоритмы и программы, пригодные для практического использования, применять основы информатики и программирования к проектированию, конструированию и тестированию программных продуктов (ОПК-6).
  • Готовность применять основные методы и инструменты разработки программного обеспечения (ПК-1).

Направления подготовки

Мороз Георгий Алексеевич


Должность: Доцент школы лингвистики, Факультет гуманитарных наук; Заведующий лабораторией, Международная лаборатория языковой конвергенции

сертификат об окончании курса

Сертификат

Стоимость доступа ко всем материалам курса, возможности пройти экзамен с прокторингом и получить сертификат составляет 3600 рублей.

Стоимость прохождения процедур оценки результатов обучения с идентификацией личности - 3600 Р.

Похожие курсы