наверх

Смешанные линейные модели

Научитесь работать со сложно структурированными данными

1 июня 2022 - 31 декабря 2024 г.
Программа уже началась
39 дней
До конца записи
  • Дополнительное образование для детей и взрослых

    уровень образования

  • Русский

    язык программы

  • 4 недели

    длительность программы

  • около 6 часов в неделю

    понадобится для освоения

  • 1 зачётная единица

    36 академических часов

  • Стоимость 3 600 Р

    за обучение

Этот курс подойдет людям, которым необходимо анализировать данные, наблюдения в которых не являются независимыми друг от друга (например, семьи, повторные измерения и т.п.). Курс рассчитан на тех, кто освоил базовые приемы регрессионного анализа с использованием языка R, знаком с методом максимального правдоподобия и с обобщенными линейными моделями.

О программе

Иногда приходится работать с очень сложно структурированными данными. Например, регрессионная модель может описывать несколько семей, из которых было отобрано по несколько человек. В подобных исследованиях будет нарушен базовый принцип статистического анализа — независимость наблюдений в выборке: люди из одной семьи будут более похожи друг на друга, а их свойства не будут независимы. В таких случаях применяются смешанные линейные модели, которые включают помимо интересующих исследователя предикторов, еще и случайные группирующие факторы (например, фактор “семья”). На примере смешанных моделей с нормальным распределением зависимой переменной мы обсудим способы тонкого моделирования взаимозависимостей наблюдений (моделирование структуры дисперсии). Наконец, мы рассмотрим, как строятся обобщенные смешанные линейные модели, описывающие поведение бинарных и счетных данных.

Формат

Форма обучения заочная (дистанционная). Еженедельные занятия будут включать просмотр тематических видеолекций, изучение дополнительных материалов и выполнение тестовых заданий с автоматизированной проверкой результатов, тестирование по пройденному материалу.

Программа обучения

1. Знакомство со смешанными линейными моделями

2. Моделирование структуры дисперсии в смешанных моделях

3. Смешанные линейные модели для счетных данных

4. Смешанные линейные модели для бинарных данных

Результаты обучения

Вы научитесь:

  • распознавать случайные факторы и понимать особенности моделирования группирующих факторов при помощи фиксированных и случайных эффектов;
  • записывать смешанную модель со случайным отрезком и/или случайным углом наклона в виде уравнения и с использованием функций специализированного пакета R;
  • рассчитывать и интерпретировать коэффициенты внутриклассовой корреляции;
  • проводить диагностику обобщенных смешанных линейных моделей с нормальным распределением отклика;
  • корректно применять методы тестирования гипотез в смешанных моделях и интерпретировать результаты;
  • визуализировать смешанную модель с учетом и без учета влияния случайного фактора;
  • описывать связь дисперсии с разным типами ковариат дисперсии;
  • вводить элементы, моделирующие структуру дисперсии в простые и смешанные линейные модели, основанные на нормальном распределении переменной отклика;
  •  распознавать признаки гетероскедастичности;
  • подбирать модель с оптимальной структурой дисперсии с использованием информационных критериев;
  • трактовать модели, включающие моделирование связи дисперсии с ковариатой;
  • записывать обобщенную смешанную линейную модель для счетных величин;
  • обнаруживать признаки избыточности дисперсии;
  • подбирать модели, основанные на распределении Пуассона и отрицательном биномиальном распределении;
  • интерпретировать коэффициенты моделей, основанных на счетных данных, с учетом функции связи;
  • проводить пост-хок тесты для обобщенных смешанных моделей;
  • визуализировать обобщенные смешанные модели для счетных величин;
  • записывать обобщенную смешанную линейную модель с бинарной переменной-откликом;
  • изменять настройки подбора модели в случае если стандартные параметры приводят к сбоям;
  • обнаруживать признаки избыточности дисперсии в моделях с бинарным откликом;
  • визуализировать обобщенные смешанные модели для бинарных данных;
  • создавать отчеты в формате html при помощи rmarkdown/knitr об анализе данных с помощью обобщенной смешанной линейной модели.

Направления подготовки

Хайтов Вадим Михайлович

Кандидат биологических наук
Должность: доцент

Варфоломеева Марина Александровна

PhD СПбГУ
Должность: старший преподаватель кафедры зоологии беспозвоночных

Сертификат выдается при условии успешного выполнения контрольных заданий по материалам каждого модуля и выполнения проекта.

Курсы в программе