up

Смешанные линейные модели

Научитесь работать со сложно структурированными данными

1 June 2022 - 31 December 2025 г.
The program has already started
247 days
Before the end of the enrollment
  • Additional education for children and adults

    level of education

  • Russian

    program language

  • 4 weeks

    program duration

  • about 6 hours per week

    needed to educate

  • 1 credit points

    36 academic hour

  • Cost 3 600 Р

    for studying

Этот курс подойдет людям, которым необходимо анализировать данные, наблюдения в которых не являются независимыми друг от друга (например, семьи, повторные измерения и т.п.). Курс рассчитан на тех, кто освоил базовые приемы регрессионного анализа с использованием языка R, знаком с методом максимального правдоподобия и с обобщенными линейными моделями.

About program

Иногда приходится работать с очень сложно структурированными данными. Например, регрессионная модель может описывать несколько семей, из которых было отобрано по несколько человек. В подобных исследованиях будет нарушен базовый принцип статистического анализа — независимость наблюдений в выборке: люди из одной семьи будут более похожи друг на друга, а их свойства не будут независимы. В таких случаях применяются смешанные линейные модели, которые включают помимо интересующих исследователя предикторов, еще и случайные группирующие факторы (например, фактор “семья”). На примере смешанных моделей с нормальным распределением зависимой переменной мы обсудим способы тонкого моделирования взаимозависимостей наблюдений (моделирование структуры дисперсии). Наконец, мы рассмотрим, как строятся обобщенные смешанные линейные модели, описывающие поведение бинарных и счетных данных.

Format

Форма обучения заочная (дистанционная). Еженедельные занятия будут включать просмотр тематических видеолекций, изучение дополнительных материалов и выполнение тестовых заданий с автоматизированной проверкой результатов, тестирование по пройденному материалу.

Study plan

1. Знакомство со смешанными линейными моделями

2. Моделирование структуры дисперсии в смешанных моделях

3. Смешанные линейные модели для счетных данных

4. Смешанные линейные модели для бинарных данных

Education results

Вы научитесь:

  • распознавать случайные факторы и понимать особенности моделирования группирующих факторов при помощи фиксированных и случайных эффектов;
  • записывать смешанную модель со случайным отрезком и/или случайным углом наклона в виде уравнения и с использованием функций специализированного пакета R;
  • рассчитывать и интерпретировать коэффициенты внутриклассовой корреляции;
  • проводить диагностику обобщенных смешанных линейных моделей с нормальным распределением отклика;
  • корректно применять методы тестирования гипотез в смешанных моделях и интерпретировать результаты;
  • визуализировать смешанную модель с учетом и без учета влияния случайного фактора;
  • описывать связь дисперсии с разным типами ковариат дисперсии;
  • вводить элементы, моделирующие структуру дисперсии в простые и смешанные линейные модели, основанные на нормальном распределении переменной отклика;
  •  распознавать признаки гетероскедастичности;
  • подбирать модель с оптимальной структурой дисперсии с использованием информационных критериев;
  • трактовать модели, включающие моделирование связи дисперсии с ковариатой;
  • записывать обобщенную смешанную линейную модель для счетных величин;
  • обнаруживать признаки избыточности дисперсии;
  • подбирать модели, основанные на распределении Пуассона и отрицательном биномиальном распределении;
  • интерпретировать коэффициенты моделей, основанных на счетных данных, с учетом функции связи;
  • проводить пост-хок тесты для обобщенных смешанных моделей;
  • визуализировать обобщенные смешанные модели для счетных величин;
  • записывать обобщенную смешанную линейную модель с бинарной переменной-откликом;
  • изменять настройки подбора модели в случае если стандартные параметры приводят к сбоям;
  • обнаруживать признаки избыточности дисперсии в моделях с бинарным откликом;
  • визуализировать обобщенные смешанные модели для бинарных данных;
  • создавать отчеты в формате html при помощи rmarkdown/knitr об анализе данных с помощью обобщенной смешанной линейной модели.

Education directions

Хайтов Вадим Михайлович

Кандидат биологических наук
Position: доцент

Варфоломеева Марина Александровна

PhD СПбГУ
Position: старший преподаватель кафедры зоологии беспозвоночных

Сертификат выдается при условии успешного выполнения контрольных заданий по материалам каждого модуля и выполнения проекта.

Courses in program