up

Линейные модели с дискретными предикторами

Start date will be announced later

Start date for course enrollment has not been announced yet

  • Russian

    course language

  • 5 weeks

    course duration

  • от 6 до 7 часов в неделю

    needed to educate

  • 1 credit points

    for credit at your university

Курс реализуется в разделе "Программы" - Линейные модели с дискретными предикторами

Необходимость описать закономерности изменения количественной переменной в нескольких группах возникает часто, например, если перед вами данные эксперимента. Дисперсионный анализ - это один из методов, который позволяет эффективно решать такие задачи, особенно, если таких групп больше чем две (однофакторный дисперсионный анализ), или группировка задается несколькими факторами (многофакторный дисперсионный анализ).

About

В этом курсе вы узнаете, что в рамках парадигмы линейных моделей вполне можно работать не только с непрерывными, но и с дискретными предикторами - а иногда это даже приходится делать одновременно (как в ковариационном анализе и др.). Мы разберем несколько вариантов представления дискретных предикторов в линейных моделях и последствия разных способов кодирования для интерпретации модели. Вы научитесь подбирать линейные модели со взаимодействием факторов, чтобы описывать ситуации, когда характер действия фактора меняется в разных группах. В этом курсе для анализа и визуализации линейных моделей мы будем использовать язык статистического программирования R. Его богатейшие возможности позволят вам разобраться в тонкостях внутреннего устройства линейных моделей с дискретными и непрерывными предикторами.

Этот курс ориентирован на людей, которые хотят научиться описывать закономерности поведения количественных величин в зависимости от дискретных факторов. Курс рассчитан на тех, кто освоил базовые приемы регрессионного анализа с использованием языка R и  создание простейших .html документов при помощи rmarkdown и knitr.

Format

Форма обучения заочная (дистанционная). Еженедельные занятия будут включать просмотр тематических видеолекций, изучение дополнительных материалов и выполнение тестовых заданий с автоматизированной проверкой результатов, тестирование по пройденному материалу. 

Обращаем внимание, что курс реализуется в формате программы, записаться на нее можно по ссылке.

Requirements

Курс рассчитан на тех, кто освоил базовые приемы регрессионного анализа с использованием языка R и  создание простейших .html документов при помощи rmarkdown и knitr.

Перед изучением данного курса стоит освоить предыдущие курсы программы "Просто о статистике (с применением R)"

Course program

Курс состоит из 4 модулей:

1) Модели с дискретными и непрерывными предикторами

Дискретные предикторы кодируют принадлежность объекта к каким-то дискретным группам. В этом модуле вы узнаете, что эти неведомые предикторы не так уж чужды обычным линейным моделям и регрессионные методы вполне можно применять для их анализа. Для начала мы поговорим о том, как можно их закодировать. Вы начнете знакомство со взаимодействием дискретных и непрерывных предикторов, и оно продолжится в следующем модуле. А в этом мы разберем поведение дискретных предикторов в моделях без взаимодействия.

2) Модели с разными значениями угла наклона для групп

В случае, когда зависимость количественных величин выглядит по-разному для разных групп дискретного фактора, мы говорим, что между непрерывным и дискретным предиктором есть взаимодействие. В этом модуле вы научитесь строить и описывать линейные модели для анализа такого рода данных. Мы будем использовать технику сравнения вложенных моделей при помощи частного F-критерия для того, чтобы из сложной модели со множеством взаимодействий получить более простую. Наконец, вы увидите, что интерпретация моделей, в которых есть значимое взаимодействие, значительно упрощается, если можно построить график их предсказаний.

3) Однофакторный дисперсионный анализ

В одном из предыдущих курсов специализации мы с вами научились решать задачу сравнения значений в дискретных группах при помощи t-критерия. На самом деле, эту же задачу можно эффективно решить, оставаясь в рамках линейных моделей - при помощи дисперсионного анализа. Этот метод позволяет одновременно искать различия между множеством групп, заданных множеством дискретных факторов. В этом модуле вы познакомитесь с устройством однофакторного дисперсионного анализа и научитесь не только тестировать с его помощью значимость влияния дискретных факторов, но и выяснять при помощи пост хок тестов, с различиями каких именно групп связано это влияние.

4) Многофакторный дисперсионный анализ

Многофакторный дисперсионный анализ - это мощный метод, который позволяет выявлять влияние нескольких дискретных предикторов на непрерывную зависимую переменную. В этом модуле мы подробно обсудим проблему взаимодействия дискретных факторов, возникающую в такого рода анализах. Далее мы обсудим анализ данных с разным числом наблюдений в группах. Вы узнаете, что результаты дисперсионного анализа таких несбалансированных данных зависят от порядка тестирования гипотез, и в определенных случаях важно выбрать правильный способ параметризации линейной модели. Наконец, мы расскажем вам о трюке, который можно использовать для проведения пост хок теста для взаимодействия факторов в R. Закрепить свои знания об анализе линейных моделей, включающих дискретные предикторы, вы сможете, выполнив проект по анализу данных. Результаты этого анализа нужно будет представить в виде отчета в формате html, написанного при помощи rmarkdown/knitr

Education directions

Knowledge

Вы узнаете:

  • что такое взаимодействие дискретного и непрерывного предикторов;
  • из чего складывается общая изменчивость зависимой переменной в линейной модели, используемой в дисперсионном анализе;
  •  что такое пост хок тест и в чем его отличие от запланированных сравнений;
  • каким образом в дисперсионном анализе происходит тестирование гипотезы о равенстве средних в группах при помощи F-теста;
  • что такое взаимодействие дискретных факторов и уметь распознавать его на графиках;
  • каким образом присутствие взаимодействия факторов может повлиять на интерпретацию результатов дисперсионного анализа;
  • последствия несбалансированности для последовательности действий в дисперсионном анализе;
  • разницу последовательности тестирования гипотез в дисперсионном анализе для несбалансированных данных (типы сумм квадратов).

Skills

Вы научитесь:

  • кодировать дискретные предикторы для использования в линейных моделях в виде переменных-индикаторов;
  • определять наличие взаимодействия по графику предсказаний модели и при помощи тестов;
  • проводить диагностику линейной модели с дискретными предикторами при помощи анализа остатков;
  • интерпретировать смысл коэффициентов линейной модели с непрерывным и одним дискретным предиктором в параметризации индикаторов;
  • строить линейный график предсказаний линейной модели с учетом разного диапазона значений непрерывного предиктора для разных уровней дискретного;
  • представлять результаты ковариационного анализа в виде линейного столбчатого графика со скорректированными средними значениями;
  • записывать уравнения в параметризации индикаторов для моделей с непрерывными и дискретными предикторами, включающих взаимодействие;
  • интерпретировать результаты подбора модели со взаимодействием непрерывных и дискретных предикторов, опираясь на значения коэффициентов;
  • проверять значимость взаимодействия дискретных и непрерывных предикторов;
  • конструировать модельную матрицу для линейной модели, включающей непрерывный и дискретный предикторы и их взаимодействие;
  • упрощать сложную множественную модель со взаимодействием дискретного и непрерывного предикторов, сравнивая вложенные модели при помощи частного F-критерия;
  • интерпретировать смысл взаимодействия дискретного и непрерывного предикторов при помощи графика предсказаний линейной модели;
  • записывать линейную модель для однофакторного дисперсионного анализа в виде уравнения с использованием параметризации индикаторов или параметризации эффектов и интерпретировать его коэффициенты;
  • проводить однофакторный дисперсионный анализ, интерпретировать и представлять его результаты в тексте и в виде таблицы;
  • проверять условия применимости дисперсионного анализа при помощи анализа остатков линейной модели;
  • проводить пост хок тесты при помощи теста Тьюки и объяснить его принцип действия;
  • визуализировать результаты однофакторного дисперсионного анализа с учетом результатов пост хок тестов;
  • записывать модель двухфакторного дисперсионного анализа в параметризации индикаторов и в параметризации эффектов;
  • проводить пост хок тесты в случае, если взаимодействие факторов в дисперсионном анализе оказалось значимо, и представлять их результаты;
  • проводить отчет в формате html при помощи rmarkdown/knitr об анализе данных с помощью линейной модели, содержащей дискретные предикторы.

Варфоломеева Марина Александровна

PhD СПбГУ
Position: старший преподаватель кафедры зоологии беспозвоночных

Хайтов Вадим Михайлович

Кандидат биологических наук
Position: доцент

Similar courses