Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
RCoreTeam2014.docx
Скачиваний:
48
Добавлен:
08.10.2015
Размер:
539.13 Кб
Скачать
    1. Дисперсионный анализ и сравнение модели

Функция подгонки модели aov(формула, data=data.frame)работает на самом простом уровне очень похожим способом как функцияlm(), и большинство универсальных функций, перечисленных в таблице вРазделе 11.3 [Универсальные функции для извлечения информацию о модели].

Нужно отметить, что дополнительно aov()позволяет анализировать модели с множественными слоями ошибок, такими как рисунками разделенных экспериментов, или сбалансированные неполноблочные планы с восстановлением межблочной информации. Формула модели:

response ~ mean.formula + Error(strata.formula)

указывает на многослойный эксперимент с ошибками слоев определенными strata.formula. В самом простом случаеstrata.formula- просто фактор, когда определяет два слоя эксперимента, а именно, между и внутри уровней фактора.

Например, со всеми определенными переменными факторами, формула модели выглядит следующим образом:

> fm <- aov(yield ~ v + n*p*k + Error(farms/blocks), data=farm.data)

и обычно используется для описания эксперимента со средней модели v + n*p*kи тремя слоями ошибок, а именно: "между farms", "внутри farms, между bloks" и "в рамках blocks".

      1. Таблицы anova

Заметим также, что анализ дисперсионных таблиц (или таблицы) выполняется для последовательности подогнанных моделей. Суммы квадратов показывают уменьшение суммы квадратов остатков в результате включения конкретногопараметра в модель вопределенноеместо последовательности. Следовательно, только для ортогональных экспериментов порядок включения будет несущественным.

Для многослойного эксперимента начинают процедуру проекцией отклика на слои ошибки, по порядку, и затем подгоняют модельное среднее для каждой проекции. Более подробную информацию см. Chambers & Hastie (1992).

Более гибкую альтернативу полной таблице ANOVA по умолчанию, для сравнения двух или более моделей можно непосредственно использовать функцию anova().

> anova(fitted.model.1, fitted.model.2, ...)

В результате отображается таблица различий ANOVA между подогнанными моделями, при подгонке по порядку. Подогнанные модели сравниваются, конечно, как правило, в иерархической последовательности. Это не дает информацию, отличную от способа по умолчанию, а просто проще для понимания и контроля.

    1. Обновление подогнанных моделей

Функция update()в значительной степени функция для удобства, которая подгоняет модель с отличиями от ранее подогнанной обычно только несколькими дополнительными или удаленными параметрами. Ее синтаксис:

> new.model <- update(old.model, new.formula)

В new.formulaспециальное имя, состоящее из точки '.', которая используется для обозначения “соответствующей части старой формулы модели”. Например,

> fm05 <- lm(y ~ x1 + x2 + x3 + x4 + x5, data = production)

> fm6 <- update(fm05, . ~ . + x6)

> smf6 <- update(fm6, sqrt(.) ~ .)

подгоняет множественную регрессию с пятью случайным переменным (по-видимому) из фрейма данных production, подгоняет дополнительную модель, включая шестой регрессор, и подгоняет разновидность модели, где к отклику применили преобразование квадратного корня.

Заметим особенно, что, если data= параметр специфицируется в исходном вызове функции подгонки модели, то эта информация передана через подогнанный объект модели в update() и его союзники.

Имя '.' может также использоваться в других контекстах, но с немного отличающимся значением. Например

> fmfull <- lm(y ~ . , data = production) подогнал бы модели откликомy и переменными регрессоров все другие переменные во фреймах данныхproduction.

Другие функции для исследования дополнительных последовательностей моделей являются add1(),drop1()иandstep(). Имена их дают указание на цель их использования, но для полного изложения см. онлайновую справку.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]