Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
RCoreTeam2014.docx
Скачиваний:
46
Добавлен:
08.10.2015
Размер:
539.13 Кб
Скачать
      1. Противопоставления

Мы нуждаемся, по крайней мере, в некоторой идее, как формулы модели описывают столбцы матрицы модели. Это просто для непрерывных переменных, поскольку каждая обеспечивает один столбец матрицы модели (и свободный член задает столбец из единиц, если он включен в модель).

Что относительно k-уровневого фактораA? Ответ отличается для неупорядоченных и упорядоченных факторов. Для неупорядоченных факторовk-1столбец генерируются для показатели второго, ...,k-гоуровней фактора. (Таким образом, применяемая параметризация создает на каждом уровне такой же контраст откликов, что и на первом.) Для упорядоченных факторов,k-1столбцы являются ортогональными полиномами по основанию1, ..., k, исключая параметры константы.

Хотя ответ уже дан, но это еще не все. Во-первых, если смещение опущено в модели, которая содержит факторный параметр, первое, такой параметр закодирован в kстолбцов, дающих индикаторы для всех уровней. Во-вторых, поведение в целом может быть изменено установкой опций для противоположностей. По умолчанию в R установлено:

options(contrasts = c("contr.treatment", "contr.poly"))

Главная причина этого упоминания состоит в том, что у R иS есть различия по умолчанию для неупорядоченных факторов,S использует противоположности Helmert. Так, если необходимо сравнить результаты с таковыми из учебника или статьи, которая использовала S-Plus, то следует установить:

options(contrasts = c("contr.helmert", "contr.poly"))

Это - преднамеренная разность, поскольку обработка противоположностей (по умолчанию R) будет легче для понимания новичками.

Мы все еще не закончили, поскольку схема противопоставления для использования может быть установлена для каждого параметра в модели, используя противоположности функций и C.

Мы еще не рассмотрели параметры взаимодействия: они генерируют произведения столбцов, представленных для компонентов этих параметров.

Хотя сложные особенности и сохраняют некоторую маргинальность, формулы модели в R будут обычно генерировать модели, которые ожидал бы опытный статистик, при условии, что принцип малых приращений сохранен. Подгонка, например, модели взаимодействия, не включающая соответствующих главных эффектов, в целом приведет к неожиданным результатам, и предназначена только для экспертов.

    1. Линейные модели

Основная функция для подгонки обычным многоуровневым моделям является lm(),а усовершенствованный вариант вызова выглядит следующим образом:

> fitted.model <- lm(formula, data = data.frame)

Например:

> fm2 <- lm(y ~ x1 + x2, data = production)

будет соответствовать подгонке множественной регрессионной модели yнаx1иx2(с неявным параметром смещения).

Важный (но технически дополнительный) параметр data = productionуказывает, что любые переменные, необходимые для создания модели, должны быть в первую очередь изфрейма данных production.Это не зависит от того, был ли фрейм данных production присоединен к пути поиска или нет.

    1. Универсальные функции для извлечения информации о модели

Значением lm() является подогнанный объектmodel; технически это список результатов класса "lm". В этом случае информация о подогнанной модели может быть выведена на экран, извлечена, графически изображена и так далее при использовании универсальных функций, которые относятся к объектам класса"lm". Они включают: add1 deviance formula predict step alias drop1 kappa print summary

anova effects labels proj vcov coef family plot residuals

Краткое описание наиболее часто используемых функций дано ниже. anova(object_1, object_2)

Сравните подмодель с внешней моделью и произведите таблицу дисперсионного анализа.

coef(object)

Извлеките коэффициент регрессии (матрицу).

Длинная форма: coefficients(object)

deviance(object)

Сумма квадратов остатков, взвешенная если возможно.

formula(object)

Извлеките формулу модели.

plot(object)

Произведите четыре рисунка, показав остатки, подогнанное значение и некоторую диагностику.

predict(object, newdata=data.frame)

Предоставленному фрейму данных нужно было специфицировать переменные с теми же самыми метками как оригинал. Значение - вектор или матрица ожидаемых значений, соответствующих значениям определенных переменных в data.frame.

print(object)

Напечатайте краткую версию объекта. Чаще всего используется неявно.

residuals(object) Извлеките (матрицу) остатков, взвешенных если возможно.

Краткая форма: resid (объект).

step(object)

Выберите подходящую модель, добавляя или отбрасывая параметры и сохраняя иерархии. Возвращается модель с наименьшим значением AIC (информационный критерий), обнаруженным в пошаговом поиске.

summary(object)

Напечатайте общую сводку результатов регрессионного анализа.

vcov(object)

Возвращает матрицу ковариации дисперсии основных параметров подогнанного объекта модели.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]