Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Архив WinRAR / Rost SPSS.doc
Скачиваний:
61
Добавлен:
15.05.2015
Размер:
8.1 Mб
Скачать

6.1.3. Оценка влияния независимой переменной

Если переменные xнезависимы, то величина коэффициентаbiинтерпретируется как приростy, еслиxiувеличить на единицу. Если переменные связаны, то изменение одной объясняющей переменной вызовет изменение других переменных, в результате чего измененияyбудут непредсказуемы.

Можно ли по абсолютной величине коэффициента судить о роли соответствующего ему фактора в формировании зависимой переменной? То есть, если b1 > b2, будет лиx1важнееx2?

Абсолютные значения коэффициентов не позволяют сделать такой вывод. Однако при небольшой взаимосвязи переменных x, если стандартизовать переменные и рассчитать уравнение регрессии для стандартизованных переменных, оценки коэффициентов регрессии позволят по их абсолютной величине судить о том, какой аргумент в большей степени влияет на функцию.

6.1.3.1. Стандартизация переменных. Бета-коэффициенты

Стандартизация переменных, т. е. замена переменных xkнаиyна, приводит к уравнению

, гдеk – порядковый номер независимой переменной.

Коэффициенты в последнем уравнении получены при одинаковых масштабах изменения всех переменных и сравнимы. Более того, если «независимые» переменные не связаны друг с другом, -коэффициенты суть коэффициенты корреляции междуxkиy. Таким образом, в последнем случае коэффициентынепосредственно характеризуют связьxиy.

В случае взаимосвязи переменных xмогутxkпроисходить странные вещи. Несмотря на связь переменныхxkиy,-коэффициент может оказаться равным нулю, или, наоборот, его величина может оказаться больше единицы!

Взаимосвязь аргументов в правой части регрессионного уравнения называется мультиколлинеарностью. При наличии мультиколлинеарности переменных по коэффициентам регрессии нельзя судить о влиянии этих переменных на функцию.

6.1.3.2. Надежность и значимость коэффициента регрессии

Для изучения «механизма» действия мультиколлинеарности на регрессионные коэффициенты рассмотрим выражение для дисперсии отдельного регрессионного коэффициента

.

Здесь – коэффициент детерминации, получаемый при построении уравнения регрессии, в котором в качестве зависимой переменной взята переменнаяxk. Из выражения видно, что величина коэффициента тем неустойчивее, чем сильнее переменнаяxkсвязана с остальными переменными (чем ближе к единице коэффициент детерминации).

Величина , характеризующая устойчивость регрессионного коэффициента, называется надежностью. В англоязычной литературе она обозначается словомtolerance.Чем толерантность ближе к 1, тем надежнее оценка коэффициента.

Дисперсия коэффициента позволяет получить статистику для проверки его значимости:

.

Эта статистика имеет распределение Стьюдента. В выдаче пакета печатается ее наблюдаемая двусторонняя значимость – вероятность случайно при нулевом регрессионном коэффициенте Bkполучить значение статистики, большее по абсолютной величине, чем выборочное.

6.1.3.3. Значимость включения переменной в регрессию

При последовательном подборе переменных в SPSS предусмотрена автоматизация, основанная на значимости включения и исключения переменных. Рассмотрим, что представляет собой эта значимость.

Обозначим коэффициент детерминации, полученный при исключении из правой части уравнения переменнойxk(зависимая переменнаяy). При этом мы получим уменьшение объясненной дисперсии на величину .

Для оценки значимости включения переменной xkиспользуется статистика

,

имеющая распределение Фишера при нулевом теоретическом приросте . Вообще, если из уравнения регрессии исключаютсяqпеременных, статистикой значимости исключения будет

.