6.1.3. Оценка влияния независимой переменной

Если переменные xнезависимы, то величина коэффициентаb_iинтерпретируется как приростy, еслиx_iувеличить на единицу. Если переменные связаны, то изменение одной объясняющей переменной вызовет изменение других переменных, в результате чего измененияyбудут непредсказуемы.

Можно ли по абсолютной величине коэффициента судить о роли соответствующего ему фактора в формировании зависимой переменной? То есть, если b₁ > b₂, будет лиx₁важнееx₂?

Абсолютные значения коэффициентов не позволяют сделать такой вывод. Однако при небольшой взаимосвязи переменных x, если стандартизовать переменные и рассчитать уравнение регрессии для стандартизованных переменных, оценки коэффициентов регрессии позволят по их абсолютной величине судить о том, какой аргумент в большей степени влияет на функцию.

6.1.3.1. Стандартизация переменных. Бета-коэффициенты

Стандартизация переменных, т. е. замена переменных x^kнаиyна, приводит к уравнению

, гдеk – порядковый номер независимой переменной.

Коэффициенты в последнем уравнении получены при одинаковых масштабах изменения всех переменных и сравнимы. Более того, если «независимые» переменные не связаны друг с другом, -коэффициенты суть коэффициенты корреляции междуx^kиy. Таким образом, в последнем случае коэффициентынепосредственно характеризуют связьxиy.

В случае взаимосвязи переменных xмогутx^kпроисходить странные вещи. Несмотря на связь переменныхx^kиy,-коэффициент может оказаться равным нулю, или, наоборот, его величина может оказаться больше единицы!

Взаимосвязь аргументов в правой части регрессионного уравнения называется мультиколлинеарностью. При наличии мультиколлинеарности переменных по коэффициентам регрессии нельзя судить о влиянии этих переменных на функцию.

6.1.3.2. Надежность и значимость коэффициента регрессии

Для изучения «механизма» действия мультиколлинеарности на регрессионные коэффициенты рассмотрим выражение для дисперсии отдельного регрессионного коэффициента

Здесь – коэффициент детерминации, получаемый при построении уравнения регрессии, в котором в качестве зависимой переменной взята переменнаяx^k. Из выражения видно, что величина коэффициента тем неустойчивее, чем сильнее переменнаяx_kсвязана с остальными переменными (чем ближе к единице коэффициент детерминации).

Величина , характеризующая устойчивость регрессионного коэффициента, называется надежностью. В англоязычной литературе она обозначается словомtolerance.Чем толерантность ближе к 1, тем надежнее оценка коэффициента.

Дисперсия коэффициента позволяет получить статистику для проверки его значимости:

Эта статистика имеет распределение Стьюдента. В выдаче пакета печатается ее наблюдаемая двусторонняя значимость – вероятность случайно при нулевом регрессионном коэффициенте B_kполучить значение статистики, большее по абсолютной величине, чем выборочное.

6.1.3.3. Значимость включения переменной в регрессию

При последовательном подборе переменных в SPSS предусмотрена автоматизация, основанная на значимости включения и исключения переменных. Рассмотрим, что представляет собой эта значимость.

Обозначим коэффициент детерминации, полученный при исключении из правой части уравнения переменнойx^k(зависимая переменнаяy). При этом мы получим уменьшение объясненной дисперсии на величину .

Для оценки значимости включения переменной x^kиспользуется статистика

имеющая распределение Фишера при нулевом теоретическом приросте . Вообще, если из уравнения регрессии исключаютсяqпеременных, статистикой значимости исключения будет

<<< < Предыдущая 36 37 38 39 40 41 42 43 44 45 46 4748 / 6948 49 50 51 52 53 54 55 56 57 58 59 60 > Следующая >>>