Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
наши шпоры к статистике.doc
Скачиваний:
4
Добавлен:
01.04.2025
Размер:
1.13 Mб
Скачать

25. Регрессионные модели с фиктивными переменными.

Регрессионная м-ль может включать не только количественно измеримые переменные, но и качественные. Чтобы ввести такие переменные в модель им присваивают цифровые метки, т.е. качественные переменные преобразовывают в количественные. Такого рода переменные получили название фиктивных.

Возможны разные пути построения модели:

1. Строятся отдельные уравнения регрессии для двух градаций качественного признака:

Выдвигается гипотеза, что b1 и b0 мало отличаются друг от друга (крит. Чоу) и тогда можно перейти к другому подходу.

2. Построим общее уравнение регрессии с фиктивной переменной z. Число фиктивных переменных д.б. на 1 меньше числа градаций качественного признака. Уравнение регрессии с фиктивной переменной составит:

Исходя из него можно найти уравнение отдельно для каждой из градаций:

Рассмотренная модель корректна только при соблюдении условия, что b1=b0=b. Если же это равенство не соблюдается, то модель с фиктивной переменной принимает вид:

Эта модель учитывает взаимодействие факторов.

Если число градаций качественного признака больше 2, то в модель вводятся несколько фиктивных переменных, число которых на 1 меньше числа градаций.

26. F-критерий: общий, последовательный, частный; назначение и порядок расчета.

Оценка значимости уравнения регрессии в целом дается с помощью F-критерия Фишера.

В основе F-критерия лежит правило сложения дисперсий:

Общая сумма квадратов раскладывается на факторную и остаточную сумму квадратов.

Разработаны специальные таблицы (Снедекор) для F-отношений при разных уровнях существенности нулевой гипотезы и разном числе степеней свободы.

Нулевая гипотеза означает, что фактор не влияет на результат, и факторная и остаточная степени свободы не отличаются друг от друга.

Табличное значение F-критерия – максимальная величина отношений дисперсий, которая м.б. при случайном их расхождении для данного уровня вероятности наличия нулевой гипотезы.

Вычисленное значение F-критерия признается достоверно отличным от 1, если оно больше табличного. В этом случае отбрасывается нулевая гипотеза об отсутствии связи и делается обратный вывод о существенности рассматриваемой связи.

В множественной регрессии есть возможность определить не только F-критерий, а также частные F-критерии и последовательные F-критерии. Частный F-критерий будет оценивать целесообразность включения в модель последним, т.е. после всех других факторов. Стоится на соотношении прироста факторной дисперсии за счет дополнительного включения в модель фактора. К остаточной дисперсии, которое по модели в целом до включения в модель нового фактора.

Предположим, что оцениваем значимость влияния x1 как дополнительно включенного в модель фактора. Используем следующую формулу:

где - коэффициент множественной детерминации для модели с полным набором факторов;

- тот же показатель, но без включения в модель фактора x1;

n – число наблюдений;

m – число параметров модели (без свободного члена).

В общем виде для фактора xi частный F-критерий определяется как

Ф актическое значение частного F-критерия сравнивается с табличным при 5%-ном или 1%-ном уровне значимости и числе степеней свободы: 1 и n-m-1. Если фактическое значение превышает , то дополнительное включение фактора xi в модель статистически оправданно.

С помощью частного F-критерия можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор xi был введен в уравнение последним.