
- •Глава 9. Фиктивные переменные в уравнении множественной регрессии
- •9.1. Необходимость использования фиктивных переменных
- •9.2. Задание для лабораторной работы №9 «Использование фиктивных переменных при построении множественной регрессии»
- •9.3. Критерий г. Чоу
- •9.4. Задание для лабораторной работы №10 «Использование критерия г. Чоу для оценки однородности двух регрессий»
9.3. Критерий г. Чоу
В практике эконометриста нередки случаи, когда имеются две выборки пар значений зависимой и объясняющих переменных (xi, yi). Например, одна выборка пар значений переменных объемом n1 получена при одних условиях, а другая, объемом n2, – при несколько измененных условиях. Необходимо выяснить, действительно ли две выборки однородны в регрессионном смысле? Другими словами, можно ли объединить две выборки в одну и рассматривать единую модель регрессии Y по X?
При достаточных объемах выборок можно было, например, построить интервальные оценки параметров регрессии по каждой из выборок и в случае пересечения соответствующих доверительных интервалов сделать вывод о единой модели регрессии. Возможны и другие подходы.
В случае, если объем хотя бы одной из выборок незначителен, то возможности такого (и аналогичных) подходов резко сужаются из-за невозможности построения сколько-нибудь надежных оценок.
В критерии (тесте) Г. Чоу эти трудности в существенной степени преодолеваются. По каждой выборке строятся две линейные регрессионные модели:
Проверяемая нулевая гипотеза имеет вид H0: = ; D(') = D(") = 2, где = – векторы параметров двух моделей; ', " – их случайные возмущения.
Если нулевая гипотеза H0 верна, то две регрессионные модели можно объединить в одну объема n = n1+n2:
Согласно критерию Г. Чоу, нулевая гипотеза H0 отвергается на уровне значимости , если статистика
(9.8)
где
,
,
– остаточные суммы квадратов соответственно
для объединенной, первой и второй
выборок;n
= n1
+ n2.
Пример 9.2.
По данным примера 9.1, используя критерий Г. Чоу, выяснить, можно ли считать одной и той же линейную регрессию Y по X для юношей и девушек.
Решение. По n1 = 6 парам наблюдений (xi, уi,) для юношей (1-я выборка)
xi |
yi |
10 |
6 |
8 |
4 |
7 |
7 |
7 |
4 |
9 |
7 |
5 |
2 |
рассчитаем уравнения регрессии (например, первым способом):
yteor(xi) = -1 + 0,782609xi.
При
этом остаточная сумма квадратов
отклонений равна
=10,6087.
Далее, по остальным n2 = 6 парам наблюдений для девушек (2-я выборка)
xi |
yi |
6 |
4 |
8 |
5 |
6 |
4 |
6 |
3 |
6 |
3 |
7 |
3 |
рассчитаем уравнения регрессии (например, первым способом):
yteor(xi) = -0,04762 + 0,571429 xi.
При
этом остаточная сумма квадратов
отклонений равна
=
2,190476.
По всем n = n1+n2 = 12 парам наблюдений мы уже рассчитывали уравнение регрессии для объединенной выборки (см. пример 9.1):
yteor(xi) = –1,43636 + 0,814545xi.
При
этом остаточная сумма квадратов
отклонений равна
=13,46182.
Так как вычисленное по формуле (9.8) значение (здесь число факторов m = 1)
F = 0,20709 < F0,05;2;8 = 4,46,
то влияние фактора «пол» несущественно, и в качестве оценки регрессионной модели Y по X можно рассматривать уравнение регрессии, полученное по объединенной выборке.
Критерий Г. Чоу может быть использован при построении регрессионных моделей при воздействии качественных признаков, когда имеется возможность разделения совокупности наблюдений по степени воздействия этого фактора на отдельные группы и требуется установить возможность использования единой модели регрессии.
Оценивание регрессии с использованием фиктивных переменных более информативно в том отношении, что позволяет использовать t-критерий для оценки существенности влияния каждой фиктивной переменной на зависимую переменную.