Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика / Модуль 5.doc
Скачиваний:
93
Добавлен:
29.03.2016
Размер:
154.11 Кб
Скачать

5.4. Проверка гипотезы о совпадении уравнений регрессии для отдельных групп наблюдений (критерий Чоу)

Проведем теперь проверку значимости коэффициентов при фиктивных переменных.

Если коэффициенты уравнения (5.10) оценены, то значимость устанавливается в результате проверки того факта, что свободный член уравнения для военного времени значимо отличен от нуля. Чтобы убедиться в значимости/нужно проверить существование некоторой значимой разности между свободными членами для военного и мирного времени.

Способом проверки существенности введенной фиктивной переменной выступает критерий Чоу, основанный на F-статистике. Проверяется гипотеза о совпадении уравнений регрессии для отдельных групп наблюдений (например, для мирного и военного времени изпримерав п.5.3).

Пусть имеются две выборки, содержащие, соответственно, п1 ип2наблюдений. Для каждой из этих выборок оценено уравнение регрессии вида

у = a01+a11х1 +a21х2 + ... +am1хm и у = a02+a12х1 +a22х2 + ... +am2хm

Пусть суммы квадратов отклонений уiот линий регрессии равны для них, соответственно,и. Проверяется нулевая гипотеза, заключающаяся в том, что все соответствующие коэффициенты этих уравнений равны друг другу, то есть, что уравнение регрессии для этих выборок одно и то же. Пусть оценено уравнение регрессии того же вида сразу для всех (n1+n2) наблюдений:

у = a0+a1х1 +a2х2 + ... +amхm, и сумма квадратов отклонений уi от линии регрессии равна для него S0. Тогда рассчитывается F-статистика по формуле

. (5. 0)

Она имеет распределение Фишера с (т+1,n-2m-2) степенями свободы.F-статистика будет близкой к нулю, если уравнение регрессии для обеих выборок одинаково, поскольку в этом случаеS0= S1 + S2. Если же ее расчетное значение велико (то есть больше критического значения при данном уровне значимости), то нулевая гипотеза отвергается. Описанная процедура важна для ответа на вопрос, можно ли за весь рассматриваемый в модели период времени построить единое уравнение регрессии, или же нужно разбить его на части и на каждой из частей строить свое уравнение регрессии.

Лабораторная работа № 5.4. Фиктивные переменные

По данным опроса 15 женщин (табл.5.1), находящихся в роддоме, исследовать зависимость веса новорожденного(y) от среднегочисла сигарет(x), выкуриваемых матерью в день, с учетом числаимеющихся у матери детей(z).

Таблица 5.1

yi (кг)

xi

z

1

3,52

10

1

2

3,46

19

2

3

3,2

16

0

4

3,32

28

1

5

3,54

4

3

6

3,31

14

2

7

3,36

21

0

8

3,65

10

1

9

3,15

22

0

10

3,44

12

1

11

3,1

31

3

12

3,22

29

0

13

3,71

8

2

14

3,76

6

1

15

3,92

8

1

Выполнение

Чтобы учесть при решении задачи число детей, уже имеющихся у матери, нужно либо сгруппировать матерей по числу детей и построить для каждой группы свою модель, либо ввести фиктивные переменные.

Предварительно сгруппируем матерей по количеству уже имеющихся у них детей:

Количество детей у матери (z)

0

1

2

3

Количество матерей (mz)

4

6

3

2

Как видим, первый подход к построению регрессионной модели следует сразу отвергнуть из-за малого числа наблюдений в группах.

Предположив, что модели могут различаться только свободным членом, то есть наличие структурных сдвигов, введем фиктивные переменные di, гдеi=1,2,3 и пусть

В модель не была включена переменная d0(0 детей), так как в этом случае, фиктивные переменные становятся зависимыми.

Чтобы добавить фиктивные переменные в Excel, удобно воспользоваться логической функцией ЕСЛИ(). В ячейки E2,F2,G2 введем соответственно:

= ЕСЛИ(D2=1;1;0)

= ЕСЛИ(D2=2;1;0)

= ЕСЛИ(D2=3;1;0)

А затем скопируем формулы на диапазон E3:G16.

Теперь необходимо перенести столбец, не участвующий в регрессионном анализе (z), так как объясняющие переменные должны представлять собой непрерывную область. Для этого выделите диапазонD1:D16, выберитеПравка \ Вырезать. Затем вставьте этот столбец, начиная с ячейкиH1. После удалите столбецD.

Предположив линейную зависимость веса новорожденного от x,d1, найдем МНК- оценку линейного уравнения регрессии:

= 3,608-0,017x+0,204d1+0,119d2+0,011d3

(0,005) (0,104) (0,117) (0,011)

Ниже уравнения в скобках указаны оценки среднеквадратических отклонений коэффициентов регрессии . Можно легко убедиться, что коэффициенты приd2иd3незначимы (см. лаб.4.2.2). Последовательно исключая переменные и осуществляя проверку с помощью F-статистики (см. 5.1.) приходим к окончательной модели:

= 3,681-0,019x+0,152d1

(0,004) (0,077)

Об адекватности модели свидетельствуют его параметры: множественный коэффициент регрессии R2=0,719, оценка остаточной дисперсииу=0,14 и расчетное значениеF-критерияFкр=15,378>F(=0,05;1=2;2=8)=2,81.

Из модели следует, что структурный сдвиг имеет место для случая d1=1. Таким образом, у курящих женщин, рожающих второго ребенка, зависимость веса новорожденного (у) от числа выкуриваемых сигарет определяется регрессионной моделью:

= 3, 833-0,019x

(свободный член получен как сумма: 3,833=3,681+0,152), у остальных курящих женщин эта зависимость имеет вид:

= 3,681-0,019x

Сопоставляя модели, можно отметить, что при рождении вес второго ребенка у курящих женщин будет в среднем на 0,152 кг выше, чем вес детей остальных женщин, выкуривающих в день те же хсигарет.

Соседние файлы в папке Эконометрика