Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Задачи к экзамену по Эконометрике.doc
Скачиваний:
3
Добавлен:
01.05.2025
Размер:
2.85 Mб
Скачать

Лабораторная работа №4. Проверка однородности данных. Уравнение регрессии с фиктивными переменными.

1. Проверка однородности данных. Тест Г.Чоу.

Пример №5

Рассмотрим полученную в лабораторной работе № 2 (рис.1.7.) зависимость оборота розничной торговли (Y, млрд. руб.) от ряда факторов: X1 – денежные доходы населения, млрд. руб.; X2 – доля доходов, используемая на покупку товаров и оплату услуг, млрд. руб.; X3 – уровень инфляции за последний год, %.

Известно, что первая выборка значений переменных объемом n1=12 получена при одних условиях, а другая, объемом n2=12, - при несколько измененных условиях.

Требуется:

Проверить гипотезу Но о совпадении уравнений регрессии для двух выборок. Можно ли объединить две выборки в одну и рассматривать единую модель регрессии?

Решение

В соответствии со схемой теста построим уравнение регрессии по первым n1=12 наблюдениям. Для этого Сервис→→ Анализ данных →→ Регрессия. Результаты дисперсионного анализа представлены в табл.6.

Таблица 6

Дисперсионный анализ

 

df

SS1

MS

F

Значимость F

Регрессия

3

1594,913085

531,6376951

73,53716661

3,63832E-06

Остаток

8

57,83608149

7,229510186

Итого

11

1652,749167

 

 

 

Результаты дисперсионного анализа модели, построенной по оставшимся n2=12 наблюдениям, представлены в табл.7.

Таблица 7

Дисперсионный анализ

 

df

SS2

MS

F

Значимость F

Регрессия

3

3407,138114

1135,712705

22,00295081

0,000321119

Остаток

8

412,9310526

51,61638157

Итого

11

3820,069167

 

 

 

Результаты дисперсионного анализа модели, построенной по всем n=n1+ n2=24 наблюдениям, представлены в таблице (рис.1.8.) (ESS=782,19).

Рассчитаем статистику F по формуле:

где – число объясняющих переменных модели.

Находим табличное значение Fтабл = FРАСПОБР(0,05;4;16)=3,01.

Так как, F < Fтабл , то справедлива гипотеза Но, т.е. можно использовать единую модель по всем наблюдениям.

2. Уравнение регрессии с фиктивными переменными.

Модели, в которых объясняющие переменные носят как количественный, так и качественный характер, называются ANCOVA-моделями (моделями ковариационного анализа). Если качественная переменная имеет k альтернативных значений, то при моделировании используют только k-1 фиктивную переменную.

Пример №6

Таблица 8

Фирма

Н

М

F

R

a

280

23

0

0

b

230

24

1

0

c

112

43

1

1

a

176

48

0

0

c

190

46

1

1

a

178

45

0

0

b

216

25

1

0

c

110

75

1

1

b

145

65

1

0

a

200

43

0

0

b

265

20

1

0

c

148

70

1

1

c

150

62

1

1

b

176

40

1

0

a

123

66

0

0

a

245

20

0

0

c

176

39

1

1

b

260

25

1

0

a

236

43

0

0

a

205

43

0

0

a

240

25

0

0

b

95

70

1

0

a

115

62

0

0

c

200

25

1

1

b

126

45

1

0

a

225

40

0

0

c

210

30

1

1

b

146

65

1

0

a

260

30

0

0

b

220

22

1

0

b

194

33

1

0

c

156

48

1

1

a

100

75

0

0

b

240

21

1

0

a

170

56

0

0

c

116

58

1

1

b

120

40

1

0

a

240

37

0

0

b

101

56

1

0

a

120

67

0

0

Исследуется надежность станков (Н-время безаварийной работы до последней поломки, часы) трех производителей a,b,c. При этом учитывается возраст станка М (в месяцах).

Уравнение регрессии Н = β0 + β1М построенное по выборке (табл.8 ) из 40 станков без учета различия станков различных фирм имеет невысокий коэффициент детерминации R2 = 0,70.

Требуется:

Построить уравнение регрессии с учетом производителя станков.

Решение

Качественная переменная «Производитель станков» может принимать k=3 значения (a,b,c). Поэтому нужно ввести в модель k-1=3-1=2 фиктивных переменных F и R.

Для производителя a F=R=0, для производителя b F=1, R=0, для производителя c F=R=1.

Теперь нужно оценить параметры уравнения

Н=β01М+γ1F+γ2R методом наименьших квадратов. Для этого Сервис→→ Анализ данных →→ Регрессия. Результаты представлены в таблице (рис.1.14).

Получили уравнение вида Н = 317- 2,7*М - 29,4*F + 3,6*R с коэффициентом детерминации R2=0,77, что на 7% больше. Из анализа этого уравнения можно заключить, что при одном и том же возрасте станков, станки фирмы b работают до поломки на 29,4 часа меньше по сравнению со станками фирмы а, а станки фирмы с - на 25,8 часа меньше по сравнению со станками фирмы а.

Таким образом, при исследовании надежности станков учет фирмы производителя дал положительные результаты.

Рис.1.14.