
- •Практикум по эконометрике
- •080109– «Бухгалтерский учет, анализ и аудит»
- •080105– «Финансы и кредит»
- •Лабораторная работа №1. Изучение возможностей Excel для получения и анализа уравнений множественной регрессии.
- •Лабораторная работа №2. Построение модели множественной регрессии со статистически значимыми факторами
- •Лабораторная работа №3. Устранение гетероскедастичности и автокорреляции в остатках.
- •2. Устранение автокорреляции в остатках.
- •Лабораторная работа №4. Проверка однородности данных. Уравнение регрессии с фиктивными переменными.
- •Лабораторная работа №5. Построение автокорреляционной функции и коррелограммы.
- •Лабораторная работа №6. Выявление структуры одномерного временного ряда.
- •Лабораторная работа №7. Моделирование взаимосвязей по временным рядам
- •Лабораторная работа №8. Модели с распределенным лагом. Метод Алмон.
- •Лабораторная работа №9. Изучение двухшагового метода наименьших квадратов.
- •Список литературных источников
Лабораторная работа №4. Проверка однородности данных. Уравнение регрессии с фиктивными переменными.
1. Проверка однородности данных. Тест Г.Чоу.
Пример №5
Рассмотрим полученную в лабораторной работе № 2 (рис.1.7.) зависимость оборота розничной торговли (Y, млрд. руб.) от ряда факторов: X1 – денежные доходы населения, млрд. руб.; X2 – доля доходов, используемая на покупку товаров и оплату услуг, млрд. руб.; X3 – уровень инфляции за последний год, %.
Известно, что первая выборка значений переменных объемом n1=12 получена при одних условиях, а другая, объемом n2=12, - при несколько измененных условиях.
Требуется:
Проверить гипотезу Но о совпадении уравнений регрессии для двух выборок. Можно ли объединить две выборки в одну и рассматривать единую модель регрессии?
Решение
В соответствии со схемой теста построим уравнение регрессии по первым n1=12 наблюдениям. Для этого Сервис→→ Анализ данных →→ Регрессия. Результаты дисперсионного анализа представлены в табл.6.
Таблица 6
|
Дисперсионный анализ |
|
|
||
|
df |
SS1 |
MS |
F |
Значимость F |
Регрессия |
3 |
1594,913085 |
531,6376951 |
73,53716661 |
3,63832E-06 |
Остаток |
8 |
57,83608149 |
7,229510186 |
|
|
Итого |
11 |
1652,749167 |
|
|
|
Результаты дисперсионного анализа модели, построенной по оставшимся n2=12 наблюдениям, представлены в табл.7.
Таблица 7
Дисперсионный анализ |
|
|
|||
|
df |
SS2 |
MS |
F |
Значимость F |
Регрессия |
3 |
3407,138114 |
1135,712705 |
22,00295081 |
0,000321119 |
Остаток |
8 |
412,9310526 |
51,61638157 |
|
|
Итого |
11 |
3820,069167 |
|
|
|
Результаты дисперсионного анализа модели, построенной по всем n=n1+ n2=24 наблюдениям, представлены в таблице (рис.1.8.) (ESS=782,19).
Рассчитаем статистику F по формуле:
где – число объясняющих переменных модели.
Находим табличное значение Fтабл = FРАСПОБР(0,05;4;16)=3,01.
Так как, F < Fтабл , то справедлива гипотеза Но, т.е. можно использовать единую модель по всем наблюдениям.
2. Уравнение регрессии с фиктивными переменными.
Модели, в которых объясняющие переменные носят как количественный, так и качественный характер, называются ANCOVA-моделями (моделями ковариационного анализа). Если качественная переменная имеет k альтернативных значений, то при моделировании используют только k-1 фиктивную переменную.
Пример №6
Таблица 8
-
Фирма
Н
М
F
R
a
280
23
0
0
b
230
24
1
0
c
112
43
1
1
a
176
48
0
0
c
190
46
1
1
a
178
45
0
0
b
216
25
1
0
c
110
75
1
1
b
145
65
1
0
a
200
43
0
0
b
265
20
1
0
c
148
70
1
1
c
150
62
1
1
b
176
40
1
0
a
123
66
0
0
a
245
20
0
0
c
176
39
1
1
b
260
25
1
0
a
236
43
0
0
a
205
43
0
0
a
240
25
0
0
b
95
70
1
0
a
115
62
0
0
c
200
25
1
1
b
126
45
1
0
a
225
40
0
0
c
210
30
1
1
b
146
65
1
0
a
260
30
0
0
b
220
22
1
0
b
194
33
1
0
c
156
48
1
1
a
100
75
0
0
b
240
21
1
0
a
170
56
0
0
c
116
58
1
1
b
120
40
1
0
a
240
37
0
0
b
101
56
1
0
a
120
67
0
0
Исследуется надежность станков (Н-время безаварийной работы до последней поломки, часы) трех производителей a,b,c. При этом учитывается возраст станка М (в месяцах).
Уравнение регрессии Н = β0 + β1М построенное по выборке (табл.8 ) из 40 станков без учета различия станков различных фирм имеет невысокий коэффициент детерминации R2 = 0,70.
Требуется:
Построить уравнение регрессии с учетом производителя станков.
Решение
Качественная переменная «Производитель станков» может принимать k=3 значения (a,b,c). Поэтому нужно ввести в модель k-1=3-1=2 фиктивных переменных F и R.
Для производителя a F=R=0, для производителя b F=1, R=0, для производителя c F=R=1.
Теперь нужно оценить параметры уравнения
Н=β0+β1М+γ1F+γ2R методом наименьших квадратов. Для этого Сервис→→ Анализ данных →→ Регрессия. Результаты представлены в таблице (рис.1.14).
Получили уравнение вида Н = 317- 2,7*М - 29,4*F + 3,6*R с коэффициентом детерминации R2=0,77, что на 7% больше. Из анализа этого уравнения можно заключить, что при одном и том же возрасте станков, станки фирмы b работают до поломки на 29,4 часа меньше по сравнению со станками фирмы а, а станки фирмы с - на 25,8 часа меньше по сравнению со станками фирмы а.
Таким образом, при исследовании надежности станков учет фирмы производителя дал положительные результаты.
Рис.1.14.