![](/user_photo/1409_eZHEC.jpg)
- •Кафедра математической экономики
- •Методические указания
- •ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ
- •ОПИСАНИЕ ИСХОДНОГО НАБОРА ДАННЫХ
- •Минимальные требования
- •Описание данных в примере
- •ПРЕДВАРИТЕЛЬНЫЕ ГИПОТЕЗЫ
- •ДОМАШНЯЯ РАБОТА «ПОСТРОЕНИЕ ЛИНЕЙНОЙ РЕГРЕССИОННОЙ МОДЕЛИ»
- •Разведочный анализ данных
- •Теоретические основания
- •Анализ диаграмм рассеяния
- •Анализ значимости оценок коэффициентов корреляции Пирсона
- •Интерпретация результатов
- •Построение линейной регрессионной модели
- •Числовые характеристики для сравнения линейных регрессионных моделей
- •Нечисловые методы сравнения моделей. Нормальная кривая
- •Нарушение основных предположений регрессионного анализа
- •Анализ наличия мультиколлинеарности
- •Корреляция случайных составляющих. Критерий Дарбина – Уотсона.
- •Гетероскедастичность. Критерий Уайта.
- •Минимальные требования
- •Организация вычислений
- •Модель №1
- •Модель №2
- •Модель №3
- •Модель №4
- •ДОМАШНЯЯ РАБОТА «УСОВЕРШЕНСТВОВАНИЕ ЛИНЕЙНОЙ РЕГРЕССИОННОЙ МОДЕЛИ. ОРГАНИЗАЦИЯ ПРОГНОЗИРОВАНИЯ»
- •Критерий Чоу
- •Вариант на основе критерия Вальда
- •Вариант на основе нормальной гипотезы
- •Минимальные требования
- •Минимальные требования
- •Минимальные требования
- •Критерий Чоу
- •Обнаружение выбросов
- •Построение доверительного интервала для нового значения зависимой переменной
- •Приложение
- •Пример модели с использованием взаимодействия.
- •Пример значимого влияния фиктивной переменной
![](/html/1409/113/html_8xuwFFfcx3.9BUP/htmlconvd-Hpf9_u32x1.jpg)
cbdn(1,2)=y(1)+qt*@sqrt(var(1)) cbdn(2,1)=y(2)-qt*@sqrt(var(2)) cbdn(2,2)=y(2)+qt*@sqrt(var(2))
В результате получим следующие границы Таблица 21 Доверительные интервалы для новых значений удоя
|
C1 |
C2 |
|
Last updated: 06/07/05 - 21:47 |
Last updated: 06/07/05 - 21:47 |
|
|
|
R1 |
3090.185 |
6165.075 |
R2 |
4119.914 |
7206.132 |
Легко проверить, что для «усредненной» коровы прогноз надоя точнее, т.е. доверительный интервал с тем же уровнем доверия, уже.
Приложение
Здесь мы кратко без подробностей рассмотрим некоторые варианты эконометрических моделей, которые имеют особенности не представленные в разобранном примере.
Пример модели с использованием взаимодействия.
Рассмотрим модель ценообразования на вторичном авторынке для данных о ценах на ВАЗ21053 для 2002 года из журнала «За рулем». Строится зависимость цены от возраста (AGE) и пробега (RUN).
Таблица П1 Результаты оценивания модели ценообразования на ВАЗ21053.
Dependent Variable: PRICE
Method: Least Squares
Date: 06/07/05 Time: 22:10
Sample: 1 60
Included observations: 60
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
3007.969 |
135.1888 |
22.25014 |
0.0000 |
AGE |
-105.7036 |
39.77415 |
-2.657595 |
0.0102 |
RUN |
-9.751489 |
3.035355 |
-3.212635 |
0.0022 |
R-squared |
0.506285 |
Mean dependent var |
2105.833 |
|
Adjusted R-squared |
0.488961 |
S.D. dependent var |
703.8087 |
|
S.E. of regression |
503.1316 |
Akaike info criterion |
15.32829 |
|
Sum squared resid |
14429061 |
Schwarz criterion |
15.43300 |
|
Log likelihood |
-456.8486 |
F-statistic |
|
29.22556 |
Durbin-Watson stat |
0.906418 |
Prob(F-statistic) |
0.000000 |
Отметим только, что все оценки коэффициентов значимы, но статистика Дарбина – Ватсона далека от идеала. Возникает предположение, что уценка за пробег не постоянна, а зависит от возраста машины, т.е. с возрастом падает. В результате модель должна иметь вид Pr ice = c + (b + d * Age)* Run + a * Age + v . При этом знак коэффициента ‘d’ должен быть положительным.
![](/html/1409/113/html_8xuwFFfcx3.9BUP/htmlconvd-Hpf9_u33x1.jpg)
Таблица П2 Результаты оценивания модели ценообразования со взаимодействием.
Dependent Variable: PRICE
Method: Least Squares
Date: 06/07/05 Time: 22:18
Sample: 1 60
Included observations: 60
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
3356.923 |
189.9317 |
17.67436 |
0.0000 |
AGE |
-230.8860 |
62.75244 |
-3.679314 |
0.0005 |
RUN |
-18.79076 |
4.627665 |
-4.060528 |
0.0002 |
AGE*RUN |
2.425902 |
0.967065 |
2.508519 |
0.0150 |
R-squared |
0.556159 |
Mean dependent var |
2105.833 |
|
Adjusted R-squared |
0.532381 |
S.D. dependent var |
703.8087 |
|
S.E. of regression |
481.2830 |
Akaike info criterion |
15.25513 |
|
Sum squared resid |
12971469 |
Schwarz criterion |
15.39475 |
|
Log likelihood |
-453.6539 |
F-statistic |
|
23.39040 |
Durbin-Watson stat |
0.933616 |
Prob(F-statistic) |
0.000000 |
Мы видим, что результаты оценивания не противоречат нашему предположению и все характеристики модели, включая статистику Дарбина – Ватсона улучшились.
Пример значимого влияния фиктивной переменной
Рассмотрим тот же пример, но учтем в модели наличие музыкальной системы.
Таблица П3. Модель ценообразования с фиктивной переменной.
Dependent Variable: PRICE
Method: Least Squares
Date: 06/07/05 Time: 22:23
Sample: 1 60
Included observations: 60
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
3216.160 |
160.5488 |
20.03229 |
0.0000 |
AGE |
-72.24222 |
62.13327 |
-1.162698 |
0.2501 |
RUN |
-14.78151 |
4.661072 |
-3.171268 |
0.0025 |
MUSIC |
-664.4504 |
274.1755 |
-2.423449 |
0.0188 |
AGE*MUSIC |
-29.86657 |
79.16891 |
-0.377251 |
0.7075 |
RUN*MUSIC |
10.84754 |
6.065410 |
1.788426 |
0.0793 |
R-squared |
0.570928 |
Mean dependent var |
2105.833 |
|
Adjusted R-squared |
0.531199 |
S.D. dependent var |
703.8087 |
|
S.E. of regression |
481.8913 |
Akaike info criterion |
15.28795 |
|
Sum squared resid |
12539836 |
Schwarz criterion |
15.49739 |
|
Log likelihood |
-452.6386 |
F-statistic |
|
14.37058 |
Durbin-Watson stat |
1.181777 |
Prob(F-statistic) |
0.000000 |
Мы видим, что, по крайней мере коэффициент при фиктивной переменной имеет значимую оценку на 5% уровне. Также, все характеристики модели улучшились, особо отметим рост статистики Дарбина – Ватсона. Приведем результаты проведения критерия Чоу.
![](/html/1409/113/html_8xuwFFfcx3.9BUP/htmlconvd-Hpf9_u34x1.jpg)
Таблица П4 Результаты проведения критерия Чоу
Wald Test:
Equation: A2
Null Hypothesis: C(4)=0
C(5)=0
C(6)=0
F-statistic |
2.711841 |
|
|
Probability |
0.053903 |
|||
Chi-square |
8.135523 |
|
|
Probability |
0.043292 |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
По крайне мере в варианте Вальда критерий отвергает основную гипотезу с вероятностью ошибки первого рода 0.05.
Небольшой пересчет дает более отчетливые результаты. Таблица П5 Скорректированная модель с фиктивной переменной.
Dependent Variable: PRICE
Method: Least Squares
Date: 06/07/05 Time: 22:33
Sample: 1 60
Included observations: 60
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
3233.909 |
152.2992 |
21.23393 |
0.0000 |
AGE |
-90.63826 |
38.20412 |
-2.372473 |
0.0212 |
RUN |
-13.68433 |
3.613885 |
-3.786597 |
0.0004 |
MUSIC |
-704.1477 |
251.1965 |
-2.803175 |
0.0070 |
RUN*MUSIC |
9.238994 |
4.280019 |
2.158634 |
0.0353 |
R-squared |
0.569797 |
Mean dependent var |
2105.833 |
|
Adjusted R-squared |
0.538509 |
S.D. dependent var |
703.8087 |
|
S.E. of regression |
478.1191 |
Akaike info criterion |
15.25725 |
|
Sum squared resid |
12572886 |
Schwarz criterion |
15.43178 |
|
Log likelihood |
-452.7176 |
F-statistic |
|
18.21164 |
Durbin-Watson stat |
1.164984 |
Prob(F-statistic) |
0.000000 |
Можно предположить, что владельцы машин указывают наличие музыкальной системы для автомобилей, которые по степени износа не претендуют на высокие цены.
Учебное издание
ПОСТРОЕНИЕ ЛИНЕЙНОЙ РЕГРЕССИОННОЙ МОДЕЛИ
Составитель: К. Л. Поляков
Редактор Технический редактор
Подписано в печать Формат 60x84/16. Бумага офсетная №2. Ризография. Усл.-печ.л. 1,1. Уч.-изд.л. 0,9. Изд. № . Тираж экз.
Заказ . Бесплатно.
Московский государственный институт электроники и математики. 109028, Москва, Б. Трехсвятительский пер. 3/12.
Отдел оперативной полиграфии Московского государственного института электроники и математики. 113054,
ул. М. Пионерская, 12.