 
        
        - •Кафедра математической экономики
- •Методические указания
- •ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ
- •ОПИСАНИЕ ИСХОДНОГО НАБОРА ДАННЫХ
- •Минимальные требования
- •Описание данных в примере
- •ПРЕДВАРИТЕЛЬНЫЕ ГИПОТЕЗЫ
- •ДОМАШНЯЯ РАБОТА «ПОСТРОЕНИЕ ЛИНЕЙНОЙ РЕГРЕССИОННОЙ МОДЕЛИ»
- •Разведочный анализ данных
- •Теоретические основания
- •Анализ диаграмм рассеяния
- •Анализ значимости оценок коэффициентов корреляции Пирсона
- •Интерпретация результатов
- •Построение линейной регрессионной модели
- •Числовые характеристики для сравнения линейных регрессионных моделей
- •Нечисловые методы сравнения моделей. Нормальная кривая
- •Нарушение основных предположений регрессионного анализа
- •Анализ наличия мультиколлинеарности
- •Корреляция случайных составляющих. Критерий Дарбина – Уотсона.
- •Гетероскедастичность. Критерий Уайта.
- •Минимальные требования
- •Организация вычислений
- •Модель №1
- •Модель №2
- •Модель №3
- •Модель №4
- •ДОМАШНЯЯ РАБОТА «УСОВЕРШЕНСТВОВАНИЕ ЛИНЕЙНОЙ РЕГРЕССИОННОЙ МОДЕЛИ. ОРГАНИЗАЦИЯ ПРОГНОЗИРОВАНИЯ»
- •Критерий Чоу
- •Вариант на основе критерия Вальда
- •Вариант на основе нормальной гипотезы
- •Минимальные требования
- •Минимальные требования
- •Минимальные требования
- •Критерий Чоу
- •Обнаружение выбросов
- •Построение доверительного интервала для нового значения зависимой переменной
- •Приложение
- •Пример модели с использованием взаимодействия.
- •Пример значимого влияния фиктивной переменной
 
cbdn(1,2)=y(1)+qt*@sqrt(var(1)) cbdn(2,1)=y(2)-qt*@sqrt(var(2)) cbdn(2,2)=y(2)+qt*@sqrt(var(2))
В результате получим следующие границы Таблица 21 Доверительные интервалы для новых значений удоя
| 
 | C1 | C2 | 
| 
 | Last updated: 06/07/05 - 21:47 | Last updated: 06/07/05 - 21:47 | 
| 
 | 
 | 
 | 
| R1 | 3090.185 | 6165.075 | 
| R2 | 4119.914 | 7206.132 | 
Легко проверить, что для «усредненной» коровы прогноз надоя точнее, т.е. доверительный интервал с тем же уровнем доверия, уже.
Приложение
Здесь мы кратко без подробностей рассмотрим некоторые варианты эконометрических моделей, которые имеют особенности не представленные в разобранном примере.
Пример модели с использованием взаимодействия.
Рассмотрим модель ценообразования на вторичном авторынке для данных о ценах на ВАЗ21053 для 2002 года из журнала «За рулем». Строится зависимость цены от возраста (AGE) и пробега (RUN).
Таблица П1 Результаты оценивания модели ценообразования на ВАЗ21053.
Dependent Variable: PRICE
Method: Least Squares
Date: 06/07/05 Time: 22:10
Sample: 1 60
Included observations: 60
| Variable | Coefficient | Std. Error | t-Statistic | Prob. | 
| C | 3007.969 | 135.1888 | 22.25014 | 0.0000 | 
| AGE | -105.7036 | 39.77415 | -2.657595 | 0.0102 | 
| RUN | -9.751489 | 3.035355 | -3.212635 | 0.0022 | 
| R-squared | 0.506285 | Mean dependent var | 2105.833 | |
| Adjusted R-squared | 0.488961 | S.D. dependent var | 703.8087 | |
| S.E. of regression | 503.1316 | Akaike info criterion | 15.32829 | |
| Sum squared resid | 14429061 | Schwarz criterion | 15.43300 | |
| Log likelihood | -456.8486 | F-statistic | 
 | 29.22556 | 
| Durbin-Watson stat | 0.906418 | Prob(F-statistic) | 0.000000 | |
Отметим только, что все оценки коэффициентов значимы, но статистика Дарбина – Ватсона далека от идеала. Возникает предположение, что уценка за пробег не постоянна, а зависит от возраста машины, т.е. с возрастом падает. В результате модель должна иметь вид Pr ice = c + (b + d * Age)* Run + a * Age + v . При этом знак коэффициента ‘d’ должен быть положительным.
 
Таблица П2 Результаты оценивания модели ценообразования со взаимодействием.
Dependent Variable: PRICE
Method: Least Squares
Date: 06/07/05 Time: 22:18
Sample: 1 60
Included observations: 60
| Variable | Coefficient | Std. Error | t-Statistic | Prob. | 
| C | 3356.923 | 189.9317 | 17.67436 | 0.0000 | 
| AGE | -230.8860 | 62.75244 | -3.679314 | 0.0005 | 
| RUN | -18.79076 | 4.627665 | -4.060528 | 0.0002 | 
| AGE*RUN | 2.425902 | 0.967065 | 2.508519 | 0.0150 | 
| R-squared | 0.556159 | Mean dependent var | 2105.833 | |
| Adjusted R-squared | 0.532381 | S.D. dependent var | 703.8087 | |
| S.E. of regression | 481.2830 | Akaike info criterion | 15.25513 | |
| Sum squared resid | 12971469 | Schwarz criterion | 15.39475 | |
| Log likelihood | -453.6539 | F-statistic | 
 | 23.39040 | 
| Durbin-Watson stat | 0.933616 | Prob(F-statistic) | 0.000000 | |
Мы видим, что результаты оценивания не противоречат нашему предположению и все характеристики модели, включая статистику Дарбина – Ватсона улучшились.
Пример значимого влияния фиктивной переменной
Рассмотрим тот же пример, но учтем в модели наличие музыкальной системы.
Таблица П3. Модель ценообразования с фиктивной переменной.
Dependent Variable: PRICE
Method: Least Squares
Date: 06/07/05 Time: 22:23
Sample: 1 60
Included observations: 60
| Variable | Coefficient | Std. Error | t-Statistic | Prob. | 
| C | 3216.160 | 160.5488 | 20.03229 | 0.0000 | 
| AGE | -72.24222 | 62.13327 | -1.162698 | 0.2501 | 
| RUN | -14.78151 | 4.661072 | -3.171268 | 0.0025 | 
| MUSIC | -664.4504 | 274.1755 | -2.423449 | 0.0188 | 
| AGE*MUSIC | -29.86657 | 79.16891 | -0.377251 | 0.7075 | 
| RUN*MUSIC | 10.84754 | 6.065410 | 1.788426 | 0.0793 | 
| R-squared | 0.570928 | Mean dependent var | 2105.833 | |
| Adjusted R-squared | 0.531199 | S.D. dependent var | 703.8087 | |
| S.E. of regression | 481.8913 | Akaike info criterion | 15.28795 | |
| Sum squared resid | 12539836 | Schwarz criterion | 15.49739 | |
| Log likelihood | -452.6386 | F-statistic | 
 | 14.37058 | 
| Durbin-Watson stat | 1.181777 | Prob(F-statistic) | 0.000000 | |
Мы видим, что, по крайней мере коэффициент при фиктивной переменной имеет значимую оценку на 5% уровне. Также, все характеристики модели улучшились, особо отметим рост статистики Дарбина – Ватсона. Приведем результаты проведения критерия Чоу.
 
Таблица П4 Результаты проведения критерия Чоу
Wald Test:
Equation: A2
Null Hypothesis: C(4)=0
C(5)=0
C(6)=0
| F-statistic | 2.711841 | 
 | 
 | Probability | 0.053903 | |||
| Chi-square | 8.135523 | 
 | 
 | Probability | 0.043292 | |||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
По крайне мере в варианте Вальда критерий отвергает основную гипотезу с вероятностью ошибки первого рода 0.05.
Небольшой пересчет дает более отчетливые результаты. Таблица П5 Скорректированная модель с фиктивной переменной.
Dependent Variable: PRICE
Method: Least Squares
Date: 06/07/05 Time: 22:33
Sample: 1 60
Included observations: 60
| Variable | Coefficient | Std. Error | t-Statistic | Prob. | 
| C | 3233.909 | 152.2992 | 21.23393 | 0.0000 | 
| AGE | -90.63826 | 38.20412 | -2.372473 | 0.0212 | 
| RUN | -13.68433 | 3.613885 | -3.786597 | 0.0004 | 
| MUSIC | -704.1477 | 251.1965 | -2.803175 | 0.0070 | 
| RUN*MUSIC | 9.238994 | 4.280019 | 2.158634 | 0.0353 | 
| R-squared | 0.569797 | Mean dependent var | 2105.833 | |
| Adjusted R-squared | 0.538509 | S.D. dependent var | 703.8087 | |
| S.E. of regression | 478.1191 | Akaike info criterion | 15.25725 | |
| Sum squared resid | 12572886 | Schwarz criterion | 15.43178 | |
| Log likelihood | -452.7176 | F-statistic | 
 | 18.21164 | 
| Durbin-Watson stat | 1.164984 | Prob(F-statistic) | 0.000000 | |
Можно предположить, что владельцы машин указывают наличие музыкальной системы для автомобилей, которые по степени износа не претендуют на высокие цены.
Учебное издание
ПОСТРОЕНИЕ ЛИНЕЙНОЙ РЕГРЕССИОННОЙ МОДЕЛИ
Составитель: К. Л. Поляков
Редактор Технический редактор
Подписано в печать Формат 60x84/16. Бумага офсетная №2. Ризография. Усл.-печ.л. 1,1. Уч.-изд.л. 0,9. Изд. № . Тираж экз.
Заказ . Бесплатно.
Московский государственный институт электроники и математики. 109028, Москва, Б. Трехсвятительский пер. 3/12.
Отдел оперативной полиграфии Московского государственного института электроники и математики. 113054,
ул. М. Пионерская, 12.
