- •Оглавление
- •Этап1 «Спецификация факторной регрессионной модели. Обоснование выбора идентификации параметров линейной регрессии»
- •Логический анализ взаимосвязи между результативной и факторными переменными.
- •Этап 2. «Оценка коэффициентов конкурирующих моделей»
- •Этап 3. «Верификация моделей и идентификация ошибок спецификации»
- •Этап 4. Обоснование выбора базовой модели генератора прогноза
- •Этап 5. Прогнозирование на основе факторной регрессионной модели.
Этап 2. «Оценка коэффициентов конкурирующих моделей»
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( |
DW статистика
( |
|
|
237,821 |
0,845014 |
83,2098 |
65,43 |
1,60724 (P=0,0879) |
|
195,219 |
0,895567 |
0,886864 |
102,91 |
1,46672 (P=0,0376)
|
|
1,38173 |
0,54946 |
0,511915 |
14,63 |
1,49325 (P=0,0372)
|
|
1,26715 |
0,621087 |
0,589511 |
19,67 |
1,35146 (P=0,0132) |
На данном этапе вторая модель является
наиболее хорошей, так как коэффициент
детерминации
(0,895567) и исправленный коэффициент
детерминации
(0,886864)
самые большие по сравнению с остальными
моделями, так же F статистика наилучшая
(102,91). Стандартное отклонение данной
модели находится на третьем месте, но
данную характеристику нельзя сравнивать
по всем моделям, там как данные в последних
двух моделях прологарифмированы.
Дальнейшая корректировка моделей и
расчет характеристик полученных моделей
более точно обоснует правильность
выбора.
Этап 3. «Верификация моделей и идентификация ошибок спецификации»
Линейная
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика
( |
|
t(α0)= -2,39497; t(α1)= -3,00046; t(α2)= 2,20497; t(α3)= 4,48497; t0,05(40-3 -1) = 2,02 |
237,821 |
0,845014 |
83,2098 |
65,43 |
1,60724 (P=0,0879) |
В целом модель является значимой, так как расчетное значение F статистики Фишера (65,43) намного больше теоретического значения данной статистики (2,84). В данной модели все параметры значимы (так как гипотеза о незначимости каждого параметра отвергается, расчетное значение t статистики больше его табличного значения при уровне доверия 0,95)
Условия Гаусса-Маркова:
Проверим полученную модель на соответствие условиям Гаусса-Маркова:
Математическое ожидание остатков модели равно 0.
Проверим следующую гипотезу:
Таким образом, расчетное значение t
статистики меньше табличного значения,
следовательно, гипотеза
принимается с вероятностью 95%.
Приложение 13. В других моделях данный критерий рассчитан также, поэтому в приложении я не приводила примеры расчетов.
2) Проверка остатков модели на гетероскедастичность:
Судя по графику, гетероскедастичность может присутствовать, но трудно сказать точно, для проверки воспользуемся критерием ранговой корреляции Спирмэна. Данный критерий указывает на наличие или отсутствие взаимосвязи между факторным и результативным признаками.
Для начала необходимо упорядочить все множество наблюдений по возрастанию величины объясняющей переменной. Процесс сортировки будет производиться по третьему признаку, так как между ним и случайной составляющей связь сильнее, чем с другими переменными.
Так как теоретическое значение t критерия
Стьюдента (
)
больше расчетного (2,01901), следовательно,
подтверждается гипотеза
- критерий ранговой корреляции Спирмэна
не значим (свойство гетероскедастичности
в остатках модели не обнаруживается,
остатки гомоскедостичны).
Приложение 14. В других моделях данный критерий рассчитан также, поэтому в приложении я не приводила примеры расчетов.
Проверка остатков на автокоррелированность.
Можно сделать вывод о том, что в остатках
модели отсутствует автокорреляция (так
как DW
(
40,3):
))
На первом этапе работы я заявила о мультиколлинеарности, решив убрать ее с помощью изъятия одного признака, а именно продаж (первый признак). Таким образом, ниже представлена таблица с полученной моделью.
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика
(
40,1):
|
|
|
t(α3)= 13,7152; t0,05(40-3 -1) = 2,02 |
268,37 |
0,828275 |
0,828275 |
188,11 |
1,60602 |
Из таблицы видно, что модель в целом
значимая, так как F статистика расчетная
(188,11) намного больше его теоретического
значения (2,84), параметр в модели
значим, так как расчетное значение t
критерия (13,7152) больше его теоретического
значения (2,02), следовательно, гипотеза
о не значимости параметра отвергается.
Проверим полученную модель на соответствие условиям Гаусса-Маркова:
Математическое ожидание остатков модели равно 0.
Проверим следующую гипотезу:
Таким образом, расчетное значение t статистики меньше табличного значения, следовательно, гипотеза принимается с вероятностью 95%.
2) Проверка остатков модели на гетероскедастичность:
Судя по графику трудно сказать, точно присутствует ли гетероскедастичность, для проверки воспользуемся критерием ранговой корреляции Спирмэна.
Для начала необходимо упорядочить все множество наблюдений по возрастанию величины объясняющей переменной.
Так как теоретическое значение t критерия
Стьюдента (
)
меньше расчетного (
),
следовательно, гипотеза
отвергается и принимается альтернативная
гипотеза, свойство гетероскедастичности
в остатках модели обнаруживается. Так
как коэффициент ранговой корреляции
Спирмэна больше 0,5, то взаимосвязь
фактора и остатков можно считать довольно
сильной и положительно направленной.
Для устранения гетероскедостичности
разделим все переменные
,
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика ( 40,1): ) |
|
t(α3)= 13,7152; t0,05(40-3 -1) = 2,02 |
5,15351 |
0,726965 |
0,726965 |
103,84 |
1,32153 |
Для проверки гетероскедостичности воспользуемся тестом Голфелда-Кванта.
Выделим 3 выборки, первая 15 наблюдений, вторая 10, третья 15. Рассчитаем остаточную вариацию первой и третьей выборок. Все рассчитано в программе STATGRAPHICS.
(в приложение табл с разбиением)
Расчетное значение критерия Фишера больше табличного его значения, следовательно, основная гипотеза отвергается и остатки гетероскедостичны. Таким образом избежать гетероскедостичности неудалось и эта модель исключаеться из перечня какндидатов на лучшую модель для прогноза.
Приложение 15, 16.
Проверка остатков на автокоррелированность.
Можно сделать вывод о том, что отсутствует
в остатках модели автокорреляция (так
как DW
(
40,1):
))
Полиномиальная.
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика ( 40,3): ) |
|
t(α0)= 0,478739; t(α1)= 4,32058; t(α2)= -1,22424; t(α3)= 6,07631; t0,05(40-3 -1) = 2,02 |
195,219 |
0,895567 |
0,886864 |
102,91 |
1,46672 (P=0,0376)
|
В целом модель является значимой, так
как расчетное значение F статистики
Фишера (102,91) намного больше теоретического
значения данной статистики (2,84). В данной
модели параметры
значимы (так как гипотеза о значимости
каждого параметра подтверждается,
расчетное значение t
статистики больше его табличного
значения при уровне доверия 0,95). Параметры
не значимы (расчетное значение t
статистики меньше критического значения
2,02). Поочередно будем исключать незначимые
параметры из модели.
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика ( 40,3): ) |
|
t(α1)= 5,88874; t(α2)= -1,25391; t(α3)= 6,27966; t0,05(40-3 -1) = 2,02 |
193,175 |
0,915588 |
0,911025 |
133,77 |
1,51538 |
В целом модель является значимой, так
как расчетное значение F статистики
Фишера (133,77) намного больше теоретического
значения данной статистики (2,84). В данной
модели параметры
значимы (так как гипотеза о значимости
каждого параметра подтверждается,
расчетное значение t
статистики больше его табличного
значения при уровне доверия 0,95). Параметр
не значим (расчетное значение t
статистики меньше критического значения
2,02).
Исключаем из модели второй признак.
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика ( 40,2): ) |
|
|
t(α1)= 5,98179; t(α3)= 7,1883; t0,05(40-3 -1) = 2,02 |
194,624 |
0,912001 |
0,909685 |
196,91 |
1,64336 |
Проверим полученную модель на соответствие условиям Гаусса-Маркова:
Математическое ожидание остатков модели равно 0.
Проверим следующую гипотезу:
Таким образом, расчетное значение t статистики (0,0613) меньше табличного значения, следовательно, гипотеза принимается с вероятностью 95%.
2) Проверка остатков модели на гетероскедастичность:
Судя по графику трудно сказать, точно присутствует ли гетероскедастичность, для проверки воспользуемся критерием ранговой корреляции Спирмэна.
Для начала необходимо упорядочить все множество наблюдений по возрастанию величины объясняющей переменной. Процесс сортировки будет производиться по первому признаку. Затем производится сортировка по случайной составляющей модели.
Так как теоретическое значение t критерия
Стьюдента (
)
меньше расчетного (
),
следовательно, гипотеза
отвергается, принимается альтернативная
гипотеза, свойство гетероскедастичности
в остатках модели обнаруживается.
Для устранения гетероскедостичности
разделим все переменные
,
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика
(
40,2):
|
|
t(α1)= 6,04884; t(α3)= 4,3489 t0,05(40-3 -1) = 2,02 |
3,77954 |
79,9426 |
79,4148 |
75,73 |
1,48549 |
Для проверки гетероскедостичности воспользуемся тестом Голфелда-Кванта.
Выделим 3 выборки, первая 10 наблюдений, вторая 20, третья 10. Рассчитаем остаточную вариацию первой и третьей выборок.
Расчетное значение критерия Фишера больше табличного его значения, следовательно, основная гипотеза отвергается и остатки гетероскедостичны. Таким образом избежать гетероскедостичности не удалось.
Проверка остатков на автокоррелированность.
Можно сделать вывод о том, что отсутствует в остатках модели автокорреляция (так как DW ( 40,2): ))
Степенная
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика
(
40,3):
|
|
|
t(α0)= 0,424911; t(α1)= -2,15254; t(α2)= -1,22424; t(α3)= 2,56447; t0,05(40-3 -1) = 2,02 |
1,38173 |
0,54946 |
0,511915 |
14,63 |
1,49325 (P=0,0372)
|
Модель значима (расчетное значение F статистики Фишера (14,63) больше теоретического значения данной статистики (2,84)). В данной модели параметры значимы (расчетное значение t статистики больше его табличного значения при уровне доверия 0,95). Параметры не значимы (расчетное значение t статистики меньше критического значения 2,02). Поочередно исключаем незначимые параметры из модели.
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика ( 40,3): ) |
|
t(α1)= -2,27615; t(α2)= 1,56974; t(α3)= 2,62635; t0,05(40-3 -1) = 2,02 |
1,36634 |
91,1714 |
90,6942 |
127,36 |
1,48157 |
Модель значима (расчетное значение F статистики Фишера (127,36) намного больше теоретического значения данной статистики (2,84)). В данной модели параметры значимы (расчетное значение t статистики больше его табличного значения при уровне доверия 0,95). Параметр не значим (расчетное значение t статистики (t(α2)= 1,56974) меньше критического значения 2,02).
Исключаем из модели второй признак.
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика ( 40,2): ) |
|
t(α1)= -2,43725; t(α3)= 2,9384; t0,05(40-3 -1) = 2,02 |
1,39242 |
0,905835 |
0,903357 |
182,77 |
1,31654 |
Проверим полученную модель на соответствие условиям Гаусса-Маркова:
Математическое ожидание остатков модели равно 0.
Проверим следующую гипотезу:
Таким образом, расчетное значение t статистики (-0,011) меньше табличного значения (2,02), следовательно, гипотеза принимается с вероятностью 95%.
2) Проверка остатков модели на гетероскедастичность:
Затруднительно сказать присутствует ли гетероскедастичность. Для проверки воспользуемся критерием ранговой корреляции Спирмэна.
Для начала необходимо упорядочить все множество наблюдений по возрастанию величины объясняющей переменной. Процесс сортировки будет производиться по третьему признаку.
Так как теоретическое значение t критерия Стьюдента ( ) больше расчетного (0,37), следовательно, гипотеза о не значимости рангового коэффициента корреляции Спирмэна принимается, свойство гетероскедастичности в остатках модели не обнаруживается.
Проверка остатков на автокоррелированность.
Можно сделать вывод о том, что в остатках
модели присутствует положительная
автокорреляция (так как DW
(
40,2):
))
Так как на первом этапе была замечена мультиколлинеарность признаков, было решено убрать первый признак (продажи, поскольку Х1:VIF=104,526)
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика ( 40,1): ) |
|
|
t(α3)= 2,9384; t0,05(40-3 -1) = 2,02 |
1,47798 |
89,1115 |
89,1115 |
319,18 |
0,961598 |
Как видно из таблицы параметры модели значимы и модель в целом тоже значима.
Проверим полученную модель на соответствие условиям Гаусса-Маркова:
Математическое ожидание остатков модели равно 0.
Проверим следующую гипотезу:
Таким образом, расчетное значение t статистики (-0,055) меньше табличного значения (2,02), следовательно, гипотеза принимается с вероятностью 95%.
2) Проверка остатков модели на гетероскедастичность:
Затруднительно сказать присутствует ли гетероскедастичность. Для проверки воспользуемся критерием ранговой корреляции Спирмэна.
Для начала необходимо упорядочить все множество наблюдений по возрастанию величины объясняющей переменной. Процесс сортировки будет производиться по третьему признаку.
Так как теоретическое значение t критерия
Стьюдента (
)
меньше расчетного (2,21), следовательно,
гипотеза о не значимости коэффициента
Спирмэна принимается, свойство
гетероскедастичности в остатках модели
не обнаруживается.
Проверка остатков на автокоррелированность.
Можно сделать вывод о том, что в остатках модели присутствует положительная автокорреляция (так как DW ( 40,1): ))
Экспоненциальная.
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика ( 40,3): ) |
|
t(α0)= 11,4294; t(α1)= -2,44364; t(α2)= 0,367673; t(α3)= 3,56491; t0,05(40-3 -1) = 2,02 |
1,26715 |
0,621087 |
0,589511 |
19,67 |
1,35146 (P=0,0132) |
Модель значима (расчетное значение F
статистики Фишера (19,67) больше теоретического
значения данной статистики (2,84)). В данной
модели параметры
значимы (расчетное значение t
статистики больше его табличного
значения при уровне доверия 0,95). Параметр
не значим (расчетное значение t
статистики (t(α2)= 0,367673) меньше
критического значения 2,02).
Исключаем из модели второй признак.
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика ( 40,2): ) |
|
|
t(α0)= 11,9975; t(α1)= -2,95015; t(α3)= 3,90215; t0,05(40-3 -1) = 2,02 |
1,25225 |
61,9664 |
59,9105 |
30,14 |
1,30647 (P=0,0089) |
Математическое ожидание остатков модели равно 0.
Проверим следующую гипотезу:
Таким образом, расчетное значение t
статистики (
)
меньше табличного значения (2,02),
следовательно, гипотеза
принимается с вероятностью 95%.
2) Проверка остатков модели на гетероскедастичность:
Затруднительно сказать присутствует ли гетероскедастичность. Для проверки воспользуемся критерием ранговой корреляции Спирмэна.
Для начала необходимо упорядочить все множество наблюдений по возрастанию величины объясняющей переменной. Процесс сортировки будет производиться по третьему признаку.
Так как теоретическое значение t критерия Стьюдента ( ) больше расчетного (0,96), следовательно, свойство гетероскедастичности в остатках модели не обнаруживается.
Проверка остатков на автокоррелированность.
Можно сделать вывод о том, что в остатках модели присутствует положительная автокорреляция (так как DW ( 40,3): ))
На первом этапе работы была обнаружена мультиколлинеарность, убираем 1ую переменную.
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика ( 40,3): ) |
|
|
t(α0)= 10,7299; t(α3)= 6,54869; t0,05(40-3 -1) = 2,02 |
1,37333 |
53,0199 |
51,7836 |
42,89 |
1,02193 (P=0,0003) |
Математическое ожидание остатков модели равно 0.
Проверим следующую гипотезу:
Таким образом, расчетное значение t
статистики (
)
меньше табличного значения (2,02),
следовательно, гипотеза
принимается с вероятностью 95%.
2) Проверка остатков модели на гетероскедастичность:
Затруднительно сказать присутствует ли гетероскедастичность. Для проверки воспользуемся критерием ранговой корреляции Спирмэна.
Для начала необходимо упорядочить все множество наблюдений по возрастанию величины объясняющей переменной. Процесс сортировки будет производиться по третьему признаку.
Так как теоретическое значение t критерия
Стьюдента (
)
больше расчетного (
),
следовательно, свойство гетероскедастичности
в остатках модели не обнаруживается.
Проверка остатков на автокоррелированность.
Можно сделать вывод о том, что в остатках модели присутствует положительная автокорреляция (так как DW ( 40,1): ))
Вид оцененной модели |
Информационные характеристики модели |
||||
Стандартная ошибка S |
Коэффициент детерминации
|
Исправленный коэффициент детерминации
|
F статистика ( ) |
DW статистика |
|
t(α0)= -2,39497; t(α1)= -3,00046; t(α2)= 2,20497; t(α3)= 4,48497; t0,05(40-3 -1) = 2,02 |
237,821 |
0,845014 |
83,2098 |
65,43 |
1,60724 (P=0,0879) |
|
t(α3)= 13,7152; t0,05(40-3 -1) = 2,02 |
268,37 |
0,828275 |
0,828275 |
188,11 |
1,60602 ( |
|
t(α1)= 5,98179; t(α3)= 7,1883; t0,05(40-3 -1) = 2,02 |
194,624 |
0,912001 |
0,909685 |
196,91 |
1,64336 (
40,2):
|
|
t(α1)= -2,43725; t(α3)= 2,9384; t0,05(40-3 -1) = 2,02 |
1,39242 (4.024578) |
0,905835 |
0,903357 |
182,77 |
1,31654 ( 40,2): ) |
|
t(α3)= 2,9384; t0,05(40-3 -1) = 2,02 |
1,47798 (4.384081) |
89,1115 |
89,1115 |
319,18 |
0,961598 ( 40,1): ) |
|
t(α0)= 11,9975; t(α1)= -2,95015; t(α3)= 3,90215; t0,05(40-3 -1) = 2,02 |
1,25225 (3.498205) |
61,9664 |
59,9105 |
30,14 |
1,30647 (P=0,0089) |
|
t(α0)= 10,7299; t(α3)= 6,54869; t0,05(40-3 -1) = 2,02 |
1,37333 (3.948477) |
53,0199 |
51,7836 |
42,89 |
1,02193 (P=0,0003) |
№ модели |
Характеристики прогностической пригодности модели |
||||||||
|
|
U |
|
|
|
|
|
|
|
|
|
0,15 |
0,11 |
0,49 |
-2,66 |
14,61 |
3722,28 |
61,79 |
-0,53 |
54 |
|
|
0,85 |
0,65 |
2,90 |
-80,24 |
80,24 |
113830,8 |
341,68 |
-0,65 |
65 |
|
|
0,93 |
0,68 |
3,06 |
-78,17 |
78,17 |
137335,2 |
375,31 |
-0,34 |
33 |
|
|
4,23E-19 |
4,23E-19 |
2,67E-18 |
-23,43 |
23,43 |
8389,01 |
92,76 |
-0,31 |
30 |
|
|
1,15E-16 |
1,15E-16 |
7,27E-16 |
-16,41 |
16,41 |
4211,22 |
65,72 |
-0,197 |
19 |
|
|
2,57E-22 |
2,57E-22 |
1,62E-21 |
-70,72 |
70,72 |
142853,1 |
382,77 |
-0,16 |
15 |
|
|
2,87E-24 |
2,87E-24 |
1,81E-23 |
-115,09 |
121,01 |
531600,58 |
738, 4 |
0,15 |
26 |
Приложение 17.
Красным цветом отмечены наилучшие характеристики.
