
- •Содержание
- •Постановка задачи
- •Исходные данные
- •Решение и анализ
- •Нахождение коэффициентов парной, частной и множественной корреляции. Их анализ. Проверка наличия мультиколлинеарности.
- •Нахождение скорректированного коэффициента множественной детерминации. Сравнивание его с нескорректированным (общим) коэффициентом детерминации.
- •Оценка статистической надежности уравнения регрессии и коэффициента детерминации с помощью -критерия Фишера
- •Доверительные интервалы для статистически значимых коэффициентов регрессии.
- •Доверительные интервалы для функции регрессии.
- •Доверительные интервалы для индивидуальных значений зависимой переменной.
-
Оценка статистической надежности уравнения регрессии и коэффициента детерминации с помощью -критерия Фишера
F- критерий используется для оценки значимости уравнения регрессии в целом.
39,0043
Fтабл(α;k1,k2)=3,59 , где α=0,05 , k1=m=2, k2=n-m-1=17
F>Fтабл → модель признаётся адекватной и надёжной, т.е. зависимая переменная У (выпуск ресурсов) достаточно хорошо описывается включёнными в регрессионную модель переменными.
5. Оценка статистической значимости коэффициентов регрессии с помощью t-критерия Стьюдента.
Критерий Стьюдента используется дл оценки значимости коэфф. регрессии.
Для этого нужно найти стандартные ошибки вычислений параметров модели.
tтабл(1-α;n-m-1)=2,1098
t1расч< tтабл → модель не адекватна и надёжна.
t2расч< tтабл → модель не адекватна и не надёжна.
-
Доверительные интервалы для статистически значимых коэффициентов регрессии.
-0,510400<= β 1<= 0,540232
Это значит, что статистически-значимый коэфф. регрессии β1 будет находиться в интервале от -0,510400 до 0,540232
-
Доверительные интервалы для функции регрессии.
Использование оценочной модели для прогнозирования.
Xp=
1 |
432 |
617 |
Xp=
-54856,6307 <=Mx(y)<= 51125,17599
Таким образом, выработка продукции на одного работника ожидается в пределах от -54856,63073 до 51125,17599 (млн. руб)
-
Доверительные интервалы для индивидуальных значений зависимой переменной.
-166551,4622<=Mx(y*)<= 162820,0075
Индивидуальные значения выработки продукции на одного работника ожидаются в пределах от -166551,4622 до 162820,0075 (млн.руб)
Вследствие анализа мультиколлинеарности, мы решили исключить фактор Х1.
Получили новое уравнение регрессии:
=
- 3171,389 + 2 Х2 - однофакторная модель
Рассчитаем для
неё
,
,F
=
0,819927949
=
0,809923946
F= 81,95998754
Сравним
двухфакторной и однофакторной модели
0,800018 < 0,809923946 → однофакторная модель лучше
Проверим выполнение предпосылок метода наименьших квадратов (для двухфакторной модели)
Остатки должны удовлетворять условиям Гаусса-Маркова.
Условия:
-
∑ ei =0
-
Оценка гетероскедостичности.
D(ei)=const=δ2
Если D – постоянна, то это гомоскедостичность.
Если D – не постоянна, то это гетероскедостичность.
-
еi независимы между собой, т.е. в ряду остатков отсутствует существенная автокорреляция.
-
Распределение СВ ei подчиняется нормальному закону распределения.
Проверим выполнение условий Гаусса-Маркова.
1) ∑ ei = 1,45519E-11 = 0
Условие выполняется
2) Оценка гетероскедостичности методом Голдфельда.
Упорядочим n наблюдений по мере возрастания переменных Х1 и Х2.
Разделим совокупности на 2 группы, и определим по каждой из групп уравнение регрессии.
y |
x1 |
|
y |
x2 |
19968,4 |
8939,8 |
|
19968,4 |
11028,6 |
1330,5 |
639,2 |
|
1330,5 |
690,3 |
36415,7 |
11129,0 |
|
36415,7 |
25286,7 |
131229,9 |
88501,4 |
|
131229,9 |
42727,5 |
21851,9 |
14300,6 |
|
21851,9 |
7551,3 |
28508,6 |
16190,8 |
|
28508,6 |
12317,8 |
73897,5 |
26636,2 |
|
73897,5 |
47261,3 |
4127,9 |
2014,6 |
|
4127,9 |
2112,3 |
43128,0 |
20290,3 |
|
43128,0 |
22838,7 |
13564,4 |
306320,1 |
|
13564,4 |
10501,3 |
35842,7 |
12731,5 |
|
35842,7 |
23111,2 |
24606,8 |
12714,7 |
|
24606,8 |
11891,1 |
8859,5 |
2654,0 |
|
8859,5 |
6205,5 |
12619,1 |
4943,7 |
|
12619,1 |
7675,4 |
7350,8 |
3128,7 |
|
7350,8 |
4221,1 |
35842,7 |
12731,5 |
|
35842,7 |
23111,2 |
24606,8 |
12714,7 |
|
24606,8 |
11891,1 |
8859,5 |
2654,0 |
|
8859,5 |
6205,5 |
12619,1 |
4943,7 |
|
12619,1 |
7675,4 |
7350,8 |
3128,7 |
|
7350,8 |
4221,1 |
ДИСПЕРСИОННЫЙ АНАЛИЗ ДЛЯ ПЕРВОЙ ГРУППЫ Х1
Дисперсионный анализ |
|
|
|
||
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
1 |
27248194 |
27248194 |
0,015861 |
0,902886591 |
Остаток |
8 |
1,37E+10 |
1,72E+09 |
|
|
Итого |
9 |
1,38E+10 |
|
|
|
ДИСПЕРСИОННЫЙ АНАЛИЗ ДЛЯ ВТОРОЙ ГРУППЫ Х1
Дисперсионный анализ |
|
|
|
||
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
1 |
1,04E+09 |
1,04E+09 |
63,22214 |
4,56319E-05 |
Остаток |
8 |
1,32E+08 |
16506553 |
|
|
Итого |
9 |
1,18E+09 |
|
|
|
ДИСПЕРСИОННЫЙ АНАЛИЗ ДЛЯ ПЕРВОЙ ГРУППЫ Х1
Дисперсионный анализ |
|
|
|
|
||
|
df |
SS |
MS |
F |
Значимость F |
|
Регрессия |
1 |
1,1E+10 |
1,1E+10 |
31,71574 |
0,000492 |
|
Остаток |
8 |
2,77E+09 |
3,47E+08 |
|
|
|
Итого |
9 |
1,38E+10 |
|
|
|
|
ДИСПЕРСИОННЫЙ АНАЛИЗ ДЛЯ ВТОРОЙ ГРУППЫ Х2
Дисперсионный анализ |
|
|
|
|
||
|
df |
SS |
MS |
F |
Значимость F |
|
Регрессия |
1 |
1,12E+09 |
1,12E+09 |
148,2059 |
1,92E-06 |
|
Остаток |
8 |
60209354 |
7526169 |
|
|
|
Итого |
9 |
1,18E+09 |
|
|
|
|
Определим остаточные суммы квадратов для первой и второй регрессии.
ниж.гр. |
верх.гр. |
|
-0,8879 |
0,934456 |
|
|
|
частота |
-0,8879 |
-0,54548 |
1 |
-0,54548 |
-0,20306 |
3 |
-0,20306 |
0,139355 |
6 |
0,139355 |
0,481773 |
6 |
0,481773 |
0,82419 |
4 |
0,82419 |
1,166608 |
0 |
Вычислим Fнаб.
В числителе должна быть наибольшая сумма квадратов.
Fнаб=
или Fнаб=
F1наб = 1,27
F2наб = 2,23
Fкр(0,05;9; 9) = 3,43
F1наб < Fкр , значит модель гомоскедостична.
F2наб < Fкр , значит модель гомоскедостична.
Проверка независимости остатков (автокорреляции).
Ряд СВ называется автокоррелированным, если имеется корреляционная связь между последовательными значениями переменной в этом ряду.
Рассчитываем D-статистику.
d =
=2,83
Найденное значение d=2,83 свидетельствует об отсутствии автокорреляции, и модель признаётся надёжной.
Условие Гаусса-Маркова выполняется.
Проверка подчинения ряда остатков нормальному закону распределения.
Используем RS – критерий.
RS =
=3,66
a = 3,18
b = 4,49
a < RS < b
Ряд остатков подчинён нормальному закону распределения!
Условие Гаусса-Маркова выполняется.
Критерий поворотных точек (предназначен для проверки случайности элементов ряда остатков)
Р – сумма поворотных точек.