
- •Содержание
- •Постановка задачи
- •Исходные данные Вариант 2
- •Решение и анализ
- •Нахождение коэффициентов парной, частной и множественной корреляции. Их анализ. Проверка наличия мультиколлинеарности.
- •Нахождение скорректированного коэффициента множественной детерминации. Сравнивание его с нескорректированным (общим) коэффициентом детерминации.
- •Оценка статистической надежности уравнения регрессии и коэффициента детерминации с помощью -критерия Фишера
- •Доверительные интервалы для статистически значимых коэффициентов регрессии.
- •Доверительные интервалы для функции регрессии.
- •Доверительные интервалы для индивидуальных значений зависимой переменной.
-
Оценка статистической надежности уравнения регрессии и коэффициента детерминации с помощью -критерия Фишера
F- критерий используется для оценки значимости уравнения регрессии в целом.
=462,1
Fтабл(α;k1,k2)=3,59 , где α=0,05 , k1=m=2, k2=n-m-1=17
F>Fтабл → модель признаётся адекватной и надёжной, т.е. зависимая переменная У (выработка продукции на одного работника) достаточно хорошо описывается включёнными в регрессионную модель переменными.
5. Оценка статистической значимости коэффициентов регрессии с помощью t-критерия Стьюдента.
Критерий Стьюдента используется дл оценки значимости коэфф. регрессии.
Для этого нужно найти стандартные ошибки вычислений параметров модели.
tтабл(1-α;n-m-1)=2,1098
t1расч> tтабл → модель адекватна и надёжна.
t2расч< tтабл → модель не адекватна и не надёжна.
-
Доверительные интервалы для статистически значимых коэффициентов регрессии.
0,881<= β 1<=1,794
-0,11<= β 2<=0,144 β
Это значит, что статистически-значимый коэфф. регрессии β1 будет находиться в интервале от 0,881 до 1,794, а статистически-значимый коэфф. регрессии β 2 будет находиться в интервале от -0,11 до 0,144
-
Доверительные интервалы для функции регрессии.
Использование оценочной модели для прогнозирования.
Xp=
1
Xp= 5,975
21,517
9,46<=Mx(y)<=9,85
Таким образом, выработка продукции на одного работника ожидается в пределах от 9,46 до 9,85 (тыс.руб)
-
Доверительные интервалы для индивидуальных значений зависимой переменной.
8,78<=Mx(y*)<=10,53
Индивидуальные значения выработки продукции на одного работника ожидаются в пределах от 8,78 до 10,53 (тыс.руб)
Вследствие анализа мультиколлинеарности, мы решили исключить фактор Х2.
Получили новое уравнение регрессии:
=
1,32 + 1,33 Х1 - это однофакторная
модель
Рассчитаем для
неё
,
,F
=0,955
=0,952
F=383,28
Сравним
двухфакторной и однофакторной модели:
0,979<0,952 → двухфакторная модель лучше
Проверим выполнение предпосылок метода наименьших квадратов (для двухфакторной модели)
Остатки должны удовлетворять условиям Гаусса-Маркова.
Условия:
-
∑ ei =0
-
Оценка гетероскедостичности.
D(ei)=const=δ2
Если D – постоянна, то это гомоскедостичность.
Если D – не постоянна, то это гетероскедостичность.
-
еi независимы между собой, т.е. в ряду остатков отсутствует существенная автокорреляция.
-
Распределение СВ ei подчиняется нормальному закону распределения.
Проверим выполнение условий Гаусса-Мркова.
1) ∑ ei = -8,88178E-15= 0 - условие выполняется
2) Оценка гетероскедостичности методом Голдфельда.
Упорядочим n наблюдений по мере возрастания переменных Х1 и Х2 (количество вводимых в действие новых основных фондов и удельный вес рабочих высокой квалификации в общей численности рабочих).
Разделим совокупности на 2 группы, и определим по каждой из групп уравнение регрессии.
y |
x1 |
|
y |
x2 |
6 |
3,5 |
|
6 |
10 |
6 |
3,6 |
|
6 |
12 |
7 |
3,9 |
|
7 |
15 |
7 |
4,1 |
|
7 |
17 |
7 |
4,2 |
|
7 |
18 |
8 |
4,5 |
|
8 |
19 |
8 |
5,3 |
|
8 |
19 |
9 |
5,3 |
|
9 |
20 |
9 |
5,6 |
|
9 |
20 |
10 |
6 |
|
10 |
21 |
10 |
6,3 |
|
10 |
21 |
11 |
6,4 |
|
11 |
22 |
11 |
7 |
|
11 |
23 |
12 |
7,5 |
|
12 |
25 |
12 |
7,9 |
|
12 |
28 |
13 |
8,2 |
|
13 |
30 |
13 |
8,4 |
|
13 |
31 |
14 |
8,6 |
|
14 |
31 |
14 |
9,5 |
|
14 |
35 |
15 |
10 |
|
15 |
36 |
Определим остаточные суммы квадратов для первой и второй регрессии.
Границы интервалов |
||
ниж.гр. |
верх.гр. |
|
-0,8879 |
0,934456 |
|
|
|
частота |
-0,8879 |
-0,54548 |
1 |
-0,54548 |
-0,20306 |
3 |
-0,20306 |
0,139355 |
6 |
0,139355 |
0,481773 |
6 |
0,481773 |
0,82419 |
4 |
0,82419 |
1,166608 |
0 |
|
|
|
ДИСПЕРСИОННЫЙ АНАЛИЗ ДЛЯ ПЕРВОЙ ГРУППЫ Х1 |
|||||
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
||
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
1 |
15,02691 |
15,02691 |
112,0275 |
5,54646E-06 |
Остаток |
8 |
1,073088 |
0,134136 |
|
|
Итого |
9 |
16,1 |
|
|
|
ДИСПЕРСИОННЫЙ АНАЛИЗ ВТОРОЙ ГРУППЫ Х1 |
|
||||||||||
|
|
|
|
|
|
||||||
Дисперсионный анализ |
|
|
|
||||||||
|
df |
SS |
MS |
F |
Значимость F |
||||||
Регрессия |
1 |
21,13125 |
21,13125 |
123,507 |
3,83949E-06 |
||||||
Остаток |
8 |
1,368748 |
0,171094 |
|
|
||||||
Итого |
9 |
22,5 |
|
|
|
||||||
ДИСПЕРСИОННЫЙ АНАЛИЗ ДЛЯ ПЕРВОЙ ГРУППЫ Х2 |
|
||||||||||
|
|
|
|
|
|
|
|||||
Дисперсионный анализ |
|
|
|
|
|||||||
|
df |
SS |
MS |
F |
Значимость F |
|
|||||
Регрессия |
1 |
12,77494 |
12,77494 |
30,73612 |
0,000544785 |
|
|||||
Остаток |
8 |
3,325062 |
0,415633 |
|
|
|
|||||
Итого |
9 |
16,1 |
|
|
|
|
|||||
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|||||
ДИСПЕРСИОННЫЙ АНАЛИЗ ДЛЯ ВТОРОЙ ГРУППЫ Х2 |
|
||||||||||
|
|
|
|
|
|
|
|||||
Дисперсионный анализ |
|
|
|
|
|||||||
|
df |
SS |
MS |
F |
Значимость F |
|
|||||
Регрессия |
1 |
21,01341 |
21,01341 |
113,0822 |
5,35438E-06 |
|
|||||
Остаток |
8 |
1,486593 |
0,185824 |
|
|
|
|||||
Итого |
9 |
22,5 |
|
|
|
|
Вычислим Fнаб.
В числителе должна быть наибольшая сумма квадратов.
Fнаб=
или Fнаб=
F1наб = 1,275523
F2наб = 2,2367
Fкр(0,05;9; 9) = 3,43
F1наб < Fкр , значит модель гомоскедостична.
F2наб > Fкр , значит модель гетероскедостична.
Проверка независимости остатков (автокорреляции).
Ряд СВ называется автокоррелированным, если имеется корреляционная связь между последовательными значениями переменной в этом ряду.
Рассчитываем D-статистику.
d =
=
=
2,8398
Найденное значение d=2,83 свидетельствует об отсутствии автокорреляции, и модель признаётся надёжной.
Условие Гаусса-Маркова выполняется.
Проверка подчинения ряда остатков нормальному закону распределения.
Используем RS – критерий.
RS =
=
3,6610
a = 3,18
b = 4,49
a < RS < b
Ряд остатков подчинён нормальному закону распределения
Условие Гаусса-Маркова выполняется.
Критерий поворотных точек (предназначен для проверки случайности элементов ряда остатков)
Р – сумма поворотных точек.
Р=17
Если p>
[]
, то ряд остатков является случайным с
вероятностью 95%
Посчитаем правую часть:
=8,47
Р > 8,47, т.е. ряд остатков является случайным.