
Числовые данные
вариант: |
6 |
i |
Уi |
1 |
0,77 |
2 |
-16,69 |
3 |
26,11 |
4 |
0,96 |
5 |
-205,9 |
6 |
56,3 |
7 |
-11,05 |
8 |
0 |
9 |
1,33 |
10 |
-39,1 |
11 |
1,68 |
12 |
-40,88 |
13 |
1,88 |
14 |
120,5 |
15 |
226,85 |
16 |
-8,25 |
17 |
215,39 |
18 |
13,34 |
19 |
111,18 |
20 |
-8,65 |
21 |
-2,49 |
22 |
-1,02 |
23 |
1,78 |
24 |
-163,5 |
25 |
69,84 |
26 |
-0,1 |
27 |
-9,93 |
28 |
-61,19 |
29 |
-40,52 |
30 |
-15,12 |
Решение:
а) Найдем выборочную ковариацию и выборочный коэффициент корреляции.
По
данной выборке
построим интервальный ряд, выделив пять
частичных интервалов: -207 – -120, -120 – -33,
-33 – 54, 54 – 141, 141 – 228. Полученный
интервальный статистический ряд запишем
в виде таблицы:
|
-207 – -120 |
-120 – -33 |
-33 – 54 |
54 – 141 |
141 – 228 |
|
2 |
4 |
18 |
4 |
2 |
Составим
корреляционную таблицу для двумерной
случайной величины
.
|
|
-163,5 |
-76,5 |
10,5 |
97,5 |
184,5 |
|
|
|
-207 – -120 |
-120 – -33 |
-33 – 54 |
54 – 141 |
141 – 228 |
|
-31,5 |
-40 – -23 |
2 |
– |
– |
– |
– |
2 |
-14,5 |
-23 – -6 |
– |
4 |
– |
– |
– |
4 |
2,5 |
-6 – 11 |
– |
– |
18 |
– |
– |
18 |
19,5 |
11 – 28 |
– |
– |
– |
4 |
– |
4 |
36,5 |
28 – 45 |
– |
– |
– |
– |
2 |
2 |
|
|
2 |
4 |
18 |
4 |
2 |
|
Выборочную
ковариацию найдем по формуле:
.
(вычислено
в задаче №12)
Выборочный коэффициент корреляции найдем по формуле:
б) методом наименьших квадратов оцените параметры модели X=aY+b, протестируйте гипотезу {a=0};
в) методом наименьших квадратов оцените параметры модели Y=kX+d, протестируйте гипотезу {k=0};
г) в пунктах (б), (в) найдите и сравните коэффициенты R2;
д) в пунктах (б), (в) протестируйте близость эмпирического распределения остатков моделей к нормальному;
е) каково ожидаемое значение с.в. Y, если известно значение с.в. X? Каков доверительный интервал для Y в этом случае? Постройте график этих зависимостей для выборочных значений Xi и сравните с выборочными значениями Yi.
б) Методом наименьших квадратов оценим параметры модели X=aY+b. а=0.2, b=-0.03.
в) Методом наименьших квадратов оценим параметры модели Y=kX+d. k=5.09, d=0.02.
г)
R
— коэффициент детерминации; это
доля объяснённой дисперсии отклонений
зависимой переменной от её
среднего
значения.
.
При
оценке модели регрессии X
на Y
получаем
;
значит, почти 100% доля признакаY
объясняется признаком Х. Аналогично
получаем
.
Остатки модели:
i |
Уi |
Xi |
|
|
|
|
1 |
0,77 |
0,15 |
0,7821 |
0,124 |
-0,0121 |
0,026 |
2 |
-16,69 |
-3,28 |
-16,6766 |
-3,368 |
-0,0134 |
0,088 |
3 |
26,11 |
5,13 |
26,1303 |
5,192 |
-0,0203 |
-0,062 |
4 |
0,96 |
0,19 |
0,9857 |
0,162 |
-0,0257 |
0,028 |
5 |
-205,9 |
-40,44 |
-205,821 |
-41,21 |
-0,079 |
0,77 |
6 |
56,3 |
11,06 |
56,314 |
11,23 |
-0,014 |
-0,17 |
7 |
-11,05 |
-2,17 |
-11,0267 |
-2,24 |
-0,0233 |
0,07 |
8 |
0 |
0 |
0,0186 |
-0,03 |
-0,0186 |
0,03 |
9 |
1,33 |
0,26 |
1,342 |
0,236 |
-0,012 |
0,024 |
10 |
-39,1 |
-7,68 |
-39,0726 |
-7,85 |
-0,0274 |
0,17 |
11 |
1,68 |
0,33 |
1,6983 |
0,306 |
-0,0183 |
0,024 |
12 |
-40,88 |
-8,03 |
-40,8541 |
-8,206 |
-0,0259 |
0,176 |
13 |
1,88 |
0,37 |
1,9019 |
0,346 |
-0,0219 |
0,024 |
14 |
120,5 |
23,67 |
120,4989 |
24,07 |
0,0011 |
-0,4 |
15 |
226,85 |
44,56 |
226,829 |
45,34 |
0,021 |
-0,78 |
16 |
-8,25 |
-1,62 |
-8,2272 |
-1,68 |
-0,0228 |
0,06 |
17 |
215,39 |
42,31 |
215,3765 |
43,048 |
0,0135 |
-0,738 |
18 |
13,34 |
2,62 |
13,3544 |
2,638 |
-0,0144 |
-0,018 |
19 |
111,18 |
21,84 |
111,1842 |
22,206 |
-0,0042 |
-0,366 |
20 |
-8,65 |
-1,7 |
-8,6344 |
-1,76 |
-0,0156 |
0,06 |
21 |
-2,49 |
-0,49 |
-2,4755 |
-0,528 |
-0,0145 |
0,038 |
22 |
-1,02 |
-0,2 |
-0,9994 |
-0,234 |
-0,0206 |
0,034 |
23 |
1,78 |
0,35 |
1,8001 |
0,326 |
-0,0201 |
0,024 |
24 |
-163,5 |
-32,11 |
-163,421 |
-32,73 |
-0,0787 |
0,62 |
25 |
69,84 |
13,72 |
69,8534 |
13,938 |
-0,0134 |
-0,218 |
26 |
-0,1 |
-0,02 |
-0,0832 |
-0,05 |
-0,0168 |
0,03 |
27 |
-9,93 |
-1,95 |
-9,9069 |
-2,016 |
-0,0231 |
0,066 |
28 |
-61,19 |
-12,02 |
-61,1632 |
-12,268 |
-0,0268 |
0,248 |
29 |
-40,52 |
-7,96 |
-40,4978 |
-8,134 |
-0,0222 |
0,174 |
30 |
-15,12 |
-2,97 |
-15,0987 |
-3,054 |
-0,0213 |
0,084 |
Протестируем
принадлежность остатка модели регрессии
Y=kX+d,
k=5.09,
d=0.02
к нормальному распределению. Будем
использовать критерий
Пирсона.
Для этого разобьём область (-0.08, 0.022) на
5 интервалов с границами -0.08, -0.025, -0.021,
-0.017, -0.013, 0.022 и подсчитаем число элементов
выборки, попавших в каждый интервал.
Вычислим гипотетическую вероятность
попадания в эти же интервалы случайной
величиныZ~N(0,0.02)
(распределение остатков модели должно
иметь математическое ожидание 0; дисперсия
вычислена по выборке).
номер |
середина |
частота |
теор.частота |
1 |
-0.0525 |
6 |
11.74 |
2 |
-0.023 |
6 |
2.42 |
3 |
-0.019 |
5 |
1.52 |
4 |
-0.015 |
7 |
2.38 |
5 |
0.0045 |
6 |
10.48 |
По
таблице можно заключить, даже не вычисляя
реализацию статистики
,
что эмпирическая (выборочная) частоты
слишком отличаются, чтобы принадлежать
одному распределению. Всё же вычислим
её:
.
Это значение соответствует очень малому
уровню значимости(меньше 0.01), поэтому
гипотезу следует отвергнуть.
Протестируем
принадлежность остатка модели регрессии
X=aY+b.
а=0.2, b=-0.03
к нормальному распределению. Будем
использовать критерий
Пирсона.
Для этого разобьём область (-0.8, 0.8) на 5
интервалов с границами -0.8, -0.2, 0.025, 0.05,
0.1, 0.8 и подсчитаем число элементов
выборки, попавших в каждый интервал.
Вычислим гипотетическую вероятность
попадания в эти же интервалы случайной
величиныZ~N(0,0.305)
(распределение остатков модели должно
иметь математическое ожидание 0; дисперсия
вычислена по выборке).
номер |
середина |
частота |
теор.частота |
1 |
-0.5 |
5 |
7.54 |
2 |
-0.0875 |
7 |
8.30 |
3 |
0.0375 |
6 |
0.97 |
4 |
0.075 |
6 |
1.90 |
5 |
0.45 |
6 |
11.01 |
,
поэтому гипотезу о принадлежности
остатков модели к нормальному распределению
следует отвергнуть.
Построим доверительный интервал для математического ожидания величины Y следующим образом:
,
где
– стандартная ошибка групповой средней
,
,
– выборочная остаточная дисперсия
(дисперсия остатка модели); статистика
при
примет значение 2.05. Таким образом,
или
.
Построим график зависимости ожидаемых значений Y при известных значениях Х.
Как
и следовало ожидать (судя по величине
остатков моделей), графики на рисунке
выше неразличимы.