Задача 11.61.
По выборке двухмерной случайной величины:
Двухмерная выборка № 61:
(1,8; -0,92); (0,37; -0,1); (3,26; -2,88); (2,73; -2,43); (0,98; -0,64); (-0,93; 1,36); (5,06; -4,74); (3,56; -2,8); (1,24; -0,16); (4,83; -4,38); (4,35; -3,38); (1,29; -0,82); (3,75; -3,41); (3,24; -2,86); (4,23; -4,21); (1,93; -1,36); (1,31; -0,74); (2,03; -1,51); (4,88; -3,96); (0,04; -0,01); (2,61; -2,34); (2,89; -2,45); (3,29; -2,89); (1,9; -1,22); (1,86; -1,23); (5,41; -4,57); (1,15; -0,42); (2,33; -2,32); (3,15; -2,33); (3,32; -2,56); (3,73; -2,61); (2,74; -2,14); (0,12; 0,2); (2,87; -1,98); (0,85; -0,34); (3,18; -2,55); (3,62; -3,46); (3,98; -3,55); (3,37; -2,32); (2,08; -1,58); (1,65; -1,59); (1,64; -1,21); (2,13; -0,98); (5,29; -4,99); (1,85; -1,81); (1,69; -0,82); (4,34; -3,88); (2,37; -2,01); (2,82; -2,1); (3,01; -2,83);
- вычислить точечную оценку коэффициента корреляции;
- вычислить интервальную оценку коэффициента корреляции (γ = 0,95);
- проверить гипотезу об отсутствии корреляционной зависимости;
- вычислить оценки параметров a0 и a1 линии регрессии
- построить диаграмму рассеивания и линию регрессии.
Решение:
Для решения задачи удобно воспользоваться приведенной ниже
Таблицей (таблица 11.1). Значения в 3-ем, 4-ом и 5-ом столбцах вычисляются по формулам, приведенными в первой строке таблицы. В последней строке таблицы приведены средние арифметические значений каждого из столбцов. Таким образом получены:
- оценки математических ожиданий по каждой переменной:
-оценки начальных моментов второго порядка по каждой переменной:
-оценка смешанного начального момента второго порядка:
Таблица 1.11
№ |
x |
y |
x2 |
y2 |
x*y |
1 |
1,8 |
-0,92 |
3,24 |
0,8464 |
-1,656 |
2 |
0,37 |
-0,1 |
0,1369 |
0,01 |
-0,037 |
3 |
3,26 |
-2,88 |
10,6276 |
8,2944 |
-9,3888 |
4 |
2,73 |
-2,43 |
7,4529 |
5,9049 |
-6,6339 |
5 |
0,98 |
-0,64 |
0,9604 |
0,4096 |
-0,6272 |
6 |
-0,93 |
1,36 |
0,8649 |
1,8496 |
-1,2648 |
7 |
5,06 |
-4,74 |
25,6036 |
22,4676 |
-23,9844 |
8 |
3,56 |
-2,8 |
12,6736 |
7,84 |
-9,968 |
9 |
1,24 |
-0,16 |
1,5376 |
0,0256 |
-0,1984 |
10 |
4,83 |
-4,38 |
23,3289 |
19,1844 |
-21,1554 |
11 |
4,35 |
-3,38 |
18,9225 |
11,4244 |
-14,703 |
12 |
1,29 |
-0,82 |
1,6641 |
0,6724 |
-1,0578 |
13 |
3,75 |
-3,41 |
14,0625 |
11,6281 |
-12,7875 |
14 |
3,24 |
-2,86 |
10,4976 |
8,1796 |
-9,2664 |
15 |
4,23 |
-4,21 |
17,8929 |
17,7241 |
-17,8083 |
16 |
1,93 |
-1,36 |
3,7249 |
1,8496 |
-2,6248 |
17 |
1,31 |
-0,74 |
1,7161 |
0,5476 |
-0,9694 |
18 |
2,03 |
-1,51 |
4,1209 |
2,2801 |
-3,0653 |
19 |
4,88 |
-3,96 |
23,8144 |
15,6816 |
-19,3248 |
20 |
0,04 |
-0,01 |
0,0016 |
0,0001 |
-0,0004 |
21 |
2,61 |
-2,34 |
6,8121 |
5,4756 |
-6,1074 |
22 |
2,89 |
-2,45 |
8,3521 |
6,0025 |
-7,0805 |
23 |
3,29 |
-2,89 |
10,8241 |
8,3521 |
-9,5081 |
24 |
1,9 |
-1,22 |
3,61 |
1,4884 |
-2,318 |
25 |
1,86 |
-1,23 |
3,4596 |
1,5129 |
-2,2878 |
26 |
5,41 |
-4,57 |
29,2681 |
20,8849 |
-24,7237 |
27 |
1,15 |
-0,42 |
1,3225 |
0,1764 |
-0,483 |
28 |
2,33 |
-2,32 |
5,4289 |
5,3824 |
-5,4056 |
29 |
3,15 |
-2,33 |
9,9225 |
5,4289 |
-7,3395 |
30 |
3,32 |
-2,56 |
11,0224 |
6,5536 |
-8,4992 |
31 |
3,73 |
-2,61 |
13,9129 |
6,8121 |
-9,7353 |
32 |
2,74 |
-2,14 |
7,5076 |
4,5796 |
-5,8636 |
33 |
0,12 |
0,2 |
0,0144 |
0,04 |
0,024 |
34 |
2,87 |
-1,98 |
8,2369 |
3,9204 |
-5,6826 |
35 |
0,85 |
-0,34 |
0,7225 |
0,1156 |
-0,289 |
36 |
3,18 |
-2,55 |
10,1124 |
6,5025 |
-8,109 |
37 |
3,62 |
-3,46 |
13,1044 |
11,9716 |
-12,5252 |
38 |
3,98 |
-3,55 |
15,8404 |
12,6025 |
-14,129 |
39 |
3,37 |
-2,32 |
11,3569 |
5,3824 |
-7,8184 |
40 |
2,08 |
-1,58 |
4,3264 |
2,4964 |
-3,2864 |
41 |
1,65 |
-1,59 |
2,7225 |
2,5281 |
-2,6235 |
42 |
1,64 |
-1,21 |
2,6896 |
1,4641 |
-1,9844 |
43 |
2,13 |
-0,98 |
4,5369 |
0,9604 |
-2,0874 |
44 |
5,29 |
-4,99 |
27,9841 |
24,9001 |
-26,3971 |
45 |
1,85 |
-1,81 |
3,4225 |
3,2761 |
-3,3485 |
46 |
1,69 |
-0,82 |
2,8561 |
0,6724 |
-1,3858 |
47 |
4,34 |
-3,88 |
18,8356 |
15,0544 |
-16,8392 |
48 |
2,37 |
-2,01 |
5,6169 |
4,0401 |
-4,7637 |
49 |
2,82 |
-2,1 |
7,9524 |
4,41 |
-5,922 |
50 |
3,01 |
-2,83 |
9,0601 |
8,0089 |
-8,5183 |
Средние |
2,6238 |
-2,0966 |
8,873554 |
6,35631 |
-7,43118 |
На основе этих данных легко вычислить оценки дисперсий:
и оценку корреляционного момента:
Вычислим точечную оценку коэффициент корреляции по формуле
Вычислим интервальную оценку коэффициента корреляции с надежностью γ = 0,95. Для этого в таблице функции Лапласа найдем значение, равное γ/2= 0,475 и определим значение аргумента, ему соответствующее: z0,95=argΦ(0,475)=1,96.
Вычислим вспомогательные значения a, b:
Таким образом, доверительный интервал для коэффициента корреляции имеет вид:
Проверим гипотезу об отсутствии корреляционной зависимости:
H0: Rxy=0;
H1: Rxy≠0.
Так как объем выборки велик (n ≥ 50 ), то вычислим значение критерия по формуле:
Определим значение Zα из таблицы функции Лапласа:
Так как Z > Zα , то гипотеза H0 отвергается, т.е. между величинами X и Y существует корреляция.
Вычислим оценки параметров a0* и a1* линии регрессии y(x)=a0*+ a1*x по формуле:
Уравнение линии регрессии имеет вид:
Построим диаграмму рассеивания, изобразив значения исходной
двумерной выборки {(х1, у1),(х2, у2),…,(х50, у50)}. в виде точек с
координатами (хi, уi) на плоскости в декартовой системе координат, и линию
регрессии (рис. 11.1).
Рис. 11.1 Диаграмма рассеивания и линия регрессии.