Задача 11.4
По выборке двухмерной случайной величины:
Двухмерная выборка № 4:
(2,10; 1,53); (4,69; 0,86); (4,08; -0,24); (5,54; 7,99); (6,66; 10,52); (1,60; 3,06); (5,42; 6,48); (6,75; 8,75); (2,85; 3,15); (2,43; 14,72); (4,60; 1,63); (-6,41; 10,34); (6,35; 6,24); (8,94; 4,03); (-4,10; 0,56); (6,86; 6,07); (5,52; 0,93); (10,09; 1,54); (6,99; 2,02); (-1,29; 1,99); (-0,05; -1,21); (4,67; 7,09); (2,29; 15,45); (6,53; 6,17); (0,44; 0,19); (-0,97; -0,71); (13,55; 6,10); (6,32; 6,83); (4,79; 8,31); (7,13; 13,46); (7,32; -3,32); (2,78; 6,01); (-0,33; 4,55); (3,09; 0,67); (-0,27; 6,81); (4,37; 7,96); (-0,17; 6,99); (-3,89; 3,41); (9,63; 2,46); (-4,09; 1,14); (5,18; 4,15); (-1,71; 4,08); (5,82; 8,02); (0,56; 7,87); (7,67; 3,22); (4,02; 9,68); (3,59; 1,52); (-0,77; 3,96); (5,12; -0,03); (3,50; 4,93);
- вычислить точечную оценку коэффициента корреляции;
- вычислить интервальную оценку коэффициента корреляции (γ = 0,95);
- проверить гипотезу об отсутствии корреляционной зависимости;
- вычислить оценки параметров a0 и a1 линии регрессии
- построить диаграмму рассеивания и линию регрессии.
Решение:
Для решения задачи удобно воспользоваться приведенной ниже
Таблицей (таблица 11.1). Значения в 3-ем, 4-ом и 5-ом столбцах вычисляются по формулам, приведенными в первой строке таблицы. В последней строке таблицы приведены средние арифметические значений каждого из столбцов. Таким образом получены:
- оценки математических ожиданий по каждой переменной:
-оценки начальных моментов второго порядка по каждой переменной:
-оценка смешанного начального момента второго порядка:
Таблица 1.11
№ |
x |
y |
x2 |
y2 |
x*y |
1 |
2,10 |
1,53 |
4,41 |
2,34 |
3,213 |
2 |
4,69 |
0,86 |
22,00 |
0,74 |
4,0334 |
3 |
4,08 |
-0,24 |
16,65 |
0,06 |
-0,9792 |
4 |
5,54 |
7,99 |
30,69 |
63,84 |
44,2646 |
5 |
6,66 |
10,52 |
44,36 |
110,67 |
70,0632 |
6 |
1,60 |
3,06 |
2,56 |
9,36 |
4,896 |
7 |
5,42 |
6,48 |
29,38 |
41,99 |
35,1216 |
8 |
6,75 |
8,75 |
45,56 |
76,56 |
59,0625 |
9 |
2,85 |
3,15 |
8,12 |
9,92 |
8,9775 |
10 |
2,43 |
14,72 |
5,90 |
216,68 |
35,7696 |
11 |
4,60 |
1,63 |
21,16 |
2,66 |
7,498 |
12 |
-6,41 |
10,34 |
41,09 |
106,92 |
-66,2794 |
13 |
6,35 |
6,24 |
40,32 |
38,94 |
39,624 |
14 |
8,94 |
4,03 |
79,92 |
16,24 |
36,0282 |
15 |
-4,10 |
0,56 |
16,81 |
0,31 |
-2,296 |
16 |
6,86 |
6,07 |
47,06 |
36,84 |
41,6402 |
17 |
5,52 |
0,93 |
30,47 |
0,86 |
5,1336 |
18 |
10,09 |
1,54 |
101,81 |
2,37 |
15,5386 |
19 |
6,99 |
2,02 |
48,86 |
4,08 |
14,1198 |
20 |
-1,29 |
1,99 |
1,66 |
3,96 |
-2,5671 |
21 |
-0,05 |
-1,21 |
0,00 |
1,46 |
0,0605 |
22 |
4,67 |
7,09 |
21,81 |
50,27 |
33,1103 |
23 |
2,29 |
15,45 |
5,24 |
238,70 |
35,3805 |
24 |
6,53 |
6,17 |
42,64 |
38,07 |
40,2901 |
25 |
0,44 |
0,19 |
0,19 |
0,04 |
0,0836 |
26 |
-0,97 |
-0,71 |
0,94 |
0,50 |
0,6887 |
27 |
13,55 |
6,10 |
183,60 |
37,21 |
82,655 |
28 |
6,32 |
6,83 |
39,94 |
46,65 |
43,1656 |
29 |
4,79 |
8,31 |
22,94 |
69,06 |
39,8049 |
30 |
7,13 |
13,46 |
50,84 |
181,17 |
95,9698 |
31 |
7,32 |
-3,32 |
53,58 |
11,02 |
-24,3024 |
32 |
2,78 |
6,01 |
7,73 |
36,12 |
16,7078 |
33 |
-0,33 |
4,55 |
0,11 |
20,70 |
-1,5015 |
34 |
3,09 |
0,67 |
9,55 |
0,45 |
2,0703 |
35 |
-0,27 |
6,81 |
0,07 |
46,38 |
-1,8387 |
36 |
4,37 |
7,96 |
19,10 |
63,36 |
34,7852 |
37 |
-0,17 |
6,99 |
0,03 |
48,86 |
-1,1883 |
38 |
-3,89 |
3,41 |
15,13 |
11,63 |
-13,2649 |
39 |
9,63 |
2,46 |
92,74 |
6,05 |
23,6898 |
40 |
-4,09 |
1,14 |
16,73 |
1,30 |
-4,6626 |
41 |
5,18 |
4,15 |
26,83 |
17,22 |
21,497 |
42 |
-1,71 |
4,08 |
2,92 |
16,65 |
-6,9768 |
43 |
5,82 |
8,02 |
33,87 |
64,32 |
46,6764 |
44 |
0,56 |
7,87 |
0,31 |
61,94 |
4,4072 |
45 |
7,67 |
3,22 |
58,83 |
10,37 |
24,6974 |
46 |
4,02 |
9,68 |
16,16 |
93,70 |
38,9136 |
47 |
3,59 |
1,52 |
12,89 |
2,31 |
5,4568 |
48 |
-0,77 |
3,96 |
0,59 |
15,68 |
-3,0492 |
49 |
5,12 |
-0,03 |
26,21 |
0,00 |
-0,1536 |
50 |
3,50 |
4,93 |
12,25 |
24,30 |
17,255 |
Средние |
3,52 |
4,76 |
28,25 |
39,22 |
18,07 |
На основе этих данных легко вычислить оценки дисперсий:
и оценку корреляционного момента:
Вычислим точечную оценку коэффициент корреляции по формуле
Вычислим интервальную оценку коэффициента корреляции с надежностью γ = 0,95. Для этого в таблице функции Лапласа найдем значение, равное γ/2= 0,475 и определим значение аргумента, ему соответствующее: z0,95=argΦ(0,475)=1,96.
Вычислим вспомогательные значения a, b:
Таким образом, доверительный интервал для коэффициента корреляции имеет вид:
Проверим гипотезу об отсутствии корреляционной зависимости:
H0: Rxy=0;
H1: Rxy≠0.
Так как объем выборки велик (n ≥ 50 ), то вычислим значение критерия по формуле:
Определим значение Zα из таблицы функции Лапласа:
Так как Z > Zα , то гипотеза H0 отвергается, т.е. между величинами X и Y существует корреляция.
Вычислим оценки параметров a0* и a1* линии регрессии y(x)=a0*+ a1*x по формуле:
Уравнение линии регрессии имеет вид:
Построим диаграмму рассеивания, изобразив значения исходной
двумерной выборки {(х1, у1),(х2, у2),…,(х50, у50)}. в виде точек с
координатами (хi, уi) на плоскости в декартовой системе координат, и линию
регрессии (рис. 11.1).
Рис. 11.1 Диаграмма рассеивания и линия регрессии.