Задача: Имеется связанная выборка из 11 пар значений (хk,yk):
k |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
xk |
51.00000 |
50.00000 |
48.00000 |
51.00000 |
46.00000 |
47.00000 |
49.00000 |
60.00000 |
51.00000 |
52.00000 |
yk |
13.00000 |
15.00000 |
13.00000 |
16.00000 |
12.00000 |
14.00000 |
12.00000 |
10.00000 |
18.00000 |
10.00000 |
k |
11 |
xk |
56.00000 |
yk |
12.00000 |
Требуется вычислить/построить: - коэффициент ковариации; - коэффициент корреляции; - проверить гипотезу зависимости случайных величин X и Y, при уровне значимости α = 0.05 ; - коэффициенты уравнения линейной регрессии; - диаграмму рассеяния (корреляционное поле) и график линии регрессии;
РЕШЕНИЕ:
1. Вычисляем коэффициент ковариации.
Коэффициент ковариации характеризует степень линейной зависимости двух случайных величин Х и Y и вычисляется по формуле:
cov(X,Y) |
= |
|
|
(xk-Mx)(yk-My) ( 1.1 ), где: |
Mx |
= |
|
|
xk, |
My |
= |
|
|
yk( 1.2 ), - оценки математического ожидания случайных величин X и Y соответственно. |
То есть, ковариация, это математическое ожидание произведения центрированных случайных величин 1.1. Вычислим оценку математического ожидания случайной величины Х. 1.1.1. Сложим последовательно все элементы выборки X x1 + x2 + … + x11 = 51.00000 + 50.00000 + ... + 56.00000 = 561.000000 1.1.2. Разделим полученную сумму на число элементов выборки 561.00000 / 11 = 51.00000 Mx = 51.000000 1.2. Аналогичным образом вычислим оценку математического ожидания случайной величины Y. 1.2.1. Сложим последовательно все элементы выборки Y y1 + y2 + … + y11 = 13.00000 + 15.00000 + ... + 12.00000 = 145.000000 1.2.2. Разделим полученную сумму на число элементов выборки 145.000000 / 11 = 13.18182 My = 13.181818 1.3. Вычислим значения центрированных величин (xk-Mx) и (yk-My) для всех элементов выборки. Результаты занесем в таблицу 1. 1.4. Вычислим произведение центрированных величин (xk-Mx)•(yk-My). Результаты занесем в таблицу 1.
Таблица 1
k |
xk |
yk |
( хk-Mx ) |
( yk-My ) |
( хk-Mx )•( yk-My ) |
1 |
2 |
3 |
4 |
5 |
6 |
1 |
51 |
13 |
0.00000 |
-0.18182 |
0.00000 |
2 |
50 |
15 |
-1.00000 |
1.81818 |
-1.81818 |
3 |
48 |
13 |
-3.00000 |
-0.18182 |
0.54545 |
4 |
51 |
16 |
0.00000 |
2.81818 |
0.00000 |
5 |
46 |
12 |
-5.00000 |
-1.18182 |
5.90909 |
6 |
47 |
14 |
-4.00000 |
0.81818 |
-3.27273 |
7 |
49 |
12 |
-2.00000 |
-1.18182 |
2.36364 |
8 |
60 |
10 |
9.00000 |
-3.18182 |
-28.63636 |
9 |
51 |
18 |
0.00000 |
4.81818 |
0.00000 |
10 |
52 |
10 |
1.00000 |
-3.18182 |
-3.18182 |
11 |
56 |
12 |
5.00000 |
-1.18182 |
-5.90909 |
1.5. Вычислим ковариацию cov(X,Y) как среднее значение элементов 6-го столбца таблицы 1. 1.5.1. Сложим последовательно все элементы 6-го столбца y1 + y2 + … + y11 = 0.00000 + -1.81818 + ... + -5.90909 = -34.000000 1.5.2. Разделим полученную сумму на число элементов выборки -34.000000 / 11= -3.09091 ОТВЕТ: cov(X,Y) = -3.090909
2. Вычисляем коэффициент корреляции.
Коэффициент корреляции — это показатель взаимного вероятностного влияния двух случайных величин. Коэффициент корреляции R может принимать значения от -1 до +1. Если абсолютное значение находится ближе к 1, то это свидетельство сильной связи между величинами, а если ближе к 0 — то, это говорит о слабой связи или ее отсутствии. Если абсолютное значение R равно единице, то можно говорить о функциональной связи между величинами, то есть одну величину можно выразить через другую посредством математической функции.
Вычислить коэффициент корреляции можно по следующим формулам:
Rx,y |
= |
|
( 2.1 ), где: |
cov( X,Y ) - ковариация случайных величин Х и Y
σx2 |
= |
|
|
(xk-Mx)2, |
σy2 |
= |
|
|
(yk-My)2( 2.2 ), - оценки дисперсий случайных величин X и Y соответственно. |
Mx |
= |
|
|
xk, |
My |
= |
|
|
yk( 2.3 ), - оценки математического ожидания случайных величин X и Y соответственно. |
или по формуле
Rx,y |
= |
|
( 2.4 ), где: |
Mx |
= |
|
|
xk, |
My |
= |
|
|
yk, |
Mxy |
= |
|
|
xkyk( 2.5 ) |
Sx2 |
= |
|
|
xk2- Mx2, |
Sy2 |
= |
|
|
yk2- My2( 2.6 ) |
На практике, для вычисления коэффициента корреляции чаще используется формула ( 2.4 ) т.к. она требует меньше вычислений. Однако если предварительно была вычислена ковариация cov(X,Y), то выгоднее использовать формулу ( 2.1 ), т.к. кроме собственно значения ковариации можно воспользоваться и результатами промежуточных вычислений.
2.1 Вычислим коэффициент корреляции по формуле ( 2.1 ) для этого воспользуемся результатами представленными в таблице 1, дополнив последнюю двумя новыми столбцами в которые запишем (предварительно вычислив) значения квадратов центрированных случайных величин (xk-Mx)2 и (yk-My)2. Получим таблицу 2.
Таблица 2
k |
xk |
yk |
( хk-Mx ) |
( хk-Mx )2 |
( yk-My ) |
( yk-My )2 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
1 |
51 |
13 |
0.00000 |
0.00000 |
-0.18182 |
0.03306 |
2 |
50 |
15 |
-1.00000 |
1.00000 |
1.81818 |
3.30579 |
3 |
48 |
13 |
-3.00000 |
9.00000 |
-0.18182 |
0.03306 |
4 |
51 |
16 |
0.00000 |
0.00000 |
2.81818 |
7.94215 |
5 |
46 |
12 |
-5.00000 |
25.00000 |
-1.18182 |
1.39669 |
6 |
47 |
14 |
-4.00000 |
16.00000 |
0.81818 |
0.66942 |
7 |
49 |
12 |
-2.00000 |
4.00000 |
-1.18182 |
1.39669 |
8 |
60 |
10 |
9.00000 |
81.00000 |
-3.18182 |
10.12397 |
9 |
51 |
18 |
0.00000 |
0.00000 |
4.81818 |
23.21488 |
10 |
52 |
10 |
1.00000 |
1.00000 |
-3.18182 |
10.12397 |
11 |
56 |
12 |
5.00000 |
25.00000 |
-1.18182 |
1.39669 |
2.2. Вычислим σx2 как среднее значение элементов 5-го столбца таблицы 2. 2.2.1. Сложим последовательно все элементы 5-го столбца 0.00000 + 1.00000 + ... + 25.00000 = 162.000000 2.2.2. Разделим полученную сумму на число элементов выборки σx2 = 162.00000 / 11 = 14.727273 2.3. Вычислим σy2 как среднее значение элементов 7-го столбца таблицы 2. 2.3.1. Сложим последовательно все элементы 7-го столбца 0.03306 + 3.30579 + ... + 1.39669 = 59.636364 2.3.2. Разделим полученную сумму на число элементов выборки σy2 = 59.636364 / 11 = 5.421488 2.4. Вычислим произведение σx2σy2. σx2σy2 = 14.727273• 5.421488 = 79.843727 2.5. Извлечем из последнего числа квадратный корень, получим значение σxσy. σxσy = 8.935532 2.5.Вычислим коэффициент корреляции по формуле ( 2.1 ).
Rx,y |
= |
|
= -3.090909 / 8.935532 = -0.345912 |
ОТВЕТ: Rx,y = -0.345912