Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Гмурман.doc
Скачиваний:
6
Добавлен:
01.03.2025
Размер:
4.92 Mб
Скачать

§ 7. Выборочный коэффициент корреляции

Как следует из предыдущего параграфа, выбо­рочный коэффициент корреляции определяется равенством

n axav

где х, у—варианты (наблюдавшиеся значения) признаков X и Y; пху—частота пары вариант (лг, у); п—объем выборки (сумма всех частот); ах, ау—выборочные средние квадратические отклонения; х, у—выборочные средние.

Известно, что если величины Y и X независимы, то коэффициент корреляции г=0 (см. гл. XIV, § 17); если /=±1,то Y и X связаны линейной функциональной зависимостью (см. гл. XIV, § 20). Отсюда следует, что коэффициент корреляции г измеряет силу (тесноту) л и-нейной связи между Y и X.

Выборочный коэффициент корреляции гв является 01*енкой коэффициента корреляции г генеральной сово-кУпности и поэтому также служит для измерения линей-н°й связи между величинами—количественными призна­ками У и X. Допустим, что выборочный коэффициент ^°Рреляции, найденный по выборке, оказался отличным _^ нуля. Так как выборка отобрана случайно, то отсюда *4e нельзя заключить, что коэффициент корреляции ге-еРальной совокупности также отличен от нуля. Возни-/ает необходимость проверить гипотезу о значимости УЩественности) выборочного коэффициента корреляции

261

(или, что то же, о равенстве нулю коэффициента корре. ляции генеральной совокупности). Если гипотеза о равен, стве нулю генерального коэффициента корреляции будет отвергнута, то выборочный коэффициент корреляции зна-чим, а величины X п Y коррелированы; если гипотеза принята, то выборочный коэффициент корреляции незна-чим, а величины X и Y не коррелированы.

Проверка гипотезы о значимости выборочного коэф. фициента корреляции для случая нормальной корреляции изложена далее (см. гл. XIX, § 21).

Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность (репре-зентативна), то заключение о тесноте линейной зависимо­сти между признаками, полученное по данным выборки, в известной степени может быть распространено и на генеральную совокупность. Например, для оценки коэф­фициента корреляции гГ нормально распределенной гене­ральной совокупности (при п ^50) можно воспользо­ваться формулой

З амечание 1. Знак выборочного коэффициента корреляции совпадает со знаком выборочных коэффициентов регрессии,, что сле­дует из формул (см. § 6):

Замечание 2. Выборочный коэффициент корреляции равен среднему геометрическому выборочных коэффициентов регрессии Действительно, перемножив левые и правые части равенств (♦), получим

Отсюда

Знак при радикале в соответствии с замечанием 1 должен совпадать со знаком коэффициентов регрессии.

§ 8. Методика вычисления выборочного коэффициента корреляции

Пусть требуется по данным] корреляционной таблицы вычислить выборочный коэффициент корреляций' Можно значительно упростить расчет, если перейти ^

262

ровным вариантам (при этом величина гв не изменится) У ul — {xt C^)lhx и Vj = (yj C2)/h2.

о этом случае выборочный коэффициент корреляции вы­деляют по формуле

гв = (S tiavuv — nuv)/{nouav).

Величины и, v, оа и av можно найти методом произпе-пений (см. гл. XVII, § 4), а при малом числе данных — непосредственно исходя из определений этих величин. Остается указать способ вычисления ^n^uv, где nav — частота пары условных вариант (и, v).

Можно доказать, что справедливы формулы (см. пояс­нение в конце параграфа):

Для контроля целесообразно выполнить расчеты по обеим формулам и сравнить результаты; их совпадение свидетельствует о правильности вычислений.

Покажем на примере, как пользоваться приведенными формулами.

Пример 1. Вычислить ^j navuv по данным корреляционной табл. 14.

Таблица 14

У

X

п У

10

20

30

40

50

60

15

5

7

12

25

20

23

43

35

30

47

2

79

45

10

11

20

6

47

55

9

7

3

19

пх

5

27

63

67

29

9

п = 200

263

Решение. Перейдем к условным вариантам: и/ = (д:,- — Ci)/ht ^ = {Х(—40)/10 (в качестве ложного нуля Сг взята варианта * = 4(Г расположенная примерно в середине вариационного ряда; шаг ^ равен разности между двумя соседними вариантами: 20—10 = 10) Ь Vj = (yj — C2)/h2 = (y/ — 35i)/l0 (в качестве ложного нуля Сг взят» варианта «/ = 35, расположенная в середине вариационного ряда. шаг /г, равен разности между двумя соседними вариантами-25 — 15=10).

Составим корреляционную таблицу в условных вариантах. Прак. тически это делают так: в первом столбце вместо ложного нуля с"

(варианты 35) пишут 0; над нулем последовательно записывают \г

•—2; под нулем пишут 1, 2. В первой строке вместо ложного Куля с' (варианты 40) пишут 0; слева от нуля последовательно записываю-} — 1, —2, —3; справа от нуля пишут 1, 2. Все остальные данные переписывают из первоначальной корреляционной таблицы. В итоге получим корреляционную табл. 15 в условных вариантах.

Таблица 15

V

и

-3

-2

-. | 0

1

2

—2

5

7

12

— 1

20

23

43

.0

30

47

2

79

1

10

11

20

6

47

2

9

7

3

19

па

5 "

27

63

67

29

9

n = 200

Теперь для вычисления искомой суммы X navwo составим рас­четную табл. 16. Пояснения к составлению табл. 16:

1. В каждой клетке, в которой частота nav Ф 0, записывают в правом верхнем углу произведение частоты nuv на варианту и. Например, в правых верхних углах клеток первой строки записаны произведения: 5-(—3)=—15; 7-(—2) = —14.

  1. Складывают все числа, помещенньГе в правых верхних углах клеток одной строки и их сумму записывают в клетку этой же строки столбца 0. Например, для первой строки U=—15+(—14)=—29*

  2. Умножают варианту v на U и полученное произведение заци- сывают в последнюю клетку той же строки, т. е. в клетку столбиа v(J. Например, в первой строке таблицы v = —2 U = — 29; след0" вательно, vU=(—2)-(—29) = 58.

4. Наконец, сложив все числа столбпМ\г>и, получают сумму ^j vU, которая равна искомой сумме s] n,,,,uv. Например, для табл-

имеем vU 169; следовательно, искомая сумма 7, п„му= 169.

V

264 л

I

1

i vV

—3

—2

-i

0

l

2

—2

j—15

|—14

—29

58

5

7

-=I4|

— 1

j—40

—23

—63

63

20

23

—20

—23|

0

-.

—30

0

|

2

| —28

0

30

47

2

о 1

0

|

0

1

1

1

— 10

|

0

|

20

1 12

22

22

10

11

20

6

10 |

11

|

20

|

6

1

2

-

0

|

7

1 6

13

26

9

7

3

18

1

14

1

6

1

—10

—34

—13

29

1

34

12

2 at/= 169

0

uV

30

68

13

0

34

24

u

■*-Контроль|

Для контроля аналогичные вычисления производят по столбца^,, произведения navv записывают в левый нижний угол клетки, соде*' ж а щей частоту nav Ф 0; все числа, помещенные в левых нижний углах клеток одного столбца, складывают и их сумму записывав» в строку V; далее умножают каждую варианту и на V и результат записывают в клетках последней строки.

Наконец, сложив все числа последней строки, получают

2 UV, которая также равна искомой сумме 2 navuv. Например, я и

табл. 16 имеем 2 и^== '69; следовательно. ,^т] n,,7,uv-= 169. и

Теперь, когда мы научились вычислять ^navuv, при-ведем пример на отыскание выборочного коэффициента корреляции.

Пример 2. Вычислить выборочный коэффициент корреляции '"вя=(2пиг'"у(iuv)/(naaav) поданным корреляционной табл. 14.

Решение. Перейдя к условным вариантам, получим корреля­ционную табл. 15. Величины и, ~Ъ, о„ и ov можно вычислить методом произведений; однако, поскольку числа ы,-, О/ малы, вычислим и h~v, исходя из определения средней, а ои и о„ — используя формулы (см, гл. XVI, § 10)

Найдем и и v:

-2]/200 = — 0,425; v = (2 nvv)/n = [ 12 • (—2) + 43 • (— I) + 47 • 1 + 19 • 2]/200 = 0,09. Вычислим вспомогательную величину и2, а затем оа:

1 + 29.1+9.4)/200= 1,405;

Ъа = Км2 — (ы)2 = >^Т,405 —(0.425)2 = 1,106.

Аналогично получим ав= 1,209.

Найдем искомый выборочный коэффициент корреляции, учитывая,

что ранее уже вычислена сумма ^j n,,,,uv= 169:

rB= (2 navuv— nuv)/(nauov) = = [169 —200-(—0,425)-0,09]/(200-1^106-1,209) = 0,603.

Итак, лв = 0,603. 1

Пояснение. Покажем, что 2 nuvuv = 2 у^ > где ^ — i rt«»

Рассмотрим корреляционную таблицу в условных вариантах (для стоты таблица содержит мало данных):

V

и

«1

«I

nUxVx

nU3Vl

na3v3

Найдем 2 navuv двумя способами: суммируя произведения частот И v на произведения соответствующих условных вариант uv по строкам и"по столбцам. Для первой строки таблицы

Для второй строки таблицы Сложим (*) и (**)

2

(**)

=v2 2] "и

и

= f l 2 nu

Итак,

w о

где U =

Аналогично, суммируя произведения частот nav на произведения соответствующих условных вариант uv no столбцам, получим

где V =