
Критическое значение коэффициентов корреляции Спирмена –
n |
Уровни значимости |
n |
Уровни значимости |
||
5% |
1% |
5% |
1% |
||
4 |
1,000 |
|
16 |
0,425 |
0,601 |
5 |
0,900 |
1,000 |
18 |
0,399 |
0,564 |
6 |
0,829 |
0,843 |
20 |
0,377 |
0,534 |
7 |
0,714 |
0,893 |
22 |
0,359 |
0,508 |
8 |
0,643 |
0,833 |
24 |
0,343 |
0,485 |
9 |
0,600 |
0,783 |
26 |
0,329 |
0,465 |
10 |
0,564 |
0,746 |
28 |
0,317 |
0,448 |
12 |
0,506 |
0,712 |
30 |
0,306 |
0,435 |
14 |
0,456 |
0,645 |
|
|
|
Коэффициент корреляции признается значимым (достоверным), если вычисленное 0,05.
В рассматриваемом примере число наблюдений меньше 9 (n=5), вследствие чего оценка коэффициента проведена по таблице. При числе наблюдений, равном 5, вычисленное значение =-0,80 меньше критического и поэтому нельзя с достаточной достоверностью утверждать, что между смертностью от рака молочной железы и рака матки существует какая-то зависимость.
Определение тесноты связи между качественными признаками
При изучении зависимости качественных признаков используется коэффициент сопряженности. Для определения тесноты связи в случае альтернативной зависимости двух сопоставляемых признаков (данные, как правило, представлены в четырехпольной таблице) коэффициенты сопряженности рассчитываются по формулам:
коэффициент контингенции Шарлье:
коэффициент ассоциации Юла (Q):
.
Алгоритм расчета:
шифруют через a, b, c, d четыре поля, в которых расположены исходные данные:
;
вычисляют последовательно произведения a*d и b*c;
рассчитывают числитель формулы;
определяют знаменатель формулы;
вычисляют коэффициент Шарлье или Юла.
Пример. Определить зависимость между методами лечения (хирургический и рентгенотерапия, только хирургический) и результатами (выздоровление или нет выздоровления).
Метод |
Выздоровление |
Нет выздоровления |
Всего больных |
I |
14(a) |
8(b) |
22(a+b) |
II |
7(c) |
9(d) |
16(c+d) |
Всего: |
21(a+c) |
17(b+d) |
38(a+b+c+d)=N |
.
Примечание. Коэффициент ассоциации дает быструю, но ориентировочную оценку связи. Довольно точную величину коэффициент Q определяет для значений r между 1,5 и 0,5.
В тех случаях, когда качественные факторы имеют не альтернативное варьирование (четыре поля), а большее число группировок, коэффициент сопряженности вычисляется по формуле:
,
где 2 (фи-квадрат) – коэффициент контингенции Пирсона.
Алгоритм расчета:
составляют корреляционную таблицу;
частоты (числа наблюдений) вписывают наверху каждой клетки таблицы;
частоты возводят в квадрат и результат записывают под ними;
квадрат частот делят на сумму числа наблюдений (частот) каждой графы таблицы (см. пример расчета: 625:46=12,7; 225:75=3 и т.д.);
частные от деления проставляют внизу каждой клетки таблицы;
определяют сумму частных от деления по каждой строке и записывают в нижней части итоговой клетки таблицы (12,7+3,0+2,0=17,7 и т.д.);
указанные суммы делят на соответствующие итоги строк (сумма от числа наблюдений по строке): 17,7:50=0,35; 24,5:60=0,4 и т.д.;
вычисляют значение 2, которое является суммой полученных выше частных от деления без единицы (2=1,28-1=0,28);
полученное значение 2 подставляют в формулу и вычисляют коэффициент сопряженности С.
Пример. Вычислить коэффициент сопряженности при измерении тесноты связи между жилищными условиями и заболеваемостью обследуемых.
Жилищные условия |
Распределение обследуемых по частоте заболеваний |
Итого |
|||
Частота болеющих |
Эпизодически болеющие |
Не болеющие |
|||
Неудовлетворительные |
25 |
15 |
10 |
50 |
|
252=625 |
225 |
100 |
|
|
|
12,7 |
3 |
2 |
17,7 |
0,35 |
|
Удовлетворительные |
18 |
36 |
6 |
60 |
|
324 |
1296 |
36 |
|
|
|
6,6 |
17,3 |
0,6 |
24,5 |
0,4 |
|
Хорошие |
6 |
24 |
40 |
70 |
|
36 |
576 |
1600 |
|
|
|
0,8 |
7,7 |
28,6 |
37,1 |
0,53 |
|
|
25+18+6=49 |
75 |
56 |
180 |
0,35+0,4+0,53=1,28 |
,
отсюда
.
Величина С позволяет судить о наличии средней корреляционной связи между рассматриваемыми факторами.
Контрольные вопросы
Дайте определение корреляционной зависимости, форма связи, направление связи.
Оценка силы связи по величине коэффициента корреляции.
Коэффициент парной корреляции.
Ранговый коэффициент Спирмена.
Определение тесноты связи между качественными признаками.