
- •Методы статистического изучения корреляционной связи
- •Измерение степени тесноты связи
- •3)Корреляционное отношение - ; 4)Коэффициент ранговой корреляции Спирмэна – s и Кендела; 5) Коэффициент корреляции разностей- ; 6) Коэффициент ассоциации- .
- •Линейный коэффициент корреляции
- •Пример расчета линейного коэффициента корреляции.
- •Корреляционное отношение
- •Коэффициент корреляции рангов
- •Коэффициент корреляции Кендела
- •Регрессионный анализ
- •1) 2) , Такой подход к решению данной проблемы называется методом наименьших квадратов, т.Е.Если мы выдвинули гипотезу о линейном характере связи, то должно соблюдаться следующее требование:
- •Выбор формы уравнения (регрессии)
- •Множественная корреляция
- •Характеристика тесноты связи в многофакторном корреляционном анализе
Коэффициент корреляции рангов
В совокупностях не подчиняющихся закону нормального распределения , или где признаки не имеют численного выражения, для приближенной характеристики степени тесноиы связи между этими признаками, используются, так называемые, непараметрические методы,- или методы ранговой корреляции. Рассмотрим методы ранговой корреляции Спирмэна и Кендала.
Сущность метода: значения Х и У ранжируются, т.е. их располагают в порядке возрастания и им, в зависимости от занимаемого места, присваивается номер- ранг.
Теснота связи
определяется по формуле:
,
Где D- разность рангов; n- численность совокупности.
Пример. Определить наличие и тесноту связи между математическими способностями и умением играть в шахматы.
Совокупность студентов |
Результаты
математической олимпиады, |
Результаты
шахматного первенства, |
|
|
1.Орлов |
6 |
5 |
1 |
1 |
2. Соколов |
7 |
7 |
0 |
0 |
3.Воронов |
1 |
3 |
-2 |
4 |
4. Голубев |
3,5 |
2 |
1,5 |
2,25 |
5. Синичкин |
2 |
1 |
1 |
1 |
6 . Курочкин |
3,5 |
4 |
-0,5 |
0,25 |
7. Куроедов |
5 |
6 |
-1 |
1 |
|
|
|
|
|
,
т.е. наблюдается тесная связь между
признаками.
Коэффициент
корреляции рангов изменяется от +1 до
-1. Так как ранговый коэффициент корреляции
был рассчитан по малому объему информации,
можно предположить, что его отличие от
нуля является результатом случайных
совпадений. Поэтому возникает необходимость
проверить его на существенность. Для
этого воспользуемся Приложением VIII
– таблицей предельных значений
коэффициентов корреляции рангов.
Выдвигаем гипотезу - об отсутствии
связи при заданном уровне значимости.
По указанной таблице находим, что при
объеме выборки 7 единиц (n=7)и
уровне значимости 5% (
критическая величина коэффициента
корреляции рангов составляет
.
Это означает, что при верности нулевой
гипотезы, т.е., если в генеральной
совокупности
,
то максимальное значение при выбранном
уровне значимости не может быть больше,
чем 0,745. Так как, наш расчетный коэффициент
0,83 и он превышает критическое значение
(0,83>0,745), то вероятность нулевой гипотезы
составляет менее 5% . Следовательно,
нулевую гипотезу можно отвергнуть.
Вместе с тем, при
уровне значимости
критическое
значение достигает
,
т.е. в этом случае нулевая гипотеза не
может быть отвергнута.
Коэффициент корреляции Кендела
Расчет этого коэффициента производися по формуле:
,
где S=P+Q
При определении слагаемого Р нужно установить, сколько чисел , находящихся справа (вниз) от каждого из элементов последовательности рангов переменной «У» , имеют величину ранга, превышающего ранг рассматриваемого элемента. Например:
Ранг студентов по математике (х) |
1 |
2 |
3,5 |
3,5 |
5 |
6 |
7 |
Ранг студентов по шахматам |
3 |
1 |
2 |
4 |
6 |
5 |
7 |
Так первое значение в последовательности рангов переменной «У», т.е. число 3 , превосходит его по величине 4 числа (4,6,5,7).
Второе число 1, превосходит по величине 5 чисел (2,4,6,5,7).
Третье число 2, превосходит по величине 4 числа.
Четвертое число 4, превосходит по величине 3 числа.
Пятое число 6, превосходит по величине 1 число.
Шестое число 5, превосходит по величине 1 число
Тогда, Р=5+4+3+1+1=14
Второе слагаемое- Q характеризует не соответствие последовательности рангов переменной «У» переменной «Х» . Для вычисления Q, подсчитываем сколько чисел , находящихся справа от каждого из последовательности рангов переменной «У» имеет ранг меньше, чем ранг этой переменной. Такие величины берутся со знаком «-« .
Q=-2-0-0-0-1-0-0=3=
-3 S= 14+(-3)=11
.
При достаточном большом числе наблюдений, между коэффициентом корреляции рангов Спирмэна и Кендела существует следующее соотношение:
.
Для нашего примера :1,5*0,523=0,785
Коэффициент конкордации
Для оценки степени тесноты связи между несколькими признаками при использовании ранговой корреляции, применяется коэффициент конкордации (согласия)-ω, который вычисляется по формуле:
ω=
,
где m- число факторов ( экспертов, мнений);
n –число ранжированных единиц;
S- сумма квадратов отклонений рангов.
Если обозначить
ранг
i-
того фактора у j-той
единицы, то величина S
будет рассчитываться по формуле:
Пример. Три эксперта независимо друг от друга оценивают продукцию одного вида по семи предприятиям:
№ предприятия |
1-й эксперт |
2-й эксперт |
3-й эксперт |
|
|
1 |
4 |
4 |
3 |
11 |
121 |
2 |
1 |
3 |
1 |
5 |
25 |
3 |
3 |
1 |
2 |
6 |
36 |
4 |
7 |
6 |
5 |
18 |
324 |
5 |
5 |
5 |
7 |
17 |
289 |
6 |
6 |
7 |
6 |
19 |
361 |
7 |
2 |
2 |
4 |
8 |
64 |
Итого |
|
|
|
84 |
1220 |
|
|
|
|
|
|
=
ω=
Рассчитанный коэффициент конкордации свидетельствует о наличии достаточно тесной согласованной оценки между экспертами.
Корреляция качественных признаков и показатели ее тесноты.
Наряду с изучением корреляционной зависимости между количественными показателями, статистическими методами можно определить наличие связи и между качественными альтернативными признаками. В этом случае ставится задача определить наличие и степень тесноты связи между альтернативными признаками.
Пример. В результате случайной выборки обследовано 500 человек для определения наличия и степени тесноты связи между их ростом и весом. Ниже приводятся данные обследования.
Признак А/Признак В |
Распределение по весу «Легкие»(до67кг.) «Тяжелые» (свыше67кг.) |
Итого |
||
Распределение по росту |
«Низкие» (до 167см) |
Зо4 (а) |
17(b) |
321(a+b) |
«Высокие» (свыше 167см) |
112 (c) |
67(d) |
179(c+d) |
|
|
Итого |
416 (a+c) |
84 (b+d) |
500(a+b+c+d) |
Построенная в такой форме таблица носит название «таблица четырех полей»
а)Коэффициент
ассоциации:
Рассчитанный коэффициент ассоциации свидетельствует о тесной связи между ростом и весом.
б) Коэффициент контингенции (показатель сходства) также используется для изучения зависимости между альтернативными признаками.
Коэффициент контингенции всегда меньше коэффициента ассоциации. Различия в величине коэффициентов, полученных на основе одних и тех же данных, свидетельствует о том, что коэффициент контингенции дает более осторожную величину оценки степени тесноты связи.