- •Тема 6. Корреляционный анализ §1. Понятие о корреляционной связи.
- •§2. Коэффициент линейной корреляции Пирсона. Уравнение регрессии.
- •§3. Коэффициент ранговой корреляции Спирмена.
- •§4. Коэффициент ассоциации.
- •§5. Коэффициент взаимной сопряженности.
- •§6. Частная корреляция.
- •§7. Выбор метода корреляционного анализа экспериментальных данных
- •Выбор метода корреляционного анализа
§3. Коэффициент ранговой корреляции Спирмена.
Данный коэффициент относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале, или количественными переменными, к которым неприменим коэффициент Пирсона.
При расчете данного коэффициента не требуется никаких предположений о характере распределения изучаемого признака.
Вычисление коэффициента Спирмена удобно производить с помощью таблицы:
1) в первый столбец таблицы записывают
номер измерения, во второй – значения
признака первого признака (
),
в третий – значения второго признака
(
);
2) в четвертый столбец таблицы записывают
ранги значений первого признака (
),
в пятый – ранги значений второго признака
(
),
пользуясь общепринятыми правилами
ранжирования. Если измерения сразу
произведены в ранговой шкале, то в
таблицу сразу записывают ранги;
3) в шестой столбец записывают разности
рангов
;
4) в седьмой столбец записывают квадраты
полученных разностей
,
вычисляют сумму значений в данном
столбце;
5) вычисляют коэффициент Спирмена по формуле:
;
Наблюдаемым значением
является выборочное значение коэффициента
корреляции, взятое по модулю:
.
6) выдвигаются гипотезы:
7) критическое значение
находят по таблице критических значений
коэффициента Спирмена, оно зависит от
уровня значимости
и объема выборки
;
7) осуществляют выбор гипотезы, учитывая, что критерий правосторонний (при рассматривается, как правосторонний).
Замечания: 1) объем выборки должен быть не более 40 и не менее 5 (при обработке вручную);
2) при наличии одинаковых рангов в формулу
вносят поправки:
,
где
,
- число одинаковых рангов в четвертом
столбце;
,
- число одинаковых рангов в пятом столбце.
Если в столбце имеется несколько групп
одинаковых рангов, то поправка находится
по формуле:
.
§4. Коэффициент ассоциации.
Если исследуемые признаки являются качественными дихотомическими (число градаций равно 2), то тесноту связи между ними, измеряют с помощью коэффициента ассоциации, предложенного К. Пирсоном в 1901 г. В простейшем виде формула, по которой рассчитывают этот показатель, обозначаемый символом rA , выглядит следующим образом:
.
Здесь а, b, c и d — численности коррелируемых групп (вариант), распределяемых по клеткам четырехпольной таблицы.
Коэффициент ассоциации, как и пирсоновский
коэффициент корреляции, изменяется от
–1 до +1. Значимость выборочного коэфициента
ассоциации оценивают по величине
критерия Пирсона 2.
Нулевая гипотеза сводится к предположению,
что в генеральной совокупности этот
показатель rA
равен нулю. H0-гипотезу
отвергают, если
для принятого уровня значимости ()
и числа степени свободы k = (2 –
1)(2 – 1) =1.
Значимость rA
можно проверить и с помощью t-критерия
Стьюдента. Нулевую гипотезу отвергают,
если
для принятого уровня значимости ()
и числа степеней свободы k = n – 2.
Так как распределение вероятных значений критерия 2 является непрерывным, а качественные признаки дискретны, то их числовые значения не распределяются непрерывно. Учитывая эту особенность, в формулу принято вносить поправку Йейтса на непрерывность вариации, равную половине объема выборки. Эту поправку вычитают из разности (ad – bc), и формула принимает следующий вид:
.
Задача. 100 человекам были предложены 2 задачи. Результаты приведены в таблице. Есть ли связь между правильностью решения этих задач?
|
2 задача |
||
верно |
неверно |
||
1 задача |
верно |
25 |
5 |
неверно |
6 |
64 |
|
Решение.
