Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
краткий конспект лекций.doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
512 Кб
Скачать

Измерение взаимной зависимости

Для измерения взаимной зависимости двух признаков используются коэффициенты корреляции, зависящие от шкал измерения признаков.

Существует 3 основных вида шкал:

  1. Номинальная или шкала наименований;

  2. Порядковая или ранговая;

  3. Количественная.

Среди количественных шкал различают: интервальные и шкалы отношений.

Оба признака заданы в количественной шкале

  • Для оценки тесноты связи между признаками используется парный линейный коэффициент корреляции Пирсона, который определяется формулой:

,

где величина ху называется ковариацией.

Свойства коэффициента корреляции

  1. rxy[-1; 1] или | rxy | 1.

Чем ближе | rxy | к 1, тем зависимость между признаками более тесная.

Чем ближе | rxy | к 0, тем более слабая зависимость между признаками.

Если rxy < 0,то зависимость обратная.

Если rxy > 0, то зависимость прямая.

  1. rxy является симметричной характеристикой, т.е. rxy = r.

  • Используется коэффициент корреляции Фехнера:

,

где С, Н – это взвешенные частотами mij соответственно число совпадений и несовпадений знаков отклонений значений признаков Х и Y от своих средних значений .

Оба признака заданы в порядковой шкале

В этом случае для анализа статистической зависимости используется коэффициент корреляции Спирмена, который называется коэффициентом корреляции ранга.

Определение. Ранг – порядковый номер значения признака в ранжированной (упорядоченной) совокупности.

Если некоторые из значений признаков Х или Y равны друг другу, то ранг всех таких значений полагается равным среднему арифметическому из тех номеров мест, которые эти значения занимают в ранжированной совокупности. Такие ранги называют связанными.

В случае отсутствия связанных рангов коэффициент Спирмена вычисляется по формуле:

, – разность рангов.

В случае присутствия связанных рангов используется коэффициент вида:

,

где , ,

р – количество связанных рангов признака Х;

ti(x) – количество значений признака Х в i-ом связанном ранге;

q – количество связанных рангов признака Y;

tj(y) – количество значений признака Y в j-ом связанном ранге.

Оба признака заданы в номинальной шкале.

Пусть оба признака заданы в дихотомической шкале, т.е. принимают по два альтернативных значения 0 или 1, да или нет. В этом случае распределение признаков можно представить в виде таблицы

Х\Y

0

1

mx

0

m11

m12

mx0

1

m21

m22

mx1

my

my0

my1

n

my0 = m11+ m21; my1 = m12+ m22.

  • Для определения тесноты связи используются:

Коэффициент ассоциации ;

Коэффициент контингенции .

  • Применяют коэффициент корреляции Пирсона:

,

где рх – доля выборочных значений признака X, равных 1;

ру – доля выборочных значений признака Y, равных 1;

рху – доля вариант (xi, yi) с единичными значениями у обоих признаков.