Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТВ_ответы.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.53 Mб
Скачать
  1. Ранговые коэффициенты корреляции Спирмена и Кендалла.

Оценивание парных ранговых связей.  Ранговый коэффициент корреляции Спирмэна

Для измерения степени тесноты парной статистической связи между ранжировками К.Спирмэн в 1904 г. предложил показатель, который впоследствии получил название рангового коэффициента корреляции Спирмэна /2, 4, 12/

(85)

где Ri(k) и Ri(j) – i-е ранги соответственно параметров k и j. Выражение (85) справедливо при отсутствии в ранжировках групп объединенных рангов. Если такие группы есть, то   определяется из выражения

(86)

где Т(k) и Т(j) – поправочные коэффициенты, которые могут быть найдены из

(87)

ni(k) – количество элементов в группе неразличимых рангов, а m(k) – число групп неразличимых рангов. Нетрудно убедиться, что при совпадающих ранжировках R(k)i = R(j)i   а при противоположных   Во всех прочих случаях   Если  связь между компонентами отсутствует. Кроме того, очевидно, что ранговый коэффициент корреляции обладает свойством симметрии, т.е.  .

Пример:

Исследование зависимости между среднемесячными доходами на семью (в тыс. руб.) и расходами на покупку кондитерских изделий (в руб.) представлено таблицей.

Зависимость расходов семьи на покупку кондитерских изделий от среднемесячных доходов

Доходы семьи (в тыс. руб.) U

4.8

3.8

5.4

4.2

3.4

4.6

3.4

4.8

5.0

3.8

5.2

4.0

3.8

4.6

4.4

Расходы на кондитерские изделия (в руб.), V

75

68

78

71

64

73

66

75

75

65

77

69

67

72

70

Вычислим степень тесноты парной связи между доходами семьи и расходами на приобретение кондитерских изделий с помощью рангового коэффициента корреляции Спирмэна. Составим вариационные ряды для U и V и расставим ранги.

Вариационный ряд для параметра U

U

3,4

3,4

3,8

3,8

3,8

4,0

4,2

4,4

4,6

4,6

4,8

4,8

5,0

5,2

5,4

Ri(U)

1

1

2

2

2

3

4

5

6

6

7

7

8

9

10

Вариационный ряд для параметра V

V

64

65

66

67

68

69

70

71

72

73

75

75

75

77

78

Ri(V)

1

2

3

4

5

6

7

8

9

10

11

11

11

12

13

В следующей таблице представлены ранжировки в соответствии с первоначальным положением элементов в исходной двумерной совокупности.

Ранжировки для параметров U и V

Ri (U)

7

2

10

4

1

6

1

7

8

2

9

3

2

6

5

Ri(V)

11

5

13

8

1

10

3

11

11

2

12

6

4

9

7

Поскольку в ранжировках есть группы объединенных рангов, то для вычисления  необходимо воспользоваться выражениями (86) и (87). Для ранжировки Ri(U) m(U) = 4, n1(U)= 2, n2(U) = 3, n3(U) = 2, n4(U) = 2.  Для ранжировки Ri(V) m(V) = 1, n1(V)= 3. Проведем вычисления

Т(U) = 1/12 [ ( 8 - 2 ) + ( 27 - 3 ) + ( 8 - 2 ) + ( 8 - 2 ) ] = 3.5, Т(V) = 1/12 ( 27 - 3 ) = 2,

Следовательно можно предположить, что между доходами семьи и расходами на покупку кондитерских изделий существует сильная положительная связь.

Ранговый коэффициент корреляции Кендалла

Другим измерителем степени тесноты статистической связи между двумя ранжировками является ранговый коэффициент корреляции Кендалла /2, 4, 12/, определяемый выражением

(88)

где (Ri(k), Ri(j)) – минимальное число обменов последовательности Ri(j), необходимое для приведения ее к упорядочению, аналогичному Ri(k). Очевидно, что (Ri(k), Ri(j) ) симметрична относительно своих аргументов. При совпадающих ранжировках Ri(k) и Ri(j) обменов не будет, следовательно (Ri(k), Ri(j)) = 0 и  . Во всех других случаях для  выполняется условие  . Выражение (88) справедливо при отсутствии в ранжировках групп объединенных рангов. В противном случае необходимо воспользоваться формулой

(89)

где   – оценка парного рангового коэффициента корреляции из выражения (88). Поправочные коэффициенты Т(k) и Т(j) определяются из выражения

(90)

где m(k) – количество групп объединенных рангов, ni(k) – количество элементов в группе. Свойства парного рангового коэффициента корреляции Кендалла аналогичны коэффициенту корреляции Спирмэна. Необходимо заметить /2, 4, 12/, что вычисление   является более трудоемким, чем  . Статистические свойства рангового коэффициента корреляции Кендалла более исследованы. Кроме того, он обладает большими удобствами при его пересчете, если к n статистическим объектам добавляются новые. Между масштабами шкал, в которых измеряют  и  , нет простого соотношения. Но при умеренно больших n (n  10) и при условии, что абсолютные величины значений этих коэффициентов не слишком близки к единице, для них справедливо соотношение

Проверка статистически значимого отличия от нуля ранговых корреляционных характеристик может быть осуществлена при не слишком малых n (n  10) при заданном уровне значимости. Данный вопрос рассмотрен в /2, с.114/. Там же рассмотрена методика построения доверительных интервалов для  и   /2, с.116/.

ПРИМЕР:

Исследование зависимости между среднемесячными доходами на семью (в тыс. руб.) и расходами на покупку кондитерских изделий (в руб.) представлено таблицей.

Зависимость расходов семьи на покупку кондитерских  изделий от среднемесячных доходов

Доходы семьи (в тыс. руб.) U

4.8

3.8

5.4

4.2

3.4

4.6

3.4

4.8

5.0

3.8

5.2

4.0

3.8

4.6

4.4

Расходы на кондитерские изделия (в руб.), V

75

68

78

71

64

73

66

75

75

65

77

69

67

72

70

Вычислим парную ранговую связь между доходами семьи и расходами на кондитерские изделия с помощью коэффициента корреляции Кендалла. Воспользуемся ранжировками, полученными в предыдущем примере для вычисления (Ri(U), Ri(V)). Для этого ранжировку Ri(U) сформируем в порядке возрастания, а Ri(V) – в соответствии с ранжировкой Ri(U). Данные сведем в таблицу.

Ранжировки U и V

Ri (U)

1

1

2

2

2

3

4

5

6

6

7

7

8

9

10

Ri (V)

1

3

5

2

4

6

8

7

10

9

11

11

11

12

13

Вычисление (Ri (U), Ri (V) ) осуществляем следующим образом. Сравниваем во второй ранжировке последовательно каждый элемент, начиная с первого, со всеми последующими. Если предыдущий элемент больше последующего, то необходим обмен между этими элементами и, следовательно, i,j= 1. В противном случае i,j= 0. Индексы i,j означают соответственно порядковые номера сравниваемых рангов в ранжировке Ri(V). Анализ степени согласованности двух ранжировок дает следующие результаты (см. предыдущую таблицу). 1,2 = 1,3 =1,4 = … = 1,15 = 0, 2,3 = 2,5 = 2,6 = 2,7 = … = 2,15 = 0, 2,4 = 1, 3,4 = 3,5 = 1,  3,6 = 3,7 = … = 3,15 = 0,  4,5 = 4,6 = … =  4,15 = 0, 5,6 =  5,7 = … = 5,15 = 0, 6,7 = 6,8 = … =  6,15 = 0, 7,8 = 1, 7,9 = 7,10 = … =  7,15 = 0, 8,9 = 8,10 = … = 8,15 = 0,  9,10 = 1, 9,11= 9,12 = … =  9,15 = 0,  10,11 = … = 10,15 = 0, 11,12 = … = 11,15 = 0,  12,13 = 12,14 = 12,15 = 0,  13,14 =  13,15 = 0,  14,15 = 0. Следовательно, (R(U)i, R(V)i) = 5. Тогда из (88) найдем

Поправочные коэффициенты из (90) равны

Получим   из (89)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]