
- •Задачи математической статистики. Материальные объекты, их вероятностная природа.
- •Основные понятия выборочного метода. Точечные оценки числовых характеристик случайной величины.
- •Оценка плотности вероятностей и функции распределения.
- •Статистическое оценивание параметров модели. Метод моментов. Метод максимального правдоподобия.
- •Проверка статистических гипотез. Постановка задачи. Общая логическая схема проверки гипотез. Свойства критериев.
- •Гипотезы о равенстве дисперсий двух случайных величин (при известных и неизвестных математических ожиданиях).
- •Гипотезы о равенстве математических ожиданий двух случайных величин (при известных и неизвестных дисперсиях).
- •Критерии проверки гипотезы об однородности двух или нескольких выборок. Критерий однородности 2.
- •Ранговый критерий однородности Вилкоксона-Манна-Уитни.
- •Критерии проверки гипотезы о согласии эмпирического и теоретического распределений. Критерии согласия 2 – Пирсона и Колмогорова-Смирнова. Применимость критериев.
- •Задачи корреляционного анализа. Типы измерителей статистической связи. Постановка задачи корреляционного анализа.
- •Понятие тесноты статистической связи между количественными переменными. Парный коэффициент корреляции.
- •Ранговые коэффициенты корреляции Спирмена и Кендалла.
- •Ложная корреляция и частный коэффициент корреляции.
- •Множественная корреляция. Коэффициент конкордации.
- •Проверка гипотезы о статистической значимости выборочного коэффициента конкордации.
Ранговые коэффициенты корреляции Спирмена и Кендалла.
Оценивание парных ранговых связей. Ранговый коэффициент корреляции Спирмэна
Для измерения степени тесноты парной статистической связи между ранжировками К.Спирмэн в 1904 г. предложил показатель, который впоследствии получил название рангового коэффициента корреляции Спирмэна /2, 4, 12/
|
(85) |
где
Ri(k) и
Ri(j) –
i-е ранги соответственно параметров k и
j. Выражение (85) справедливо при отсутствии
в ранжировках групп объединенных рангов.
Если такие группы есть, то
определяется
из выражения
|
(86) |
где Т(k) и Т(j) – поправочные коэффициенты, которые могут быть найдены из
|
(87) |
ni(k) –
количество элементов в группе неразличимых
рангов, а m(k) – число групп неразличимых
рангов.
Нетрудно убедиться, что при
совпадающих ранжировках R(k)i =
R(j)i
а
при противоположных
Во
всех прочих случаях
Если
связь
между компонентами отсутствует. Кроме
того, очевидно, что ранговый коэффициент
корреляции обладает свойством симметрии,
т.е.
.
Пример:
Исследование зависимости между среднемесячными доходами на семью (в тыс. руб.) и расходами на покупку кондитерских изделий (в руб.) представлено таблицей.
Зависимость расходов семьи на покупку кондитерских изделий от среднемесячных доходов
Доходы семьи (в тыс. руб.) U |
4.8 |
3.8 |
5.4 |
4.2 |
3.4 |
4.6 |
3.4 |
4.8 |
5.0 |
3.8 |
5.2 |
4.0 |
3.8 |
4.6 |
4.4 |
Расходы на кондитерские изделия (в руб.), V |
75 |
68 |
78 |
71 |
64 |
73 |
66 |
75 |
75 |
65 |
77 |
69 |
67 |
72 |
70 |
Вычислим степень тесноты парной связи между доходами семьи и расходами на приобретение кондитерских изделий с помощью рангового коэффициента корреляции Спирмэна. Составим вариационные ряды для U и V и расставим ранги.
Вариационный ряд для параметра U
U |
3,4 |
3,4 |
3,8 |
3,8 |
3,8 |
4,0 |
4,2 |
4,4 |
4,6 |
4,6 |
4,8 |
4,8 |
5,0 |
5,2 |
5,4 |
Ri(U) |
1 |
1 |
2 |
2 |
2 |
3 |
4 |
5 |
6 |
6 |
7 |
7 |
8 |
9 |
10 |
Вариационный ряд для параметра V
V |
64 |
65 |
66 |
67 |
68 |
69 |
70 |
71 |
72 |
73 |
75 |
75 |
75 |
77 |
78 |
Ri(V) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
11 |
11 |
12 |
13 |
В следующей таблице представлены ранжировки в соответствии с первоначальным положением элементов в исходной двумерной совокупности.
Ранжировки для параметров U и V
Ri (U) |
7 |
2 |
10 |
4 |
1 |
6 |
1 |
7 |
8 |
2 |
9 |
3 |
2 |
6 |
5 |
Ri(V) |
11 |
5 |
13 |
8 |
1 |
10 |
3 |
11 |
11 |
2 |
12 |
6 |
4 |
9 |
7 |
Поскольку в ранжировках есть группы объединенных рангов, то для вычисления необходимо воспользоваться выражениями (86) и (87). Для ранжировки Ri(U) m(U) = 4, n1(U)= 2, n2(U) = 3, n3(U) = 2, n4(U) = 2. Для ранжировки Ri(V) m(V) = 1, n1(V)= 3. Проведем вычисления
Т(U) =
1/12 [ ( 8 - 2 ) + ( 27 - 3 ) + ( 8 - 2 ) + ( 8 - 2 ) ] =
3.5,
Т(V) =
1/12 ( 27 - 3 ) = 2,
Следовательно можно предположить, что между доходами семьи и расходами на покупку кондитерских изделий существует сильная положительная связь.
Ранговый коэффициент корреляции Кендалла
Другим измерителем степени тесноты статистической связи между двумя ранжировками является ранговый коэффициент корреляции Кендалла /2, 4, 12/, определяемый выражением
|
(88) |
где (Ri(k),
Ri(j))
– минимальное число обменов
последовательности Ri(j),
необходимое для приведения ее к
упорядочению, аналогичному Ri(k).
Очевидно, что (Ri(k),
Ri(j) )
симметрична относительно своих
аргументов.
При совпадающих ранжировках
Ri(k) и
Ri(j) обменов
не будет, следовательно (Ri(k),
Ri(j))
= 0 и
.
Во всех других случаях для
выполняется
условие
.
Выражение
(88) справедливо при отсутствии в
ранжировках групп объединенных рангов.
В
противном случае необходимо воспользоваться
формулой
|
(89) |
где – оценка парного рангового коэффициента корреляции из выражения (88). Поправочные коэффициенты Т(k) и Т(j) определяются из выражения
|
(90) |
где m(k) – количество групп объединенных рангов, ni(k) – количество элементов в группе. Свойства парного рангового коэффициента корреляции Кендалла аналогичны коэффициенту корреляции Спирмэна. Необходимо заметить /2, 4, 12/, что вычисление является более трудоемким, чем . Статистические свойства рангового коэффициента корреляции Кендалла более исследованы. Кроме того, он обладает большими удобствами при его пересчете, если к n статистическим объектам добавляются новые. Между масштабами шкал, в которых измеряют и , нет простого соотношения. Но при умеренно больших n (n 10) и при условии, что абсолютные величины значений этих коэффициентов не слишком близки к единице, для них справедливо соотношение
Проверка статистически значимого отличия от нуля ранговых корреляционных характеристик может быть осуществлена при не слишком малых n (n 10) при заданном уровне значимости. Данный вопрос рассмотрен в /2, с.114/. Там же рассмотрена методика построения доверительных интервалов для и /2, с.116/.
ПРИМЕР:
Исследование зависимости между среднемесячными доходами на семью (в тыс. руб.) и расходами на покупку кондитерских изделий (в руб.) представлено таблицей.
Зависимость расходов семьи на покупку кондитерских изделий от среднемесячных доходов
Доходы семьи (в тыс. руб.) U |
4.8 |
3.8 |
5.4 |
4.2 |
3.4 |
4.6 |
3.4 |
4.8 |
5.0 |
3.8 |
5.2 |
4.0 |
3.8 |
4.6 |
4.4 |
Расходы на кондитерские изделия (в руб.), V |
75 |
68 |
78 |
71 |
64 |
73 |
66 |
75 |
75 |
65 |
77 |
69 |
67 |
72 |
70 |
Вычислим парную ранговую связь между доходами семьи и расходами на кондитерские изделия с помощью коэффициента корреляции Кендалла. Воспользуемся ранжировками, полученными в предыдущем примере для вычисления (Ri(U), Ri(V)). Для этого ранжировку Ri(U) сформируем в порядке возрастания, а Ri(V) – в соответствии с ранжировкой Ri(U). Данные сведем в таблицу.
Ранжировки U и V
Ri (U) |
1 |
1 |
2 |
2 |
2 |
3 |
4 |
5 |
6 |
6 |
7 |
7 |
8 |
9 |
10 |
Ri (V) |
1 |
3 |
5 |
2 |
4 |
6 |
8 |
7 |
10 |
9 |
11 |
11 |
11 |
12 |
13 |
Вычисление (Ri (U), Ri (V) ) осуществляем следующим образом. Сравниваем во второй ранжировке последовательно каждый элемент, начиная с первого, со всеми последующими. Если предыдущий элемент больше последующего, то необходим обмен между этими элементами и, следовательно, i,j= 1. В противном случае i,j= 0. Индексы i,j означают соответственно порядковые номера сравниваемых рангов в ранжировке Ri(V). Анализ степени согласованности двух ранжировок дает следующие результаты (см. предыдущую таблицу). 1,2 = 1,3 =1,4 = … = 1,15 = 0, 2,3 = 2,5 = 2,6 = 2,7 = … = 2,15 = 0, 2,4 = 1, 3,4 = 3,5 = 1, 3,6 = 3,7 = … = 3,15 = 0, 4,5 = 4,6 = … = 4,15 = 0, 5,6 = 5,7 = … = 5,15 = 0, 6,7 = 6,8 = … = 6,15 = 0, 7,8 = 1, 7,9 = 7,10 = … = 7,15 = 0, 8,9 = 8,10 = … = 8,15 = 0, 9,10 = 1, 9,11= 9,12 = … = 9,15 = 0, 10,11 = … = 10,15 = 0, 11,12 = … = 11,15 = 0, 12,13 = 12,14 = 12,15 = 0, 13,14 = 13,15 = 0, 14,15 = 0. Следовательно, (R(U)i, R(V)i) = 5. Тогда из (88) найдем
Поправочные коэффициенты из (90) равны
Получим из (89)