Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка ЛР по ТВИМС.doc
Скачиваний:
17
Добавлен:
31.08.2019
Размер:
1.89 Mб
Скачать

7.2. Проверка гипотезы о наличии статистической независимости

между выборками

Пусть результатами наблюдений являются n пар непрерывных случайных величин (xi ,yk), i=1, 2, … ,n. Проверяемой гипотезой H0 является предположение, что величины X и Y независимы, т.е. что F(x,y)=G(x) H(y) при всех x и y, где F(x,y), G(x), H(y) соответственно двумерная и одномерные функции распределения.

В качестве меры связи между X и Y обычно используют корреляционный момент Kxy и коэффициент корреляции . Однако для выборок небольшого объема распределения оценок Kxy и rxy зависят от самой выборки (о чем неоднократно говорились выше) и в этом трудность их применения для проверки гипотезы H0. Средством устранения указанной зависимости является переход к непараметрическим критериям. Заменим xi и yk их порядковыми номерами в вариационном ряду, т.е. рангами r (xi) = i. Для этого упорядочим наблюдения X иY по возрастанию или убыванию, т.е. образуем два вариационных ряда для X и для Y.

Под рангом наблюдения xi-r(xi)=ri будем понимать номер в вариационном ряду X. Аналогично ранг yi обозначим k(yi)=ki. Использование рангов основано на том, что они инвариантны по отношению к любым монотонным преобразованиям переменных и любое такое преобразование не нарушает гипотезу независимости X иY.

7.2.1 Коэффициент ранговой корреляции Спирмена

Для n пар точек (x,y) равна ri и kj описываются последовательностями натуральных чисел от 1 до n включительно. Так как для взятой наудачу пару (xi,yi) ранг каждой координаты с одинаковой вероятностью может быть любым от 1 до n, можно утверждать, что случайные величины ri и kj имеют равномерное распределение в интервале [1,n].

Среднее m и дисперсия D первых n натуральных чисел определяются соотношениями:

Тогда корреляционный момент и коэффициент корреляции рангов можно записать в виде

(7.7)

(7.8)

Коэффициент rs называется ранговым коэффициентом корреляции Спирмена. В более компактной и удобной для работы форме выражение (7.8) можно записать следующим образом:

(7.9)

Коэффициент ранговой корреляции Спирмена построен как «обычный» коэффициент корреляции. Однако его принципиальная особенность заключается в том, что с его помощью можно устанавливать зависимость между показателями, не измеряемыми в числовой шкале. Например, можно измерить статистическую зависимость способностей школьников в учебе и спорте. Для этого достаточно лишь проранжировать учащихся п их успехам в учебе (ri) и спорте (кi) и воспользоваться формулой (7.9). Если вычисленное значение rs>0, то это означает, что занятия спортом способствуют учению, если rs<0, то, напротив, мешают. Но чтобы сделать серьезный вывод, необходимо учитывать, что rs как и любая статистика, имеет случайный характер. Здесь можно использовать те же идеи, что и в обосновании критериев значимости, описанные в разд. 6, а именно, определить области R0, R1, R2, внутри которых можно с достаточной вероятностью утверждать, что:

а) отличие rs от нуля ( ) незначимо и следует сделать вывод, что между группами статистической связи нет

б) отличие rs от нуля значимо и положительно, следовательно, между группами положительная корреляция;

в) отличие rs от нуля значимо и отрицательно и, следовательно,

группы отрицательно коррелированы.

Как уже указывалось, нас прежде всего интересует вопрос о наличии или отсутствии корреляции. Можно показать, что в случае некоррелированных признаков распределение случайной величины, равной

(7.10)

с ростом объема выборки стремиться к распределению Стьюдента с (п -2) степенями свободы. Поэтому rs можно рассматривать как двусторонний критерий значимости и, задавшись уровнем значимости, по таблицам распределения Стьюдента определить область R0 и принять решение о некоррелированности признаков в зависимости от того, выполняется или нет условие .

Пример. Проиллюстрируем вычисление рангового коэффициента корреляции Спирмена. Пусть значения X и Y заданы табл. 3.

Таблица 3

X

90

86

95

62

60

84

75

50

57

70

Y

93

83

92

45

72

80

55

70

62

60

Требуется вычислить rs. Ранжируем X. Результаты ранжирования приведены в табл. 4.

Таблица4

r(X)

1

2

3

4

5

6

7

8

9

10

X

95

90

86

84

75

70

62

60

57

50

Результаты ранжирования Y приведены в табл.5

Таблица 5

r(Y)

1

2

3

4

5

6

7

8

9

10

Y

93

92

83

80

72

70

62

60

55

45

Последовательность рангов X и Y в парах, упорядоченных по рангам X, сводим в табл. 6

Таблица 6

i=r(xi)

1

2

3

4

5

6

7

8

9

10

Yi

2

1

3

4

9

8

10

5

7

6

Используя табл. 6 и формулу (7.9), вычисляем ранговый коэффициент корреляции Спирмена:

Определим значимость . Примем q=0,01. Число степеней свободы равно

k=n-2=10-2=8. По таблице работы [8, прил. 6] (0,01; 8)=3,36. По формуле (7.10) вычисляем t для =0,64:

Так как 3,07 3,36 то гипотеза Hо принимается, т.е. при уровне значимости 0,01 можно считать, что корреляционная связь между X и Y незначима.