
- •1.Основные понятия
- •2. Компьютерное исследование точности
- •3.Исследование датчиков псевдослучайных чисел
- •3.1 Генерация псевдослучайных чисел
- •3.1.1 Генерация равномерных чисел
- •3.1.2 Генерация случайных чисел,
- •3.2 Тестирование датчиков
- •3.2.1.Проверка на соответствие заданному закону
- •3.2.2. Проверка независимости и некоррелированности
- •3.3. Наиболее часто встречающиеся законы распределения
- •3.4. Контрольные вопросы
- •4. Оценка параметров распределения
- •4.1. Вычисление точечных оценок
- •4.2. Вычисление интервальных оценок
- •4.2.1.Интервальная оценка дисперсии
- •4.2.2.Интервальная оценка математического ожидания
- •4.3. Точность оценивания параметров
- •4.4.Контрольные вопросы
- •5.1. Проверка гипотезы о математическом ожидании
- •5.2. Проверка гипотезы о дисперсии нормально распределенной
- •5.3. Проверка гипотезы о параметре экспоненциального
- •5.4. Точность проверки
- •5.5. Контрольные вопросы
- •6. Проверка статистических гипотез по критериям значимости (согласия)
- •6.1. Критерий значимости (согласия)
- •6.2. Проверка гипотез о параметрах нормально распределенной случайной величины
- •6.4. Точность проверки гипотез по критериям значимости
- •6.5. Контрольные вопросы
- •7.1.2.Проверка гипотезы по критерию Вилкоксона
- •7.2. Проверка гипотезы о наличии статистической независимости
- •7.2.1 Коэффициент ранговой корреляции Спирмена
- •7.2.2. Коэффициент ранговой корреляции Кендалла
- •7.3. Исследование точности ранговых критериев
- •7.4. Контрольные вопросы
7.2. Проверка гипотезы о наличии статистической независимости
между выборками
Пусть результатами наблюдений являются n пар непрерывных случайных величин (xi ,yk), i=1, 2, … ,n. Проверяемой гипотезой H0 является предположение, что величины X и Y независимы, т.е. что F(x,y)=G(x) H(y) при всех x и y, где F(x,y), G(x), H(y) соответственно двумерная и одномерные функции распределения.
В качестве меры связи между X
и Y обычно используют
корреляционный момент Kxy
и коэффициент корреляции
.
Однако для выборок небольшого объема
распределения оценок Kxy
и rxy
зависят от самой выборки (о чем неоднократно
говорились выше) и в этом трудность их
применения для проверки гипотезы H0.
Средством устранения указанной
зависимости является переход к
непараметрическим критериям. Заменим
xi и
yk их
порядковыми номерами в вариационном
ряду, т.е. рангами r (xi)
= i. Для этого упорядочим
наблюдения X иY
по возрастанию или убыванию, т.е. образуем
два вариационных ряда для X
и для Y.
Под рангом наблюдения xi-r(xi)=ri будем понимать номер в вариационном ряду X. Аналогично ранг yi обозначим k(yi)=ki. Использование рангов основано на том, что они инвариантны по отношению к любым монотонным преобразованиям переменных и любое такое преобразование не нарушает гипотезу независимости X иY.
7.2.1 Коэффициент ранговой корреляции Спирмена
Для n пар точек (x,y) равна ri и kj описываются последовательностями натуральных чисел от 1 до n включительно. Так как для взятой наудачу пару (xi,yi) ранг каждой координаты с одинаковой вероятностью может быть любым от 1 до n, можно утверждать, что случайные величины ri и kj имеют равномерное распределение в интервале [1,n].
Среднее m и дисперсия D первых n натуральных чисел определяются соотношениями:
Тогда корреляционный момент и коэффициент корреляции рангов можно записать в виде
(7.7)
(7.8)
Коэффициент rs называется ранговым коэффициентом корреляции Спирмена. В более компактной и удобной для работы форме выражение (7.8) можно записать следующим образом:
(7.9)
Коэффициент ранговой корреляции Спирмена построен как «обычный» коэффициент корреляции. Однако его принципиальная особенность заключается в том, что с его помощью можно устанавливать зависимость между показателями, не измеряемыми в числовой шкале. Например, можно измерить статистическую зависимость способностей школьников в учебе и спорте. Для этого достаточно лишь проранжировать учащихся п их успехам в учебе (ri) и спорте (кi) и воспользоваться формулой (7.9). Если вычисленное значение rs>0, то это означает, что занятия спортом способствуют учению, если rs<0, то, напротив, мешают. Но чтобы сделать серьезный вывод, необходимо учитывать, что rs как и любая статистика, имеет случайный характер. Здесь можно использовать те же идеи, что и в обосновании критериев значимости, описанные в разд. 6, а именно, определить области R0, R1, R2, внутри которых можно с достаточной вероятностью утверждать, что:
а) отличие rs
от нуля (
)
незначимо и следует сделать вывод,
что между группами статистической связи
нет
б) отличие rs от
нуля
значимо и положительно, следовательно,
между группами положительная корреляция;
в) отличие rs от нуля значимо и отрицательно и, следовательно,
группы отрицательно коррелированы.
Как уже указывалось, нас прежде всего интересует вопрос о наличии или отсутствии корреляции. Можно показать, что в случае некоррелированных признаков распределение случайной величины, равной
(7.10)
с ростом объема выборки стремиться к распределению Стьюдента с (п -2) степенями свободы. Поэтому rs можно рассматривать как двусторонний критерий значимости и, задавшись уровнем значимости, по таблицам распределения Стьюдента определить область R0 и принять решение о некоррелированности признаков в зависимости от того, выполняется или нет условие .
Пример. Проиллюстрируем вычисление рангового коэффициента корреляции Спирмена. Пусть значения X и Y заданы табл. 3.
Таблица 3
X |
90 |
86 |
95 |
62 |
60 |
84 |
75 |
50 |
57 |
70 |
Y |
93 |
83 |
92 |
45 |
72 |
80 |
55 |
70 |
62 |
60 |
Требуется вычислить rs. Ранжируем X. Результаты ранжирования приведены в табл. 4.
Таблица4
r(X) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
X |
95 |
90 |
86 |
84 |
75 |
70 |
62 |
60 |
57 |
50 |
Результаты ранжирования Y приведены в табл.5
Таблица 5
r(Y) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Y |
93 |
92 |
83 |
80 |
72 |
70 |
62 |
60 |
55 |
45 |
Последовательность рангов X и Y в парах, упорядоченных по рангам X, сводим в табл. 6
Таблица 6
i=r(xi) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Yi |
2 |
1 |
3 |
4 |
9 |
8 |
10 |
5 |
7 |
6 |
Используя табл. 6 и формулу (7.9), вычисляем ранговый коэффициент корреляции Спирмена:
Определим значимость
.
Примем q=0,01. Число степеней
свободы равно
k=n-2=10-2=8. По таблице работы [8, прил. 6] (0,01; 8)=3,36. По формуле (7.10) вычисляем t для =0,64:
Так как 3,07 3,36 то гипотеза Hо принимается, т.е. при уровне значимости 0,01 можно считать, что корреляционная связь между X и Y незначима.