
- •1. Распределения, связанные с суммой случайных величин
- •1.1 Распределение Стьюдента
- •1.2 Распределение Фишера
- •2. Проверка гипотез
- •3. Отсев грубых измерений
- •3.1 Общие положения
- •3.2 Отсев грубых измерений по малым выборкам
- •3.3 Исключение грубых погрешностей
- •4. Свободные от распределения методы
- •4.1 Критерий об однородности двух выборок
- •4.2 Проверка гипотезы о некоррелированности
- •5. Регрессионный анализ
- •5.1 Модель регрессии
- •5.2 Анализ ошибок
- •5.3 Дисперсия оценок параметров регрессии
- •5.4 Коэффициент корреляции
- •5.5 Доверительный интервал
- •5.6 Проверка значимости коэффициента корреляции
- •5.7 Значимость коэффициента детерминации
- •5.8 Значимость оценок параметров регрессии
4.2 Проверка гипотезы о некоррелированности
двух распределений
Положим, имеются две случайные величины и , распределенные по нормальному закону. Чтобы проверить гипотезу о независимости случайных величин и находится коэффициент корреляции
,
(4.8)
который сравнивается
с порогом
.
Если выполняется условие
,
гипотеза
не отвергается, т.е. считается, что
случайные величины
и
независимы. Однако применение этого
критерия связано с предположением о
нормальности распределений случайных
величин
и
.
Если это условие не соблюдается, выводы
о зависимости или независимости случайных
величин
и
неверны.
Рассмотрим критерий
проверки гипотезы
о некоррелированности случайных величин
и
,
свободный от типа распределения
вероятности случайных величин
и
.
Предположим, произведены выборки
=
и
=
.
Каждую из последовательностей
и
можно получить
способами. Можно считать, что один из
случаев дал возможность составить пары
.
Если одну из последовательностей не
переставлять, получим
возможных инверсий. По полученным парам
производится проверка гипотезы
о некоррелированности случайных величин
и
.
Если последовательности
и
не коррелированны, то это свойство
должно сохраниться и для последовательности
рангов относительно пар
.
Свойство некоррелированности инвариантно
относительно парных перестановок
элементов последовательности
и последовательности
,
[3].
Следуя утверждению [3], составим последовательность пар рангов для последовательностей и таким образом, чтобы рангам элементов сопоставлялись ранги элементов .
1.
Для этого построим вариационный ряд
для последовательности
и определим ранги
элементов
.
Точно также определим ранги
элементов
последовательности
.
Произведем ранжирование рангов
последовательности
и занесём их в первую строку таблицы
4.2.
2. Во вторую строку таблицы 4.2 записываются элементы последовательности соответствующие их рангам.
3. Третья строка таблицы 4.2 заполняется значениями последовательности , сопоставляемые значениям элементов последовательности , т.е. образуются пары ( , ).
Таблица 4.2
|
|
|
|
... |
|
|
|
|
|
... |
|
|
|
|
|
... |
|
|
|
|
|
... |
|
4. В четвертую
строку заносятся значения рангов
последовательности
.
В результате, выписывая только первую и четвертую строки, получим таблицу 4.3 пар рангов последовательностей и .
Таблица 4.3
-
1
2
3
m
Пример 4.1. Положим,
в результате эксперимента получены
данные
и
,
которые ранжированы в следующем порядке:
,
.
Заполним таблицы Пр 4.1 и Пр 4.2.
Таблица Пр 4.1
-
1
2
3
4
5
2
5
4
1
3
Таблица Пр 4.2
-
1
2
3
4
5
2
5
4
1
3
Для проверки гипотезы о некоррелированности последовательностей и предложено несколько критериев [4]: критерий Спирмена, критерий Кендала, критерий Кендала-Бэбингтона (критерий согласованности). Рассмотрим критерий Спирмена. Для проверки гипотезы о некоррелированности последовательностей и Спирменом введен коэффициент ранговой корреляции, равный
.
(4.9)
Для числа
экспериментов от 4 до 10 Спирменом получено
распределение
и составлены таблицы [4, таблица 6.10а,
стр. 363]. Распределение вероятности
симметрично относительно математического
ожидания
и сосредоточено на отрезке
.
Пользуясь симметричностью распределения
,
можно вычислить вероятность
.
Если гипотеза верна,
,
,
(4.10)
,
.
П
ример
4.2. (продолжение примера 4.1). Необходимо
по результатам примера 4.1 построить
критическую область (найти критические
значения для коэффициента корреляции
)
при проверке гипотезы
о некоррелированности последовательностей
и
с уровнем значимости
=0.1.
Ввиду того, что
коэффициент корреляции может принимать
как отрицательные, так и положительные
значения, то должны рассматривать
двустороннюю гипотезу
и определить критические значения
и
,
Рис. 4.1. Критическими областями в этом
случае будут интервалы
,
с уровнями значимости по
=
= 0.05.
В таблице [4, таблица
6.10а, стр. 363] нет точного значения
вероятности
,
поэтому нужно воспользоваться линейной
интерполяцией. Определим ближайшие к
большее и меньшее значения
,
:
,
,
Определим пороговое
значение
с помощью формулы
=
=
.
Так как
принимает только целые значения, примем
=
37.
Рассчитаем по
формуле
нижнее критическое значение:
=
-0.85. Верхнее критическое значение, в
силу симметричности распределения
будет равно
=
0.85. Критическими областями будут
интервалы (-1, -0.85) и (0.85, 1)
Используя (4.9) и
таблицу Пр 4.2, определим экспериментальные
значения
=
24 и
-0.2. Статистика
-0.2 не принадлежит критическим областям,
поэтому гипотеза
о некоррелированности последовательностей
и
не отвергается.
При числе
экспериментов, превышающих
=10,
распределение коэффициента корреляции
хорошо апроксимируется нормальным
распределением [4] с математическим
ожиданием, равным нулю и дисперсией
.
Вероятность
превышения порога
коэффициентом корреляции равна,[4,
стр.98],
,
где
,
,
- обратная функция
нормального распределения с параметрами
(0, 1). Величина
- квантиль нормального распределения
находится как решение уравнения
при известном
.
Пример 4.3. Произведено
=30
экспериментов над случайными величинами
и получены ряды наблюдений
и
.
Взаимное расположение точек показано
на рисунке 4.2.
Необходимо проверить гипотезу о некоррелированности последовательностей и . Уровень значимости =0.05.
Используем
двустороннюю гипотезу
с уровнем значимости
= 0.025.
Определим
=
и
Нижняя граница
критической области равна
=
=-0.362.
Для моделирования
случайных величин, распределенных по
нормальному и равномерному законам, и
определения коэффициента корреляции
Спирмена
составлена программа в пакете Математика.
Программа – 3 вычисления коэффициента
корреляции Спирмена приведена в
приложении.
Согласно критерию Спирмена определим по формуле (4.9) значение =-0.204004.
Ввиду того, что удовлетворяет неравенству -0.362 < < 0.362, гипотеза не отвергается, т.е. выборки и не коррелированны.
Недостатком критерия Спирмена [3] является то, что возможна ситуация, когда выборки и зависимы, но = 0 и гипотеза не отвергается. В этом случае данный критерий будет несостоятельным и следует применить другой критерий для проверки гипотезы о независимости выборок и .