
- •Тема 20 . Проверка статистических гипотез
- •1. Задачи статистической проверки гипотез
- •2. Статистическая гипотеза, статистический критерий
- •3. Проверка гипотезы об однородности двух или более
- •4. Проверка гипотез о законе распределения
- •5. Критерий согласия ( Критерия Пирсона)
- •6. Критерий Колмогорова
- •7. Критерий однородности Смирнова
- •8. Проверка гипотезы об однородности параметров распределений
- •8.1. Критерий Стьюдента (критерий)
- •8.2. Критерий Фишера (критерий)
- •Глава v1
- •Прикладные вероятностные теории
- •Тема 21. Основы теории информации
- •1. Энтропия как мера неопределённости
- •2. Характеристика (определение) количества информации
- •3. Основы теории измерений
- •4. Основы теории кодирования и передачи информации
- •4.1. Основные понятия, формирование экономичного кода алфавита
- •4.2. Определение характеристик канала передачи информации
- •5. Основы теории надежности
- •6. Определение количественных характеристик
6. Критерий Колмогорова
Критерий Колмогорова для простой
гипотезы является наиболее простым
критерием проверки гипотезы о виде
закона распределения. Он связывает
эмпирическую функцию распределения
с функцией распределения
непрерывной случайной величиныX.
Пусть
- конкретная выборка из распределения
с неизвестной непрерывной функцией
распределения
и
- эмпирическая функция распределения.
Выдвигается простая гипотеза
:
(альтернативная
:
,
).
Сущность критерия Колмогорова состоит в том, что вводят в рассмотрение функцию
(7)
называемой статистикой Колмогорова,
представляющей собой максимальное
отклонение эмпирической функции
распределения
от гипотетической (т. е. соответствующей
теоретической) функции распределения
.
Колмогоров доказал, что при
закон распределения случайной величины
независимо от вида распределения с. в.X стремится кзакону распределения Колмогорова:
где К(х) — функция распределения Колмогорова, для которой составлена таблица, ее можно использовать для расчетов уже прип ≥ 20:
-
α
0,1
0,05
0,02
0,01
0,001
1,224
1.358
1,520
1,627
1,950
Найдем
такое, что
Рассмотрим уравнение
С помощью функции Колмогорова найдем
значение (корень
)
этого уравнения.
Тогда по теореме Колмогорова,
откуда
Если
,
то гипотезу
нет оснований опровергнуть; в противном
случае - ее опровергают.
Пример 3. Монету бросали 4040 раз
(Бюффон). Получиливыпадений герба и
выпадений решётки. Проверить, используя
а) критерий Колмогорова;
б) критерий Пирсона, согласуются ли эти
данные с гипотезой
о симметричности монеты (
0.05).
Случайная величина X
принимает два значения:(решётка);
(герб).
Гипотеза
:
.
а) По таблице распределения Колмогорова
находим корень уравнения
при
.
Следует
.
Тогда
Для нахождения по выборке
строим функции
и
и вычисляем величину
.
|
решётка
|
герб
|
|
0,5 |
0,5 |
xi |
решётка x1 = -1 |
герб x2 = -1 |
ni |
1992 |
2048 |
pi |
|
|
Максимальное отклонение
от
равно 0,007, т.е.
= 0,007. Поскольку
,
то нет оснований отвергать, гипотезу
;
опытные данные согласуются с гипотезой
о симметричности монеты.
б) Вычисляем статистику χ2
По таблице
распределения
находим критическую точку
Так как
,
то опытные данные согласуются с гипотезой
о симметричности монеты.
7. Критерий однородности Смирнова
Для проверки гипотез вида (2) (см. 20.2) об однородности двух или более выборок применяют критерий однородности:
(8)
Здесь, мы ограничимся частным случаем
этой критерии для двух выборок (т.е.).
В качестве критической статистики
применяется критерий однородности
Смирнова, которая имеет вид:
(9)
где
число
элементов выборок;
количество
элементов соответственно первой и
второй выборок, попавших в
й
интервал.
При условии справедливости гипотезывеличина
будет распределена приблизительно по
закону
с
степенью свободы. Гипотеза
опровергается,
если
или
ипринимается при всех остальных
значениях критерия
.
Рассмотрим следующую производственную задачу.
Пример
4. Ниже в таблице
приведены условные
данные о заработной
плате работников двух видов предприятий:
текстильной и машиностроительной
отраслей, полученные в результате
социологического опроса. Объёмы двух
выборок выразятся как
.
-
№
п /п
Интервал зарплаты
в у.е.
Количество элементов выборки, попавших в данный интервал
Текстиль
Машиностроение
1
130-150
4
1
5
3
2
150-170
4
1
5
3
3
170-200
15
8
23
7
4
200-250
51
43
94
8
5
250-300
22
34
56
-12
6
300-350
3
7
10
-4
7
350-400
1
3
4
-2
8
400-450
0
3
3
-3
Решение. Проверим
гипотезу (при уровне
значимости
)
о том, что распределения вероятностей
по заработной плате в анализируемых
отраслях не отличаются друг от друга.
Далее вычисления величины
по формуле критерии Смирнова (9) с учётом
данных в таблице даёт
(10)
Задание.Самостоятельно проверьте это равенство.
Из таблицы значений
-распределения (см. приложение) определяем
критическую точку:
.
Следовательно, гипотезу о совпадении
вероятностных распределений заработной
платы в двух отраслях необходимо
отвергнуть, т.к.
.
При этом, вероятность допускаемой
ошибки равна 0,05.
Критерий однородности Смирнова относится к непараметрическим критериям (в отличие от критерия Пирсона), так как используемая в нём критическая статистика никак не зависит от наших предположений относительно распределения закона случайной величины.