Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методичка 11после рио.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.71 Mб
Скачать

§ 4. Проверка гипотезы о распределении генеральной совокупности. Критерий Пирсона. Критерий Колмогорова

Прогнозы о значениях, которые может иметь случайная величина точны и обоснованы, если известен ее закон распределения. Приближенное представление о плотности распределения случайной величины дает гистограмма, построенная по опытным данным. Сравнивая ее с графиком плотности известных распределений, можно выбрать подходящий закон распределения. В некоторых случаях, зная физическую природу факторов, влияющих на значения случайной величины, можно сделать теоретическое обоснование вида закона распределения. Так, например, известно, что если отказы изделия устранимы (изделие можно отремонтировать), то продолжительность работы изделия (наработка) до капитального ремонта при коэффициенте вариации % имеет распределение, близкое к нормальному, а при 30%-60%- к распределению Вейбулла. Наработка изделия на отказ, вызванный мгновенным повреждением (например, прокол шины) при 00%, неплохо описывается показательным распределением и т.д.

Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его А), то проверяют нулевую гипотезу: генеральная совокупность распределена по закону А.

Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

Имеется несколько критериев согласия: хи-квадрат Пирсона, Смирнова, Колмогорова и др. Ограничимся описанием применения критерия Пирсона и критерия Колмогорова.

Предположим, что закон распределения выбран, т.е. принята нулевая гипотеза : данные выборки являются значениями случайной величины с плотностью (или с функцией распределения ).

Рассмотрим методику проверки гипотезы по критерию хи-квадрат Пирсона.

1. Подсчитаем опытное значение .

Для этого:

а) По данным выборки строим интервальный вариационный ряд (при выборе интервалов соблюдаем условия: интервалы должны заполнять всю область значений , не пересекаться и содержать не менее чем по пять результатов). Первая строка вариационного ряда представляет собой, выписанные в возрастающем порядке, интервалы значений признака, а вторая – частоты (число появлений) значений из рассматриваемого интервала.

Таблица 3

Интервалы

Частоты

б) Используя нулевую гипотезу, находим вероятности попадания значения в интервалы при одном опыте:

или

Подсчитываем теоретические частоты попаданий значений в интервалы при повторных и независимых опытах.

г) Вычисляем опытные значения критерия

Оказывается, является значением случайной величины, распределение которой при больших (при ) мало отличается от распределения случайной величины с степенями свободы, где - число интервалов, а - число параметров предполагаемого распределения. Так, для показательного распределения , для нормального распределения .

Распределение описывает распределение суммы квадратов независимых случайных величин, каждая из которых имеет нормальное распределение с параметрами 0 и 1.

Распределение затабулировано. В таблице распределения для значений уровня значимости и числа степеней свободы указаны числа , для которых .

2. Выбираем уровень значимости и строим критическую область. Значимыми значениями критерия хи-квадрат являются большие положительные значения . Поэтому критическая область имеет вид . Границу критической области находим из таблицы распределения по уровню значимости и числу степеней свободы (Приложение 3).

3. Делаем вывод по правилу:

а) Гипотеза принимается, если не попало в критическую область;

б) Гипотеза отклоняется, если попало в критическую область.

В последнем случае следует подобрать другой подходящий закон распределения и снова провести проверку его согласия с опытными данными.

Критерий хи-квадрат применяется к довольно разнообразным случаям проверки статистических гипотез. Однако, его приложение, например, к поверке соответствия между гипотетическим и фактически наблюдаемым распределениями существенно зависит от сделанного довольно произвольно подразделения результатов наблюдений на группы; в силу этого результаты проверки гипотезы несколько условны. Сама группировка, т.е. объединение наблюдаемого материала в группы, связана с некоторой потерей имевшейся в первоначальных данных информации. Эти обстоятельства заставляют проявлять известную осторожность, и показания критерия хи-квадрат рекомендуется дополнять показаниями других критериев.

Рассмотрим методику проверки гипотезы по критерию Колмогорова.

На практике кроме критерия Пирсона часто используется критерий Колмогорова, в котором в качестве меры расхождения между теоретическим и эмпирическим распределениями рассматривается максимальное значение абсолютной величины разности между эмпирической функцией распределения и соответствующей теоретической функцией распределения :

,

называемое статистикой критерия Колмогорова (D-статис-тикой).

Доказано, что какова бы ни была функция распределения непрерывной случайной величины Х, при неограниченном увеличении числа наблюдений вероятность неравенства стремиться к пределу

.

Задавая уровень значимости α, из соотношения

Можно найти соответствующее критическое значение . В таблице приводятся критические значения критерия Колмогорова для некоторых α.

Схема применения критерия следующая:

  1. Строятся эмпирическая функция распределения и предполагаемая теоретическая функция распределения

  2. Определяется мера расхождения между теоретическим и эмпирическим распределением и вычисляется величина

.

  1. Если вычисленное значение λ окажется больше критического , определенного на уровне значимости α, то нулевая гипотеза о том, что случайная величина Х имеет заданный закон распределения, отвергается. Если , то считают, что гипотеза не противоречит опытным данным.

Критерий Колмогорова достаточно часто применяется на практике благодаря своей простоте. Однако в принципе его применение возможно лишь тогда, когда теоретическая функция распределения задана полностью. Но такой случай на практике встречается весьма редко. Обычно из теоретических соображений известен лишь вид функции распределения, а ее параметры определяются по эмпирическим данным. При применении критерия Пирсона это обстоятельство учитывается соответствующим уменьшением числа степеней свободы. Такого рода правок в критерии Колмогорова не предусмотрено. Поэтому, если при неизвестных значениях параметров применить Критерий Колмогорова, взяв за значения параметров их оценки, то получим завышенное значение вероятности , а значит, большее критическое значение . В результате есть риск в ряде случаев принять нулевую гипотезу о законе распределения случайной величины как правдоподобную, в то время как на самом деле она противоречит опытным данным.

В заключении отметим, что при проверке ряда гипотез, например, гипотез о законе распределения на заданном уровне значимости, контролируется лишь ошибка первого рода (возможность отвергнуть правильную гипотезу), но нельзя сделать вывод о степени риска, связанного с принятием неверной гипотезы, т.е. с возможностью совершения ошибки второго рода.

В Части 3 данного пособия приведены примеры использования критериев Пирсона и Колмогорова.