Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Reliability.doc
Скачиваний:
12
Добавлен:
27.10.2018
Размер:
1.46 Mб
Скачать

2.4. Проверка гипотезы о законе распределения

Исследование надежности устройств начинается с обработки экспериментальных данных и построения по этим данным подходящей математической модели отказов устройств. Наиболее полная информация о надежности устройства содержится в плотности распределения времени его наработки на отказ. Следовательно, задача, которую нужно уметь решать – выбор и проверка гипотезы о законе распределения с.в.

Сформулированная задача – одна из классических задач математической статистики. Напомним коротко стандартные подходы к решению этой задачи.

Предположим, что в нашем распоряжении имеется случайная выборка , полученная в результате независимых экспериментов. Нужно «угадать» каким было распределение вероятностей с.в., значения которой мы наблюдали.

Понятно, при заданном распределении вероятностей могут получаться различные выборки, некоторые из выборок более вероятны, другие – менее вероятны при заданном законе распределения. Более того, некоторое распределение вероятностей случайно может породить такую выборку, которая имитирует совсем другое распределение. Например, при бросании правильной монеты выпадение 10 орлов подряд маловероятно, но возможно. Наступление этого события нельзя считать доказательством того, что монета неправильная.

Общая методика решения задачи построения модели одномерного распределения такова.

Исходя из физических соображений, из практического опыта либо из удобства последующего применения, принимаем решение о предполагаемой модели или же рассматриваем несколько моделей-кандидатов. Зафиксируем одну из них и каким-либо образом выберем параметры этой модели. Таким образом, имеем некоторую гипотезу о модели источника данных, обозначим эту гипотезу . Хорошо было бы уметь вычислять вероятности вида . Мы смогли бы говорить, насколько вероятна наша гипотеза при заданной выборке. Однако, согласно формуле Байеса, эта вероятность зависит от априорного распределения вероятностей на множестве гипотез:

.

У нас есть только одна гипотеза , и нет никакого априорного распределения , поэтому найти вероятность мы не сможем. Идея решения задачи состоит в следующем. По выборке строится эмпирическая плотность (либо эмпирическая функция распределения ) и вычисляется некоторая мера различия (или ) между эмпирическим распределением и теоретическим распределением вероятностей (или ). Мера различия выбирается так, чтобы для нее был известен способ вычисления либо оценивания функции распределения вероятностей для произвольной гипотезы . Очевидно, гипотезу следует принять, если различие мало. Точнее говоря, полученное (достаточно малое) значение должно быть весьма вероятным при условии, что гипотеза верна.

Чтобы сформулировать правило проверки гипотезы о законе распределения более точно, потребуется несколько определений.

Меру различия между двумя распределениями вероятностей, эмпирическим и теоретическим, называют критерием согласия.

Вводится пороговое значение , называемое уровнем значимости гипотезы. Уровень значимости гипотезы определяет вероятность того, что гипотеза будет отклонена при условии, что она верна. Значение критерия называется критическим, если оно является решением уравнения .

Гипотеза принимается с уровнем значимости , если вычисленное по выборке значение критерия согласия удовлетворяет условию

.

Итак, для проверки гипотезы о законе распределения нужно выполнить следующие шаги:

  1. Определить значения параметров модели.

  2. Проверить гипотезу о том, что выборка порождена с.в. с заданным законом распределения, для чего

    1. Вычислить критерий согласия .

    2. Значение критерия сравнивается с порогом , соответствующим уровню значимости .

    3. Гипотеза принимается, если значение критерия меньше порога.

Приведем описание двух наиболее часто используемых критериев.

Критерий Пирсона или критерий .

Область значений с.в. разбивается на непересекающиеся множества , будем называть эти множества классами. В случае непрерывной с.в. классами можно выбрать неперекрывающиеся отрезки числовой оси. Пусть обозначает число значений выборки, содержащееся в классе . Разбиение на классы должно быть таким, чтобы при всех выполнялось условие . Обозначим через вероятность класса , вычисленную по теоретическому распределению. Тогда значение критерия Пирсона вычисляется по формуле

. (2.21)

Чтобы охарактеризовать распределение вероятностей для этой случайной величины, посмотрим внимательно на правую часть (2.21). Имеем сумму квадратов случайных величин вида

.

При независимых опытах, выполняемых со случайной величиной, для которой гипотеза верна, числитель имеет нулевое математическое ожидание и, если достаточно велико, то разности в числителе имеют гауссовское распределение. Нормирующий множитель подобран так, что вычисленная по формуле (2.21) имеет такое же распределение, как сумма квадратов гауссовских с.в. с нулевым математическим ожиданием и единичной дисперсией (если, конечно, гипотеза верна!). Это распределение называется -распределением с степенями свободы . Плотность -распределения с степенями свободы имеет вид

.

Сравнивая эту формулу с формулой для Гамма-распределения (таблица 2.1) убеждаемся в том, что -распределение с степенями свободы является его частным случаем с параметрами , . Таким образом, его функция распределения известна и может быть использована для определения порогового значения принятия гипотезы, соответствующего требуемому уровню значимости.

Распределение табулировано, и его таблицы можно найти во многих справочных пособиях. Однако в настоящее время целесообразнее воспользоваться компьютером для подсчета необходимых значений функции распределения. В частности, если доступен статистическая библиотека пакета MATLAB, то можно воспользоваться функцией chi2inv(alfa,r) , в которую передаются уровень значимости в виде входного параметра alfa и число степеней свободы в виде второго параметра r . Функция возвращает пороговое значение такое, что

,

где – кумулятивная функция -распределения.

Если статистическая библиотека не доступна, можно воспользоваться стандартными программами для вычисления Гамма-функции и неполной Гамма-функции.

Использование критерия при вычислении по выборке параметров закона распределения.

Если по выборке вычислены некоторое количество , то для вычислении порогового значения используется -распределения с = степенями свободы. Например, если гипотезой служит гауссовское распределение и по выборке оценивались его математическое ожидание и дисперсия, то и число степеней свободы равно

Критерий Колмогорова-Смирнова.

Этот критерий сравнивает непосредственно эмпирическую функцию распределения , полученную по выборке объема и гипотетическую функции распределения . Значение критерия вычисляется по формуле

. (2.22)

Про случайную величину известно, что

, (2.23)

где – кумулятивная функция распределения Колмогорова,

. (2.24)

Квантиль распределения, соответствующий уровню значимости , т.е. решение уравнения , можно подсчитать по приближенной формуле

. (2.25)

В заключение отметим, что методы математической статистики дают лишь удобный способ сформулировать некоторые математически обоснованные суждения о соответствии между результатами эксперимента и некоторой моделью. Большое или маленькое значение критерия согласия, строго говоря, напрямую не говорит о том, насколько близкими будут реальные показатели надежности устройства к показателям, вычисленным по математической модели.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]