Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
215
Добавлен:
09.06.2015
Размер:
5.59 Mб
Скачать

3.2.4 Проверка адекватности теоретического распределения

Как бы хорошо ни была подобрана функция теоретического распределения , сглаживающая эмпирическое распределение (гистограмму), между ней и статистическим распределением всегда имеется различие (см. рис. 3.4).

– Чем это обусловлено?

Возможно это случайность, которая проявляется как выборочная ошибка вследствие ограниченности количества измерений, а возможно, что расхождение весьма существенно и обусловлено неправильно выбранным распределением , неудовлетворительно отражающим статистическое распределение. Следовательно, задача состоит в обнаружении некоторого «согласия» между исходными данными и ожидаемыми теоретическими значениями. Для решения этой задачи используют так называемые «критерии согласия».

Для выявления «согласия» между подобранной функцией и экспериментальным (статистическим) распределением выдвигается нулевая гипотеза, которая заключается в предположении, что нет существенного различия между указанными распределениями, а любое зафиксированное отклонение случайно и объясняется лишь выборочной ошибкой, то есть ограниченностью числа измерений реализаций случайной величины. Кроме того, выдвигается конкурирующая (альтернативная) гипотеза, которая противоречит нулевой.

Затем осуществляется проверка состоятельности гипотезы . Для этого используют статистические критерии. Под статистическим критерием понимают случайную величину, которая служит для проверки гипотезы. Всю совокупность значений критерия разделяют на две области:

– область принятия гипотезы – область значений критерия, при которых нулевую гипотезу принимают;

– критическая область – совокупность значений критерия, при которых нулевую гипотезу отвергают (может быть левосторонней, правосторонней и двусторонней).

Граничная точка между двумя указанными областями представляет собой критическую точку (границу) .

При проверке гипотезы могут быть допущены ошибки первого и второго рода:

– ошибка первого рода – отвергнута правильная нулевая гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают .

– ошибка второго рода – принята неправильная нулевая гипотеза. Вероятность ошибки второго рода обозначают . Вероятность события, заключающегося в отсутствии ошибки второго роданазывают мощностью критерия.

Статистический критерий для проверки нулевой гипотезы применяется следующим образом:

– Вычисляют наблюдаемые (эмпирические) значения критерия по эмпирическим выборкам.

– Отыскивают критическую область критерия. Для чего задаются уровнем значимости и ищут критические точки из следующих соотношений:

а) для правосторонней критической области:

, (3.29)

б) для левосторонней критической области:

, (3.30)

в) для двусторонней симметричной области:

. (3.31)

Чаще всего при решении задач статистической проверки гипотез используют критерий (хи-квадрат) или, иначе, критерий согласия Пирсона.

Количественной мерой расхождения между теоретическим и экспериментальным распределением является величина так называемой статистики , рассчитываемая по выражению:

, (3.32)

где – количество измеренных значений случайной величины, попавших вq-ый интервал гистограммы;

–общее количество измерений;

–теоретическая вероятность попадания случайной величины в q-ый интервал, определяемая по функции .

Распределение зависит, кроме переменной, от параметра, называемого числом степеней свободы. Число степеней свободыопределяется как разность между количеством разрядов рассматриваемой гистограммыи числом независимых условий, использованных при подборе теоретического распределения. К таким условиям относятся: равенство единице суммы площадей всех столбцов гистограммы (должно выполняться всегда), равенство моментов теоретического распределения их соответствующим статистическим оценкам (математическое ожидание, дисперсия и т.д.). А также иных, использованных при подборе вида функции. Если число таких условий, то для числа степеней свободы распределенияимеем:

. (3.33)

Схема применения критерия Пирсона о согласованности эмпирического и теоретического распределений следующая:

– По формуле (4.32) вычисляется наблюдаемое значение критерия .

– Определяется число степеней свободы. Для полученной гистограммы с учетом указанных допущений оно равно: .

– Задаются уровнем значимости и по таблице критических точек находят . Уровень значимости следует задать:, тогда.

– Если гипотеза отвергается, как несостоятельная, следовательно, необходимо для «сглаживания» воспользоваться иным теоретическим распределением, например одним из представленных в таблице 4.7.

Важно заметить, что статистические критерии лишь указывают на то, что подобранная теоретическая функция распределения при справедливости нулевой гипотезы не противоречит результатам наблюдений. В частности, это означает, что она не является единственно возможной гипотезой, и не исключено, что какая-то другая функция лучше опишет наблюдаемые значения.

Если статистическая проверка подтвердила состоятельность гипотезы, то, учитывая случайный характер параметра , описываемого подобранным теоретическим распределением, далее следует задать интервальную оценку. Цель интервальной оценки – указание интервала, за пределы которого случайная величинане выйдет с заданной вероятностью.