Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МОДЕЛИРОВАНИЕ ПРОЦЕССОВ И СИСТЕМ / otvety_na_teorit_voprosy(последний вопрос в КП).docx
Скачиваний:
66
Добавлен:
21.03.2016
Размер:
865.75 Кб
Скачать

Вопрос 1. Проверка статистических гипотез о значении параметра распределения Общий подход к проблеме

Определим общий подход к задаче, рассматриваемой в этом разделе. Она формулируется следующим образом: на основании некоторых допущений можно считать, что функция распределения случайной величины есть . Спрашивается, совместимы ли наблюдаемые значения с гипотезой: имеет распределение ?

В частности, если класс функции распределения не вызывает сомнений и в проверке нуждаются только значения некоторых параметров, определяющих это распределение, то в задаче спрашивается: не опровергают ли результаты наблюдений ту гипотезу, что интересующие нас параметры распределения имеют предполагаемые значения. Эта - задача проверки простой гипотезы. Если проверяемая гипотеза состоит в том, что параметры принимают не точно определенные значения, а какие-то из некоторых определенных множеств, то гипотеза называется сложной.

В качестве второго примера рассмотрим проверку однородности статистического материала. Частным случаем этой задачи является следующая задача: имеется две последовательности независимых наблюдений над случайной величиной с функцией распределения и над случайной величиной с функцией распределения . Эти функции распределения неизвестны; требуется оценить правдоподобность гипотезы о равенстве этих функций распределения.

Предположим, что с точностью до значений некоторых статистических параметров известен закон распределения случайной величины . Относительно статистических параметров выскажем предположение, что они равны некоторому определенному значению (простая гипотеза) или принадлежат некоторому множеству (сложная гипотеза). Эту гипотезу будем обозначать символом , и называть основной гипотезой.

Допустим так же, что при помощи некоторых статистик по реализации выборки получены реализации оценок этих параметров. Требуется принять решение, подтверждают или опровергают гипотезу результаты этого наблюдения над величиной .

Процесс проверки, приводящий к подтверждению или опровержению гипотезы , есть некоторое правило, согласно которому множество всех допустимых наблюдений (выборок) разбивается на две непересекающиеся части и . При этом принадлежность конкретной выборки первому множеству будем считать подтверждением проверяемой гипотезы , ее принадлежность ко второму множеству – отрицанием проверяемой гипотезы [1]. Множество называется критической областью в выборочном пространстве. Выбор того или иного правила проверки эквивалентен выбору критической области.

При подтверждении или отрицании гипотезы мы можем совершить ошибки двух видов. Ошибка первого рода совершается, когда гипотеза отвергается, в то время как на самом деле она верна (точка попадает в область , в то время как верна гипотеза ). Ошибка второго рода совершается, если принимается гипотеза , в то время как она не верна (точка попадает в область , в то время как неверна гипотеза ).

Вероятности этих ошибок обозначим соответственно символами (ошибка первого рода) и (ошибка второго рода). Понятно, что чем меньше для данной критической области числа и , тем удачнее выбрана критическая область.

Однако для произвольной выборки заданного объема невозможно ни при каком выборе критической области одновременно сделать сколь угодно малыми оба числа и . Необходимо сформулировать правило, позволяющее управлять этими ошибками. Такая интерпретация не слишком конструктивная. Поступают следующим образом: отображают множество выборок на множество значений некоторой статистики. Затем исследуют в какую часть этого множества попадает реализация, и делают соответствующий вывод.

Критерии значимости гипотезы, критическая область, ошибки

Пусть – исследуемая случайная величина, - ее функция распределения (или плотность распределения ), зависящая от одного или нескольких параметров. Сам параметр в обозначениях функций будем опускать.

Пусть о параметре распределения или о виде распределения выдвинута и подлежит проверке некоторая гипотеза (основная, проверяемая, нуль-гипотеза) и указана альтернативная к ней гипотеза . Альтернативных гипотез может быть и несколько. В качестве альтернативной гипотезы может быть выбрана произвольная, не совпадающая с основной .

Поставим задачу: на основе наблюдаемых или опытных данных, реализации выборки, либо отвергнуть гипотезу , если опытные данные и гипотеза противоречат друг другу, либо принять , то есть сделать вывод о том, что эта гипотеза согласуется (не противоречит) с опытными данными.

Определение Проверяемая гипотеза называется нулевой гипотезой или основной. Любая другая возможная гипотеза называется альтернативной гипотезой.

Решение об отклонении гипотезы или ее принятии будет строиться на основе выборки из распределения .

Определение Гипотеза называется простой, если она полностью определяет распределение случайной величины .

Определение Если же известен класс, которому принадлежит функция плотности, но неизвестно хотя одно точное значение ее параметра то гипотеза называется сложной.

Правило принятия решения, согласно которому принимается или отвергается гипотеза , называютстатистическим критерием.

Пусть – множество всех возможных значений случайной выборки и задана вероятность практически невозможного события при справедливости гипотезы (эту вероятность называют уровнем значимости). При этом множество разбивается на два подмножества критическая область и область принятия гипотезы следующим образом: – подмножество такое, что любое событие , вероятность которого – практически невозможное событие при справедливости гипотезы . Соответственно - вероятность практически достоверного события.

Если в наблюдается событие , то гипотезу отвергают; если же происходит событие , то принимают (точнее не отвергают). Построение таких областей достаточно трудоемко. Поэтому отображают множество всех выборок на числовую прямую с помощью некоторой функции.

Критерий (правило принятия решения об отклонении или принятии гипотезы ) строится на основе соответствующей случайной величины – статистики критерия . При этом предполагается, что условное распределение статистики критерия известно.

Статистика критерия отображает множество выборок на числовую прямую. По распределению статистики критерия и заданному уровню значимости находят так называемые критические числа, которые разбивают все множество значений статистики критерия на интервалы, соответствующие либо принятию гипотезы , либо ее отклонению. Понятно, что отклонение означает принятие альтернативной гипотезы при данном уровне значимости .