Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы на экзамен по курсу ТВиМСу.doc
Скачиваний:
45
Добавлен:
23.09.2019
Размер:
743.42 Кб
Скачать

3. Статистическая проверка гипотез

3.1

Любое предположение относительно исследуемой случайной величины, истинность которого требуется проверить на основе выборки этой случайной величины, называют статистической гипотезой. Гипотеза может касаться неизвестных параметров закона распределения вероятностей, самого закона распределения, смешанных статистических моментов, описывающих связь между величинами, и т.п. Существует большое разнообразие статистических гипотез и, соответственно, большое количество разнообразных методов проверки этих гипотез. Общая идея проверки статистических гипотез заключается в следующем. Пусть имеется выборка Xn = {x1, x2, …, xn} случайной величины X и выдвигается некоторая гипотеза относительно этой величины. Эту гипотезу называют нулевой гипотезой (H0), а противоположную ей – альтернативной гипотезой (H1). Предположим, что каким-то образом определена такая n-мерная область D, что при (x1, x2, …, xn)∉D нулевая гипотеза принимается, а при (x1, x2, …, xn)∈D эта гипотеза отвергается. Тогда область D называется критической областью. При принятии решения на основе конкретной выборки возможны следующие варианты: гипотеза H0 является верной, и она принимается в соответствии с критерием; H0 является ложной гипотезой и она отвергается в соответствии с критерием. Эти решения являются верными. Возможны варианты, когда принятое решение является ошибочным: H0 отвергается, являясь истинной гипотезой, или H0 принимается, хотя на самом деле она является ложной. В первом случае ошибку в решении называют ошибкой первого рода, во втором случае – ошибкой второго рода. Алгоритм построения критической области и правило принятия решения называют статистическим критерием данной гипотезы или просто критерием гипотезы. Наилучшим критерием для данной гипотезы является тот, который обеспечивает наименьшую величину вероятностей ошибок первого и второго рода. Обозначим вероятность ошибки первого рода через , а вероятность ошибки второго рода – через . Величину называют ещё уровнем значимости. Доказано, что одновременное уменьшение этих ошибок невозможно: уменьшение одной из них неизбежно влечёт увеличение другой (при постоянном объёме выборки n). Поэтому при построении критической области проводится минимизация по одной из вероятностей ошибок, в то время как другая вероятность фиксируется на определённом значении. С другой стороны, стоимость ошибок или потери от них, не всегда являются одинаковыми. В связи с этим выбор значений величин и определяется в зависимости от конкретного содержания решаемой задачи. Решение об истинности гипотезы H0 принимается на основе сравнения некоторой вычисленной величины R с одним или двумя критическими значениями, являющимися границей или границами критической области. Если для критической области используется неравенство R ≥Rв, то говорят о правосторонней критической области, если неравенство R ≤Rн, то говорят о левосторонней критической области. Если, наконец, применяются оба неравенства, то критическую область называют двухсторонней. Отметим ещё, что схема построения критической области прямым образом связана со схемой построения доверительного интервала.

3.2

Пусть из генеральной совокупности X, значения признака которой имеют нормальный закон распределения с параметрами N(,) при неизвестном математическом ожидании  и неизвестной дисперсии 2, взята случайная выборка объемом n и вычислена выборочная средняя арифметическая , а 0 и 1 - определенные значения параметра . Для проверки нулевой гипотезы H0:  = 0 при конкурирующей гипотезе H1:  = 1 используют статистику

, (3.6)

которая при выполнении нулевой гипотезы имеет нормированное нормальное распределение N(0;1).

Согласно требованию к критической области при 1 > 0 выбирают правостороннюю критическую область, при 1 < 0 - левостороннюю, а при 1  0 - двустороннюю критическую область.

Границы критической области tкр определяют по интегральной функции Лапласа Ф(t) из условий:

в случае правосторонней и левосторонней критической областей

Ф(tкр) = 1 - 2,

где Ф(tкр) = - интегральная функция Лапласа;

в случае двусторонней критической области

Ф(tкр) = 1 - . (3.8)

При проверке гипотезы о значении генеральной средней H0:  = 0 при неизвестной генеральной дисперсии 2 используют статистику

, (3.9)

которая при выполнении нулевой гипотезы H0 имеет распределение Стьюдента (t - распределение) с  = n-1 степенями свободы.Границы критической области tкр определяют по таблице t - распределения для заданного уровня значимости  (при двусторонней симметричной критической области) или 2 (при правосторонней и левосторонней критических областях) и числа степеней свободы  = n - 1.

Мощность критерия (1 - ) может быть вычислена только при проверке простых статистических гипотез: гипотезы о значении генеральной средней H0 :  = 0 и гипотезы о значении генеральной дисперсии и только при односторонней критической области.