Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория к экзамену по Анализу данных.docx
Скачиваний:
29
Добавлен:
31.03.2020
Размер:
993.01 Кб
Скачать

11. Проверка гипотезы о соответствии наблюдаемых значений равномерному распределению.

Для того, чтобы при уровне значимости α, проверить гипотезу о равномерном распределении выборочной совокупности 2, надо [2]:

  1. Оценить параметры а и b – концов интервала, в котором наблюдались возможные значения случайной величины X, по формулам (28) и (29).

  2. Найти плотность вероятности предполагаемого равномерного распределения по формуле (9).

  3. Определить теоретические частоты по формулам:

 ;

(32)

  1. Найти наблюдаемое значение критерия Пирсона по формуле (30).

  2. Найти критическую точку (;r) по заданному уровню значимости а и числу степеней свободыr. Критическую точку(;r) находят по таблице критических точек распределения (приложение 4)

  3. Принять или не принять гипотезу о равномерном распределении выборочной совокупности 2.

12. Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам.

Для построения доверительных интервалов для параметров генеральных совокупностей могут быть реализованы два подхода, основанных на знании точного (при данном объеме выборки п) или асимптотического(при п -> оо) распределения выборочных характеристик (или некоторых функций от них). Первый подход реализован далее при построении интервальных оценок параметров для малых выборок. В данном параграфе рассматривается второй подход, применимый для больших выборок (порядка сотен наблюдений).

Теорема. Вероятность того, что отклонение выборочной средней (или доли) от генеральной средней (или доли) не превзойдет число  (по абсолютной величине), равна:

, где  (23)

, где  (24)

 - функция (интеграл вероятности) Лапласса

Выше (§ 9.4) показано, что выборочная средняя  и выборочная доля  повторной выборки представляют сумму n независимых случайных величин , где  имеет один и тот же закон распределения — соответственно (13) и (10) с конечными математическим ожиданием и дисперсией. Следовательно, на основании теоремы Ляпунова при  распределения  и  неограниченно приближаются к нормальным (практически при  распределения  и  можно считать приближенно нормальными).

Для бесповторной выборки  и  представляют сумму зависимых случайных величин. Однакоможно показать, что и в этом случае при  закон распределения  и  как угодно близко приближается к нормальному.

Формулы (23) и (24) следуют непосредственно из свойства 2 нормального закона формулы.

Формулы (23) и (24) получили название формул доверительной вероятности для средней и доли.

Определение. Среднее квадратическое отклонение выборочной средней и выборочной доли собственно-случайной выборки называется средней квадратической (стандартной) ошибкой выборки. (Для бесповторной выборки обозначаем соответствено  и ).

Из рассмотренной теоремы вытекают следующие следствия.

Следствие 1. При заданной доверительной вероятности  предельная ошибка выборки равна (-кратной величине средней квадра-тической ошибки, где, т.е.

13. Сравнение двух средних нормальных генеральных совокупностей с неизвестными дисперсиями (зависимые выборки).

десь рассматриваются выборки одинакового объема, варианты которых попарно зависимы. Например, если хi (i=1,2, ...,n)—результаты измерений деталей первым прибором, а y— результаты измерений этих же деталей, произведенные в том же порядке вторым прибором, то хi и yi попарно зависимы и в этом смысле сами выборки зависимые. Поскольку, как правило, хi ≠ уi, то возникает необходимость установить, значимо или незначимо различаются пары этих чисел. Аналогичная задача ставится при сравнении двух методов исследования, осуществленных одной лабораторией, или если исследование произведено одним и тем же методом двумя различными лабораториями.

Итак, пусть генеральные совокупности Х и Y распределены нормально, причем их дисперсии неизвестны. Требуется при уровне значимости α проверить нулевую гипотезу Н0:М () = М () о равенстве генеральных средних нормальных совокупностей с неизвестными дисперсиями при конкурирующей гипотезе Н1:М () ≠ М () по двум зависимым выборкам одинакового объема.

Сведем эту задачу сравнения двух средних к задаче сравнения одной выборочной средней с гипотетическим значением генеральной средней, решенной в § 13, п. Б. С этой целью введем в рассмотренные случайные величины—разности D= Хi—Yi и их среднюю

.

Если нулевая гипотеза справедлива, т.е. М () = М (),то М () - М () = 0 и, следовательно,

М () == М () = М () — М () = 0.

Таким образом, нулевую гипотезу Н0:М () = М () можно записать так:

H0:М() = 0.

Тогда конкурирующая гипотеза примет вид Н1:М() ≠ 0.

Замечание 1. Далее наблюдаемые неслучайные разности xi—yi будем обозначать через di в отличие от случайных разностей D= Хi—Yi. Аналогично выборочную среднюю этих разностей обозначим черезв отличие от случайной величины.

Итак, задача сравнения двух средних  и сведена к задаче сравнения одной выборочной среднейс гипотетическим значением генеральной среднейМ() = а= 0. Эта задача решена ранее в§ 13, п. Б, поэтому приведем лишь правило проверки нулевой гипотезы и иллюстрирующий пример.

Замечание 2. Как следует из изложенного выше, в формуле (см. § 13. п. Б)

надо положить

.

Тогда .

Правило. Для того чтобы при заданном уровне значимости α проверить нулевую гипотезу Н0() = M() о равенстве двух средних нормальных совокупностей с неизвестными дисперсиями (в случае зависимых выборок одинакового объема) при конкурирующей гипотезе М() ≠ M()надо вычислить наблюдаемое значение критерия:

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α, помещенному в верхней строке таблицы, и по числу степеней свободы k = п - 1 найти критическую точку tдвууст.кр (α; k).

Если |Tиабл|< tдвууст.кр — нет оснований отвергнуть нулевую гипотезу.

Если |Tиабл|> tдвууст.кр — нулевую гипотезу отвергают.

Соседние файлы в предмете Анализ данных