Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции Математическая статистика и элементы тео...doc
Скачиваний:
4
Добавлен:
01.07.2025
Размер:
1.44 Mб
Скачать

Проверка статистических гипотез.

Статистической гипотезой H называется любое предположение относительно закона распределения исследуемой случайной величины. Гипотезы бывают простые и сложные , простая гипотеза полностью определяет закон распределения величины x в отличии от сложной . Гипотезы бывают параметрическими и непараметрическими. В параметрических гипотезах имеется предположение о параметрах распределения и известном законе, в непараметрических гипотезах о самом виде закона распределения .

Критерием проверки статистической гипотезы называются любые правила, позволяющие принять ее или отвергнуть. Параметрические гипотезы определяются с помощью критериев значимости, а не параметрические с помощью критериев согласия. Критерии строятся с помощью статистик, для которых известно их распределение.

Ошибкой 1-го рода называется отбрасывание верной гипотезы. Вероятность ошибки 1-го рода называется уровнем значимости критерия, по которому производится проверка.

Ошибкой 2-го рода называется принятие неверной гипотезы. Если за обозначим вероятность ошибки 2-го рода, то величина 1- -называется мощностью критерия. Зависимость между мощностью и уровнем значимости любого критерия, выглядит так:

Если уменьшить вероятность ошибки 1-го рода , то вероятность ошибки 2-го рода возрастет и наоборот. Чтобы вероятность ошибки 2-го рода не была значительной , нельзя брать близким к 0, на практике =0,05. Чем больше уровень значимости , при котором гипотеза может быть принята, тем лучше; при этом меньше вероятность ошибки 2-го рода, т.е. больше мощность критерия.

Построение критерия проверки статистической гипотезы.

Пусть выдвинута некоторая статистическая гипотеза H и задан уровень значимости , пусть также имеется некоторая подходящая статистика , для которой известен закон распределения , в случае справедливости выдвинутой гипотезы H .

=(x1,x2,…,xn)

Тогда по известному распределению статистики , можно найти область такую, что вероятность P(w)= - такая область называется критической. Если наблюдаемые значения статистики мы обозначим , если оно попадает в критическую область, то гипотеза отбрасывается, иначе она принимается. Такое принятие или отбрасывание гипотезы не дает логического доказательства ее или опровергается, всегда возможен любой из 4-х исходов.

  1. Гипотеза верна и принимается согласно критерия.

  2. Гипотеза не верна и отвергается согласно критерия.

  3. Гипотеза верна , но отвергается согласно критерия- ошибка 1-го рода.

  4. Гипотеза не верна, но принимается согласно критерия.

Таким образом, для проверки некоторой гипотезы необходимо указать подходящую статистику с известным гипотетическим законом распределения и построить критическую область для этой статистики по заданному уровню значимости . Затем посмотреть , попадает ли наблюдаемое значение статистики в критическую область.

Понятие о критериях согласия.

Проверяемую гипотезу обычно называют нулевой H0 , правило, по которому гипотеза принимается или отвергается называется статистическим критерием.. Статистические критерии , служащие для проверки гипотез о виде законов распределения называются критериями согласия. Т.е. критерии согласия устанавливают , когда полученные в действительности расхождения между предполагаемыми теоретическим и опытным распределением :несущественно - случайные и когда существенно - неслучайные.

Рассмотрим случайную величину, которая характеризует вид или функцию расхождения между предполагаемым теоретическим и опытным распределением признака, тогда по имеющемуся опытному распределению , можно определить значение , которое приняла случайная величина , если известен ее закон распределения, то не трудно найти вероятность того, что случайная величина примет значение не меньшее . Если величина получена как результат наблюдения случайной величины x, т.е. при распределении рассматриваемого признака, по предполагаемому теоретическому закону, то вероятность не должна быть малой. Если же вероятность оказалась малой, то это объясняется тем, что фактически полученному значение не случайной величины x, а какой-то другой с другим законом распределения, т.е. изучаемый признак распределен не по предполагаемому закону. Таким образом, в случае, когда не мала -расхождения между эмпирическими и теоретическими распределениями следует признать не существенным- случайным , а опытное и теоретическое распределение не противоречащими, т.е. согласующимися друг с другом.

Если вероятность мала, то расхождения между опытным и теоретическим распределениями существенны, объяснить их случайностью нельзя, а гипотезу о распределении признака по предполагаемому теоретическому закону следует считать не подтвердившейся , она не согласуется с опытными данными. Необходимо тщательно изучив опытные данные попытаться найти новый закон о качестве предполагаемого признака, который лучше, полнее бы отражал особенности опытного распределения , такие вероятности считаются малыми и их берут не превосходящими 0,1.

Критерии согласия Пирсона или критерии 2.

Пусть анализ опытных данных привел к выбору некоторого закона распределения , в качестве предполагаемого для рассматриваемого признака, а по опытным данным в результате n-наблюдений , найдены параметры (если они не были известны раннее). Обозначим через ni- эмпирические частоты случайной величины x.

nPi-теоретические частоты, представляющие произведение числа наблюдений n на вероятности Pi- рассчитанные по предполагаемому теоретическому распределению. Критерии согласия 2 за меру расхождения теоретического и эмпирического рядов частот принимают величину

;

2 -величина, которую называют 2 распределение или распределение Пирсона. Она равна 0 лишь при совпадении всех эмпирических и теоретических частот, в остальных случаях отлична от 0 и тем больше, чем больше расхождение между указанными частотами. Доказано, что выбранная характеристика 2 или статистика при n имеет распределение Пирсона со степенями свободы

k=m-s-1.

где m -число интервалов эмпирического распределения вариационного ряда или число групп.

s -число параметров теоретического распределения , определяемых по опытным данным, (например в случае нормального распределения число оцениваемых по выборке параметров равно 2).

Схема применения критерия сводится к следующему :

  1. По опытным данным выбирают в качестве предполагаемого закон распределения признака и находят его параметры.

  2. С помощью полученного распределения определяют теоретические частоты, соответствующие опытным частотам.

  3. Малочисленные опытные частоты, если они есть, объединяют с соседними, затем по формуле определяют величину 2 .

  4. Определяют число степеней свободы k .

  5. Из таблиц приложения для выбранного уровня значимости находят критическое значение при числе степеней свободы равным k .

  6. Формулируем вывод, руководствуясь общим принципом применения критериев согласия, а именно если вероятность >0,01, то имеющиеся расхождения между теоретическими и опытными частотами признаются не существенными.

Если фактически наблюдаемое значение больше критического , то H0 отвергается, если то гипотеза не противоречит опытным данным. Критерий 2 дает удовлетворительные результаты , если в каждом группировочном интервале достаточное число наблюдений ni .

Замечание: Если в каком-нибудь интервале число наблюдений <5, то имеет смысл объединить соседние интервалы с тем, чтобы в объединенных интервалах ni было не меньше 5. При этом при вычислении числа степеней свободы k в качестве m -берется соответственно уменьшенное число интервалов.

Пример

Получено следующее распределение 100 рабочих цеха по выработке в отчетном году

( в %-тах к предыдущему году).

Выработка в отчетном году(в %-тах к пред.)

94-104

104-114

114-124

124-134

134-144

Кол-во рабочих

6

20

45

24

5

100

Проверить гипотезу о нормальном распределении.

n=100

k=10

c=119

i

Интервал

[xi;xi+1]

Эмпирические частоты ni

Вероятности Pi

Теоретические частоты

npi

(ni-npi)2

1

2

3

4

5

94-104

104-114

114-124

124-134

134-144

6

20

45

24

5

0,049

0,239

0,404

0,248

0,053

4,9

23,9

40,4

24,8

5,3

1,21

15,21

21,16

0,64

0,09

0,247

0,636

0,524

0,026

0,017

100

0,993

99,3

1,45

m=5; k=5-2-1=2

-следовательно , гипотеза о нормальном распределении подтверждается