Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Binder1

.pdf
Скачиваний:
30
Добавлен:
30.03.2015
Размер:
2.59 Mб
Скачать

множества 0={ 0} и 1={ 1} являются одноточечными (случай двух простых гипотез), то

KR1 наиболее мощный критерий.

Далее рассматривается задача построения наиболее мощного критерия (НМК) для решения задачи проверки двух простых гипотез:

H0 : 0

(23)

H1 : 1

Статистика отношения правдоподобия (СОП) l X , X X1, , Xn играет ключевую роль в построении наиболее мощного критерия. Она определяется выражением

 

 

 

 

 

L( ,X)

 

 

 

 

 

 

 

 

 

l(X)

 

1

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L( 0, X)

 

 

 

 

 

Лемма. Пусть

X

– независимая повторная

выборка из

ГС

X , имеющей

 

плотность

распределения,

c P l X c .Тогда при любом 0 1

уравнение c имеет

решение c c . Это решение единственно, если функция c

строго монотонна в точке c .

Доказательство. Очевидно,

что

функция

c

не возрастающая, причем

 

0 1.

Справедливы неравенства

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1 P1 l(X) c

 

L( 1,x)dx c

 

L( 0,x)dx

c (c) (c)

.

 

 

 

l

 

 

 

 

 

 

 

c

 

 

(x) c

 

l(x) c

 

 

 

 

 

Отсюда немедленно следует, что

lim (c) 0.

В таком случае существует промежуток, на

 

 

 

 

c

 

 

 

 

 

 

 

 

границах которого

функция

c имеет

разные

знаки, откуда следует справедливость

утверждения теоремы.

Теорема Неймана-Пирсона (о структуре наиболее мощного критерия). Пусть X

независимая повторная выборка из ГС X , имеющей плотность распределения. Тогда для решения задачи проверки двух простых гипотез (23) существует наиболее мощные критерий KR1 . Статистикой этого критерия является статистика отношения правдоподобия с

критической областью XKR1 x:l x c .

Доказательство. Пусть KR2 – другой критерий, уровень значимости которого не превосходит

. Через XKR2 обозначим критическую область этого критерия.

Рассмотрим

 

функции мощности

 

критериев

 

KR2

и KR1 : WKR2

P X XKR2 и

WKR1 P X XKR1 P l X c .

При 0

они обладают свойствами:

 

 

WKR

0 , WKR

0 ,

WKR

0

WKR 0 0.

 

 

 

1

 

 

2

 

 

1

 

2

 

 

При произвольном справедливо представление

 

 

 

 

 

 

WKR1 WKR2

L( ,x)dx L( ,x)dx

 

 

 

 

 

XKR

 

 

XKR

 

 

 

 

 

 

 

 

 

1

 

 

2

 

 

 

 

 

 

 

 

L( ,x)dx

 

 

L( ,x)dx

 

 

 

L( ,x)dx

 

L( ,x)dx

 

XKR1 XKR2

L( ,x)dx

XKR1

X

KR2

L( ,x)dx.

 

 

 

XKR2 XKR1

XKR2

X

KR1

 

 

 

 

 

 

XKR1 XKR2

XKR2 XKR1

С учетом полученных неравенств оценим разность функций мощности при 1 :

WKR1 1 WKR2 1

 

 

 

L( 1,x)dx

 

 

 

 

 

 

L( 1,x)dx

 

 

 

 

 

 

 

 

 

 

 

 

L( ,x) c

XKR1

X

KR2

 

 

 

 

 

 

 

 

 

XKR2

X

KR1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

при

x X

KR1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c L(

0

,x)dx

 

 

 

 

c L(

0

,x)dx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L( ,x) c

при

x XKR1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

XKR1 XKR2

 

 

 

 

 

 

 

 

XKR2 XKR1

 

 

 

 

 

c L( 0,x)dx

c L( 0,x)dx WKR1 0 WKR2 0 0.

 

 

 

 

 

 

 

 

XKR1

 

 

 

XKR2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теорема доказана.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Замечание 1. Если наблюдаемая случайная величина

 

X имеет дискретное распределение, то

решающая функция наиболее мощного критерия имеет вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,

 

когда

 

L 1,x

cL 0

,x

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

когда

 

L

 

 

 

,x

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

,x

 

cL

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.

 

когда

 

 

 

 

 

 

cL 0

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L 1,x

,x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где c, выбираются из условия M

 

 

 

X

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Замечание 2. Пусть наблюдаемая случайная величина

X

имеет функцию правдоподобия

L ,x , R.Если

статистика

 

 

отношения

правдоподобия

 

 

 

 

 

l(x) l0

T(x)

монотонна

относительно

некоторой достаточной статистики T x ,

распределения

L 0,x

и L 1,x

различны для любых 0 и 1, тогда для задачи

H0 : 0,

H1 : 0

существует равномерно наиболее мощный критерий с решающей функцией

 

 

 

1,

 

когда

T x

c,

 

 

 

 

 

когда

 

c,

x

,

 

T x

 

 

 

 

 

 

когда

 

c,

0

 

 

0.

 

T x

 

 

 

 

 

где c, выбираются из условия M

 

 

X

 

 

.

 

 

 

 

 

 

 

 

Пример построения наиболее мощного критерия. Имеется X X1, ,Xn - независимая повторная выборка из ГС X N a;1 . Построить при a1 a0 с уровнем значимости наиболее мощный критерий для проверки двух простых гипотез

H0 : a a0

H1 : a a1.

Решение. Последовательно выпишем функцию правдоподобия и статистику отношения правдоподобия:

 

 

 

 

 

n

1

 

 

(Xi a)2

 

1

 

 

 

1

n

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L(a,X)

 

 

 

 

e 2

 

 

exp

 

(Xi a)

 

 

 

,

 

 

 

 

 

(2 )

n/2

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

2

i 1

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l(X) exp

 

 

 

(Xi a1 Xi a0) (Xi a1 Xi

a0)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a2

a2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

exp

 

 

 

(2Xi

a1

a0) ( a1

a0)

exp n(a1 a0)X

 

 

0

1

.

 

 

 

 

 

 

2

 

 

2 i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найдем константу c :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

P l(X) c P lnl(X) lnc P n(a1 a0)

 

 

a0

a1

lnc

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

lnc

 

a1

a0

 

 

 

 

1

 

 

 

 

 

 

 

 

lnc

 

 

(a1 a0)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P X

 

 

 

 

 

 

X

N a0,

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

a0

 

n

 

 

n(a a )

 

2n

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n(a a )

2 n

 

 

 

 

1 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

N

 

 

 

 

 

 

 

 

 

 

 

 

 

lnc

 

 

 

(a1

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0)

x1 N0 a0

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n(a1 a0)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, критическая область наиболее мощного критерия определяется неравенством:

X a x1 N0 .

0

n

 

5.Проверка гипотез о вероятностях

5.1.Проверка гипотезы о значении вероятности

(о доле генеральной совокупности по выборке с возвращением)

Постановка задачи.

Имеется совокупность, каждый элемент которой либо обладает свойством А, либо не обладает этим свойством. Доля элементов, обладающих свойством А, равна неизвестной величине p. Эту долю можно также трактовать как вероятность извлечения элементов типа А из исходной совокупности с возвращением. Число элементов, обладающих свойством А, в выборке оказалось равным m. Объем выборки n достаточно большой.

Необходимо построить критерий с уровнем значимости для проверки гипотезы о том, что доля p равна заданному значению p0 . Найти также основные характеристики построенного критерия.

Решение. Формальное описание поставленной задачи: H0 : p p0

H1 : p p0

Элементами выборки X в данном случае являются индикаторные случайные величины, принимающие значения 0 или 1, в зависимости от того обладает или нет свойством А элемент попавший в выборку.

В качестве статистики критерия выберем случайную величину

 

 

 

 

K K X

m

npo

 

,

qo 1 po ,

(3)

 

 

 

 

 

 

 

 

 

np q

 

 

 

 

 

o o

 

 

 

которая в условиях справедливости H0 асимптотически нормальна 0;1 .

При любом p : X B n; p , M m np.

Поэтому, если

p p0 ,

то от статистики K

следует ожидать при n больших положительных значений, а

при p p0 больших

отрицательных значений.

 

 

 

Таким образом, нулевую гипотезу целесообразно принимать, если статистика критерия принимает "не слишком большие" по абсолютной величине значения. Границу таких значений (самое "большое" такое значение) обозначим Kкрит . Его величину найдем, используя

асимптотическое распределение статистики критерия из условия:

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

2

 

 

P

 

K

 

Kкрит 1 P

 

K

 

Kкрит

2 Kкрит

1

1

Kкрит .

 

 

 

 

 

 

Отсюда последовательно найдем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Kкрит 1

,

Kкрит

x

N0 .

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

Таким образом, критерий для проверки нулевой гипотезы приобретает следующие

очертания: H0 принимается, если

 

 

K

 

x

N0 , отклоняется – если выполнено

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

N0 .

 

противоположное неравенство

 

K

 

x

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В данном примере область принятия нулевой гипотезы и критическая область определяются

соответственно неравенствами

 

K

 

x

N0 и

 

K

 

x

N0 .

 

 

 

 

 

 

 

 

1

 

 

 

 

 

1

 

 

 

 

 

 

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

Функция мощности и состоятельность критерия. Сначала запишем функцию мощности:

 

K

 

x

 

N0

 

1

 

K

 

x

 

N0

 

 

Wn ( p) P

 

 

р

P

 

 

р

 

 

 

 

1

 

 

 

 

 

 

 

1

 

 

 

 

 

 

2

 

2

 

 

 

 

 

 

 

 

 

N0

 

 

 

 

 

 

 

 

 

 

 

 

m npo

 

x

 

npoqo

 

 

 

 

 

 

1 P

 

 

р

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

np k

 

 

np

np k

 

 

np

 

np q

np q

1

o

 

 

 

o o

 

 

 

o

 

o o

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

npq

 

 

npq

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Проверяем состоятельность критерия:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1)

если

p p0 , то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

np k np q

 

np

np

k np q

 

 

 

 

 

 

 

 

o

o

np

 

 

lim Wn

( p) lim

1

 

o

 

 

 

 

 

o

 

 

 

 

 

o

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

npq

 

 

 

 

 

npq

 

 

 

n

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2)

если

 

( p) 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p p

, то lim W

 

 

 

 

 

1.

 

 

 

 

 

 

 

 

 

n

5.2. Проверка гипотезы о равенстве вероятностей (долей) (гипотеза однородности двух биномиальных совокупностей)

Постановка задачи. Имеются две совокупности, каждый элемент которых либо обладает свойством А, либо не обладает этим свойством. Доли элементов, обладающих свойством А, соответственно p1 - для первой совокупности, p2 - для второй совокупности, они неизвестны. Эти доли также можно трактовать как вероятности извлечения с возвращением элементов типа А из этих совокупностей. Имеются сведения о результатах проверки выборок, извлеченных из 1-й и 2-й совокупностей. Объемы выборок соответственно равны n1 и n2 , и достаточно

велики. Число элементов, обладающих свойством А, в 1-й выборке оказалось равным m1, а во

2-й - m2 .

 

 

 

 

 

 

 

 

Необходимо с

уровнем

значимости

проверить

гипотезу о равенстве долей в одной

следующих постановок:

 

 

 

 

 

 

 

H0 : p1 p2

(4)

H0 : p1 p2

(5)

H0

: p1 p2

(6)

 

 

 

 

 

: p1 p2

H1 : p1 p2

 

H1 : p1 p2

 

H1

 

Другими словами, решается вопрос о том, существенно или нет отличаются оценки долей

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

?

m2

 

(относительные частоты события А), полученные по 1-ой и 2-ой выборке

 

m1

 

.

 

n2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1

 

 

Решение. Решение принимается с использованием статистики следующего вида

 

 

 

 

 

 

 

 

 

m1

 

m2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

U

 

 

 

 

 

 

 

 

n

 

 

 

 

.

(7)

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

 

m1 m2

1

m1 m2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

n

n n

n n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

1

2

 

1 2

 

 

 

 

 

 

 

При n1, n2 по интегральной теореме Муавра-Лапласа

m1

n1

 

 

 

p1 (1 p1 )

 

 

а.н.

 

;

 

;

 

p1

n1

 

 

 

 

 

 

m2

n2

 

 

 

p2 (1 p2 )

 

а.н.

 

;

 

 

p2

n2

.

 

 

 

 

Поэтому, если верна H

 

 

m

 

m

2

 

 

 

 

1

 

1

 

 

 

, то

1

 

 

 

а.н.

0; p

(1 p )

 

 

 

 

 

 

. Состоятельной оценкой

 

n

n

 

 

n

n

 

 

0

 

 

2

 

1

1

 

2

 

 

 

 

 

1

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m1

m2

 

p1 p2 по объединенной выборке является статистика p1

 

 

 

. Отсюда

n1

n2

 

 

 

 

 

m1

 

 

 

m2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

если верна H0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1

 

n2

 

 

 

 

 

 

U

 

 

 

 

 

 

 

 

 

 

 

a.H . 0;1 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p1

(1

p1 )

 

 

 

 

n

n

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

Выбор критической области основывается на следующих соображениях: при

p1 p2 следует

ожидать больших отрицательных значений U , при p1 p2 - больших

положительных

значений U .

 

При решении задачи (4) нулевая гипотеза принимается (доли генеральных совокупностей совпадают), если выполняется неравенство:

 

Uвыч

 

x

N0 .

(8)

 

 

 

 

 

1

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

В случае решения задачи (5) нулевая гипотеза принимается (доли генеральных

совокупностей совпадают), если выполняется неравенство:

 

Uвыч x1 N0 .

(9)

При решении задачи (6) нулевая гипотеза принимается (доли генеральных совокупностей

совпадают) , если выполняется неравенство:

 

Uвыч x1 N0 .

(9)

Замечание. Проверку гипотез можно осуществлять с помощью доверительных интервалов, соответствующих решаемой задаче проверки гипотез, с учетом следующих обстоятельств:

если альтернатива двусторонняя – применяется двусторонний доверительный интервал;

если альтернатива односторонняя – применяется односторонний доверительный интервал. Собственно применение доверительных интервалов осуществляется следующим образом.

1.Выписывается доверительный интервал для параметра (разности параметров, числовой характеристики, разности числовых характеристик). При этом полагается 1 .

2.Если значение параметра (или чего-то другого), соответствующее нулевой гипотезе, попадает в доверительный интервал, то H0 , в противном случае – отклоняется.

Пример 1. Два завода изготавливают однотипные изделия. Для оценки их качества сделаны выборки из продукции этих заводов и получены следующие результаты. Из 200 деталей 1-го завода 20 оказались бракованными, из 300 деталей 2-го завода 15 оказались бракованными.

1)При уровне значимости 0,1 определить имеется ли существенное различие в качестве изготавливаемых этими заводами изделий?

2)Можно ли при уровне значимости 0,1 утверждать, что доля бракованных изделий на втором заводе меньше?

Решение. Пусть p1 - доля брака на первом заводе,

p2 - доля брака на втором заводе. При этом

n1 200, m1 20, n2

300, m2

15 . Вычислим статистику критерия по формуле (4):

 

 

 

 

 

 

 

 

20

 

15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

200

 

 

 

 

 

 

 

 

 

 

Uвыч

 

 

 

 

300

 

 

 

 

 

 

 

2,15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20 15

 

 

 

 

20 15

 

 

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

200 300

 

 

 

 

 

200

300

 

 

 

 

 

 

 

 

200 300

 

 

Ответ на первый вопрос получим, используя неравенство (8). При 0,1:

x

N0 1, 645 .

 

1

 

 

 

2

 

 

 

 

Поскольку 2,15 > 1,645, то можно говорить о существенном различии в качестве изготавливаемых этими заводами изделий.

Ответ на второй вопрос получим, используя неравенство (9). При 0,1 x1 N0 1, 28 .

Поскольку 2,15 > 1,28, то можно утверждать, что доля бракованных изделий на втором заводе меньше.

6. Проверка параметрических гипотез в случае нормального распределения

6.1. Проверка гипотез о параметрах нормального распределения

Предположения. Пусть X1, , X n

независимая повторная выборка из ГС

X N a; 2 ,

, неизвестны; известны

 

, sX2

SX2 .

 

X

 

Задача 1 (проверка гипотезы о значении математического ожидания a ).

H0 : a a0 H1 : a a0

Задачу можно решить с помощью двустороннего доверительного интервала

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s2

 

 

 

 

s2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X x

[T

]

 

X

a X

x

[T

]

X

,

(10)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 2

 

n 1

 

 

 

 

 

n

1

n 1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

в который вместо

a

следует подставить

a0. Если неравенство верно,

то нулевая гипотеза

принимается.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Примечание. Нулевая гипотеза принимается, если выполняется неравенство

 

 

n

 

 

a0

 

 

 

n 1

 

 

 

a0

 

x1 / 2 Tn 1 .

 

 

 

 

 

 

X

 

 

X

 

 

 

(10*)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

sX

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

SX

 

 

 

 

 

 

 

 

 

 

 

 

Задача 2 (проверка гипотезы о значении среднеквадратичного отклонения ).

H0 : 0

H1 : 0

Задачу можно решить с помощью двустороннего доверительного интервала

 

 

nSX2

 

 

 

 

nSX2

 

,

 

 

(11)

 

x

[

2

 

 

x

[ 2

 

 

 

 

]

 

 

]

 

 

 

 

 

 

1

2

n 1

 

 

 

 

2

n 1

 

 

 

 

 

 

 

в который вместо

следует подставить

 

0.

Если неравенство верно, то нулевая гипотеза

принимается.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Примечание. Нулевая гипотеза принимается, если выполняется неравенство

 

 

 

 

 

x

[ n2 1 ]

nSX2

 

x

[ n2 1 ].

 

 

 

 

 

02

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

2

 

 

 

2

 

Числовой пример 1. По данным 12 рейсов установлено, что рейсовый автобус проходит свой маршрут в среднем за 43 мин. При среднеквадратичном отклонении 4 мин. Предполагается, что время поездки есть случайная величина, имеющая нормальное распределение. Проверьте, не устарел ли норматив, который равен 45 мин., с помощью подходящего статистического критерия при уровне значимости 0,05.

Решение. В данном случае речь идет о решении следующей задачи

H0 :

a 45,

 

 

 

 

 

 

 

 

H1 :

a 45.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a0

 

 

 

 

 

 

 

 

Вычислим

 

n 1

 

X

 

 

 

12 1

 

43 45

1, 653,

x1 / 2 Tn 1 x0,975 T11 2, 201.

 

 

 

 

4

 

 

 

SX

 

 

 

 

Поскольку 1,653<2,201, то оснований для пересмотра норматива нет.

Числовой пример 2. Фасовочный автомат для мелкооптовой торговли должен обеспечить точность, которая характеризуется среднеквадратичным отклонением, не превосходящим 2 грамма. С целью оценки точности фасовки на контрольных весах было взвешено 15 пакетов муки и найдено, что среднеквадратичное отклонение 2,3 г. Предполагается, что ошибка измерения есть случайная величина, имеющая нормальное распределение. При уровне значимости 0,05 проверьте, отвечает ли фасовочный автомат требуемой точности.

Решение. В данном случае речь идет о решении следующей задачи

H0 : 2 4,

H1 : 2 4.

Вычислим

nSX2

 

15 2,32

19,84 ,

x

[ 2

] x

 

2

 

23,68.

2

 

4

 

1

n 1

 

0,95

14

 

 

0

 

 

 

 

 

 

 

 

Поскольку 19,84<23,68, то фасовочный агрегат отвечает требуемой точности.

6.2. Проверка гипотез о двух нормальных совокупностях

Предположения.

Имеются две независимых

повторных выборки:

X1, , X n из

ГС

X N aX ; X2 ,

Y1, ,Yn из ГС Y N aY ; Y2 ,

известны

 

, sX2

SX2 ,

 

, sY2 SY2 .

 

X

Y

 

Задача 1 (проверка гипотезы о равенстве дисперсий: X2

Y2 ).

 

 

 

 

 

H0 :

X2

Y2

 

 

 

 

 

 

 

 

 

 

 

H1 :

X2

Y2

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для

проверки гипотезы используется F статистика:

F

sБ

,

где

sБ2 max s2X , sY2

,

2

sМ2 max s2X , sY2

; nБ , nM соответственно объемы

 

 

 

sM

 

 

 

 

 

выборок,

по которым вычислялись

sБ2 , sM2 .

Нулевая гипотеза принимается, если выполняется неравенство

 

 

F x

 

 

 

 

F n

Б

1,n

M

 

1 .

 

 

 

(12)

 

 

 

 

 

 

1 / 2

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 2 (проверка гипотезы о равенстве средних a

X

a ). Предполагается,

что 2

2 .

H0 :

aX

aY

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

 

X

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H1 :

aX

aY

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для проверки гипотезы используется T статистика:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(n 1)s2

 

(m 1)s2

 

 

 

 

 

 

 

 

 

X

Y

 

 

 

 

 

 

2

 

 

 

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

, где

s

 

 

X

Y

.

(13)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

1

 

 

2

 

 

 

 

 

 

n m 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пояснение. Выбор статистики объясняется следующими соображениями. При сделанных предположениях

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

a

 

a ,

X2

 

 

Y2

 

,

(n m 2)s2

 

(n 1)sX2

 

(m 1)sY2

2 n m 2 ,

X

Y

X

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

n

 

 

 

 

m

 

 

2

 

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

X

 

X

 

X

 

 

 

 

 

 

 

 

 

 

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

m

 

 

 

 

 

 

 

 

T

 

 

 

X

 

Y

 

 

 

 

 

 

 

X

 

Y

 

 

 

:

1

 

(n m 2)s2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(n m 2)

X2

 

1

 

 

1

 

 

2

 

 

1

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n m

 

 

 

 

 

n

 

 

m

 

 

 

 

 

2 n m 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N 0,1

 

 

 

 

 

 

Нулевая гипотеза принимается, если выполняется неравенство

T x

 

T n m 2

.

1

 

 

 

2

 

 

 

T n m 2 .

(14)

7. Другие критерии однородности

Постановка

задачи.

Имеются

две независимых повторных выборки: X1, , X n из ГС

X F x ,

Y1, ,Yn

из ГС Y G y , обе функции F x и G y непрерывны. Необходимо

проверить гипотезу

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H0 : F x G y .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7.1. Проверка гипотезы однородности двух выборок

 

 

 

с помощью критерия Манна-Уитни

В качестве статистики критерия Манна-Уитни используется

 

случайная величина U , равная

числу "успехов" в парных

сравнениях выборок X и Y . Под "успехом" в сравнении

 

X i и Yj из выборок

X и

Y

 

 

 

 

 

 

 

элементов

соответственно понимается выполнение неравенства

 

 

X i Yj .

Совпадение элементов признается

за

 

половину

 

"успеха". Всего необходимо

осуществить mn парных сравнений:

 

 

 

 

 

 

 

 

 

 

 

 

 

n

m

 

 

1

 

 

n m

 

 

 

 

 

 

U I Xi

Yj

 

 

I X i

Yj .

 

 

 

 

 

 

 

i 1 j 1

 

 

2 i 1 j 1

 

 

 

Числовые характеристики статистики критерия U :

 

mn m n 1

 

 

 

 

M U

mn

,

D U

.

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

12

 

 

 

 

При объемах выборки n, m таких, что n m 20 можно пользоваться следующим правилом. Нулевая гипотеза принимается, если

U mn / 2

nm(m n 1)12 x1 2 [N (0,1)].

Применение точного критерия Манна-Уитни возможно лишь при наличии таблицы распределения его статистики. Эти таблицы и описание их применения можно найти, например, в следующей книге. Холлендер М.,Вулф Д. Непараметрические методы статистики. - М.: Финансы и статистики, 1983. 518 с.

Пример (вычисление статистики критерия Манна-Уитни Uвыч. ). Имеются результаты двух серий наблюдений. Первая серия: 1, 3. Вторая серия: 2, 1, 2, 5. Вычислить Uвыч..

Решение. Первую серию трактуем как выборку X , а вторую серию как выборку Y . Поэтому

m 2, n 4 и требуемое число сравнений равно

2 4 8. Выбираем из первой выборки

первый элемент: 1. Сравниваем его последовательно с каждым из элементов второй выборки. Вычисляем число "успехов" для первого элемента "1":

1 0,5 1 1 3,5.

Для второго элемента первой выборки "3" число "успехов" равно

0 0 0 1 1.

Окончательно Uвыч. 3,5 1 4,5. При этом

 

 

U mn / 2

 

 

 

 

 

4,

5

 

2 4

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

0, 23.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nm(m n 1) 12

2 4

2 4 1

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

Вычисления могут упроститься, если предварительно каждую из серий записать в порядке возрастания.

7.2. Проверка гипотезы однородности двух выборок с помощью критерия хи-квадрат

Случай двух выборок. Имеются две выборки:

X1 , , X n

и Y1 , ,Ym . Распределим их по k

непересекающимся областям: 1 , , k . Пусть

 

i

и i - соответственно число элементов

первой и второй выборок, принадлежащих области i , i

 

.

 

 

 

 

 

1, k

 

 

 

 

 

Статистикой критерия является

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 mn

 

 

 

i

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

i i m

 

 

 

 

 

 

 

 

 

Гипотеза однородности выборок принимается, если выполняется неравенство

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

2

k 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1

 

.

 

 

 

 

 

 

 

 

 

Случай нескольких выборок. Имеются r

выборок: X i,1, , X i,n

, i

 

.

Распределим их по

1, r

k непересекающимся

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i, j

 

 

 

 

 

i

 

 

 

 

j -ой выборки,

областям:

1, , k

. Пусть

 

 

-

число

элементов

принадлежащих области j ,

j

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1, k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Статистикой критерия является

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

r

 

 

 

 

 

 

r

 

k

k r i, j

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 N

 

 

 

 

 

 

 

 

, где

 

N i, j ,

 

i i, j ,

j

i, j .

 

i

j

 

 

 

 

 

i 1 j 1

 

 

 

 

 

 

 

 

 

 

 

i 1 j 1

 

 

 

 

 

 

j 1

 

i 1

Гипотеза однородности выборок принимается, если выполняется неравенство

 

 

 

 

 

 

 

 

2

 

 

 

 

 

2

k 1 r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1

 

1 .

 

 

 

 

 

7.3. Проверка однородности парных наблюдений с помощью критерия знаков

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]