Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

3377

.pdf
Скачиваний:
8
Добавлен:
15.11.2022
Размер:
4.6 Mб
Скачать

Это правило называется статистическим критерием или просто критерием К проверки гипотезы.

Для решения этой задачи выбирают критерий проверки К, т.е. некоторую функцию (статистику) от выборки

z z(x1 , xn )

(17.1),

которая является случайной величиной, так как все

xi есть

случайные величины. Предполагается, что для этой функции известны плотности распределения вероятностей f1 (z H0 ) и

f2 (z Ha ) , где Ha – альтернативная гипотеза. Зададим уровень значимости (0,1; 0,05; 0,01) . Эта вероятность такова, что событиями, происходящими с такой вероятностью в данной ситуации можно пренебречь.

Критической областью G называют совокупность значе-

ний критерия z , при которой гипотезу H0

отвергают.

Область G находят из условия

 

P z G H0

f1 z H0 dz

(17.2)

 

G

 

Отметим, что условием (17.2) область G определяется неоднозначно.

Основной принцип проверки статистической гипотезы состоит в следующем: по выборке и формуле (17.1) считают величину z zнабл.

Если zнабл. G , то H0 отвергают в пользу альтернативной ги-

потезы Ha . Если же zнабл. G , то оснований отвергнуть H0 нет, так как выборочные данные не противоречат гипотезе H0 .

141

Число r P z

G Ha

f2 z Ha

dz называют мощностью

 

 

G

 

критерия.

 

 

 

1

r P z

G Ha

(17.3)

При принятии или отклонении гипотезы H0 возможны ошибки двоякого рода: 1) ошибка первого рода – H0 отвергают, а она верна.

Вероятность ошибки 1 рода P z G H0

;

2) ошибка второго рода – H0 принимают, а она не верна.

Вероятность ошибки второго рода P z G Ha

.

Из формулы (17.3) видно, что чем больше мощность r , тем меньше ошибка 2 рода. Обычно поступают следующим образом: фиксируют уровень значимости , т.е. фиксируют приемлемую вероятность ошибки 1 рода, а затем ищут критерий z с наибольшей мощностью, то есть с наименьшей ошибкой

2 рода.

Таким образом, проверка параметрической статистической гипотезы может быть разбита на следующие этапы:

1)

формулируем гипотезы H0 и Ha ;

 

 

2)

назначаем уровень значимости

;

 

3)

выбираем статистику z (17.1) для проверки гипотезы H0 ;

4)

находим плотности распределения f1

z H0 и f2 z Ha ;

5)

в зависимости от гипотезы

Ha

находим критическую об-

ласть G ;

 

 

 

6)

по выборке вычисляем zнабл.

z(x1 , x2 ,

, xn ) ;

 

 

142

 

 

7) принимаем решение: если

zнабл.

G , гипотезу H0 оставля-

ем. Если zнабл.

 

G , гипотезу H0

отклоняем в пользу альтерна-

тивной Ha .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Модель 1. Пусть известно, что генеральная совокупность

 

N (m,

2 ) ,

 

– известно. Требуется по выборке

и уровню

значимости

проверить нулевую гипотезу H0 : m

m0 .

 

 

 

Решение.

Для

этой

модели

 

статистика z

 

x

 

m0

 

, где

 

 

 

 

 

 

 

 

x

1

xi .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда для альтернативной гипотезы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ha :

m

m0 критическая область G

 

z u1

,

 

 

 

 

 

 

 

Ha : m m0

G

z

 

u

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ha : m m0 G

 

z

 

u 2

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для простой альтернативной гипотезы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m0

m1

 

 

 

 

 

Ha : m m1 ,

m1

m0

мощность r

F u

 

 

 

n

;

 

 

 

 

 

 

 

Для гипотезы Ha :

 

m

 

m1

m1

 

m0 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a1

a0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

1

F

u1

 

 

 

 

n .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь

F (x)

 

et

2

2 dt ,

 

– квантиль уровня

 

 

случай-

 

 

 

 

u

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ной величины

 

 

N(0,1) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

143

Модель 2. Пусть генеральная совокупность

N (m, 2 ) ,

но оба параметра неизвестны. По выборке найдем точечные оценки

x

1

x

и

s2

1

 

 

 

 

n

i

0

(n 1)

 

 

 

 

n

xi x 2

i 1

неизвестных параметров.

 

 

 

 

 

 

 

 

 

 

 

 

 

По уровню значимости

 

 

проверить нулевую гипотезу

H0 :

m m0 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение.

Для альтернативных гипотез Ha :

m

m0

кри-

тическая область G

 

z

 

t1

(n

1) .

 

 

 

 

 

 

 

 

Ha : m m0 G

 

z t (n 1) .

 

 

 

 

 

 

 

 

 

 

 

Ha : m m0 G

 

 

z

 

 

t 2 (n 1)

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

m0

 

 

 

 

 

 

 

 

 

 

 

 

где z

n

 

,

 

t

(n

1)

– квантиль уровня

 

распреде-

 

 

s0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ления Стьюдента с (n 1) степенью свободы.

 

 

 

 

Для Ha :

 

m

m1 ,

m1

 

m0

мощность

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m0

 

m1

 

 

 

 

 

 

 

 

 

 

 

 

 

r

Tn 1 t

 

 

 

n ,

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где Tn 1 (t) – функция распределения Стьюдента с

(n 1)

сте-

пенью свободы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Модель

3.

Пусть

 

имеем

две

 

 

независимые

выборки

x1, x2 ,...xn и

y1

 

ym

объемом n и m из нормальных генераль-

ных совокупностей

 

 

N (m ,

2 ) и

 

 

 

 

N (m ,

2 ) . Предполо-

 

 

 

 

 

 

 

 

 

 

 

1

1

 

 

 

 

2

2

 

 

 

жим, что

1

и

2 известны. Требуется на уровне значимости

проверить гипотезу H0 : mx

my :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

144

 

 

 

 

 

 

 

 

 

 

Решение. Для этой модели статистика z

 

 

x

y

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

m

где x

1

 

xi

, y

1

 

yi .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для

альтернативных

 

гипотез

Ha :

m 1 m2

 

 

область

G

z

u1

 

 

 

 

 

 

 

 

 

 

 

 

 

,

Ha : m1

m2

область

 

G

z

 

 

u 2

,

Ha :

m1

 

 

m2

G

z u

 

, где u

квантиль уровня

 

 

случай-

ной величины

N(0,1) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 17.2. По паспортным данным автомобильного двигателя расход топлива на 100 км пробега составляет 10 л. Ожидается, что после модернизации двигателя расход топлива уменьшится. Для проверки производятся испытания 25 случайно отобранных автомобилей с модернизированным двигателем. По результатам испытаний выборочная средняя расходов топлива на 100 км пробега составила x 9, 3 л. Предполагая, что расход топлива есть нормальная случайная величина с

2, проверить гипотезу H0 утверждающую, что изменение конструкции двигателя не повлияет на расход топлива при

уровне значимости

 

0,05.

 

 

 

 

 

 

Решение.

Дано:

 

x 9, 3 ,

2 , n 25 ,

0,05,

H0 : a0 10 , H0 : a 10 .

 

 

 

 

 

 

Вычислим статистику

 

 

 

 

 

 

 

 

 

 

x

a0

 

 

 

9,3 10

1, 75 .

 

zнабл.

 

n

 

 

 

 

 

25

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

145

 

 

 

Область G {z

u }, где u

квантиль уровня

случайной

величины

 

N(0,1) . Имеем

u0,05

u0,95

1, 65 , т.е.

G z

1, 65

. Так как zнабл.

G

 

 

1, 75

1, 65

, то гипотезу H0

отвергаем в пользу альтерна-

тивной. То есть из опытных данных следует, что модернизация двигателя привела к уменьшению расхода топлива.

 

Замечание. Пусть в условиях задачи Ha : a1

 

9 . Вычислим

мощность

 

критерия

r ,

вероятность

 

 

ошибки

второго рода

 

 

1 r , и ответим на вопрос, какой минимальный объем вы-

борки нужно взять, чтобы

 

 

0,05.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a0

 

 

a1

 

 

 

 

 

 

 

 

 

 

 

 

10 9

 

 

 

Имеем

 

 

 

r

F u

 

 

 

 

 

n

F

1, 65

25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F(0,85)

0,802.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

1

r

0,198 , где F(x)

 

 

 

 

 

e t

2

2 dt .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,05

 

r 1

 

0,95.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a0 a1

 

 

 

 

 

 

 

 

 

 

Решим уравнение 0,95

F

u

 

 

 

 

 

n

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a0

a1

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

10

 

9

 

 

 

 

 

 

 

u

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u0,95

1, 65

 

 

 

 

1, 65

 

 

n

1, 65

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 6, 6 ,

 

 

n

44 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 17.3. Из продукции двух станков-автоматов, вы-

пускающих

однотипные изделия,

взяты выборки

объемов

n1 15 и n2

18 . По результатам

выборок найдены

x1 32

146

мм, x2 35 мм. Дисперсии генеральных совокупностей из-

вестны

2

 

 

1

1, 5 ,

2

2,1. В предположении о нормальном

 

2

 

законе распределения погрешностей изготовления требуется на уровне значимости 0,05 проверить гипотезу

H0 : m1

m2 при альтернативной гипотезе Ha : m1

35

m2 .

 

Решение. У нас n1 15 , n2 18 , x1 32 , x2

, 1

 

 

 

 

2

2

2,1,

0,05.

 

 

2

 

 

 

 

 

 

1, 5 ,

Статистика u

 

 

x1

x2

 

 

. uнабл.

 

32

 

35

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,1

0,117

 

 

 

 

 

 

 

 

1,5

 

2,1

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15

 

18

 

 

 

 

 

 

 

 

 

 

 

 

 

n1

 

n2

 

 

 

 

 

 

 

 

 

 

 

 

3

 

6, 45 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0, 465

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Критическая

 

область G

для

 

альтернативной

гипотезы

Ha : m1

m2

имеет вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G

 

 

 

u

 

u 2

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,96 ,

 

 

 

 

1, 96 .

 

 

u 2 u0,025

 

u0,975

 

 

G

u

 

 

Т.к. uнабл.

G (6, 45

1,96 , то отклоняем гипотезу H0 в поль-

зу альтернативной Ha .

Задачи для самостоятельного решения.

17.1. По результатам 230 замеров, установлено, что среднее время изготовления детали x 48 сек. Предполагая, что вре-

мя изготовления есть нормальная случайная величина с

1

сек., необходимо:

 

 

1)

проверить на уровне значимости

0,05 гипотезу

H0 :

m

50 сек. против альтернативной гипотезы Ha : m 45 сек.

147

2)

вычислить мощность критерия и вероятность ошибки вто-

рого рода;

 

3)

проверить на уровне значимости

0,05 гипотезу H0 :

m

50 сек. против альтернативной гипотезы Ha : m 50 сек.

17.2. По данным 170 рейсов установлено, что в среднем ма-

шина затрачивает на

поездку до

хлебоприемного

пункта

x

73 мин. Допустив, что время поездки есть нормальная

случайная величина

на уровнях

значимости

0,05

и

1

0,1 проверить гипотезу H0 : a

75 мин.; при альтерна-

тивной гипотезе Ha : a

72 мин.

 

 

 

1)

если известно, что

1 мин.;

 

 

 

2)

если выборочное среднее квадратичное отклонение s

1

мин.;

 

 

 

 

3)

для условий 1) и 2) вычислить мощность критерия.

 

 

17.3. Из продукции двух автоматических линий, обрабатывающих корпуса вентилей одного типоразмера, взяты выборки объемов n1 150 и n2 90 . По результатам выборочных

наблюдений найдено x1 182 мм, x2 185 мм. Предварительно установлено, что погрешности изготовления есть нормаль-

ные случайные величины с дисперсиями

2

9 мм

2

,

2

15

 

 

 

 

 

 

1

 

 

 

2

 

мм2 . Требуется на уровне значимости

0,05 проверить ги-

потезу H0 : m1 m2 :

 

 

 

 

 

 

1) при альтернативной гипотезе Ha : m1

m2 ;

 

 

 

 

 

2) при альтернативной гипотезе Ha : m1

m2 .

 

 

 

 

 

148

ЗАНЯТИЕ № 18. ПРОВЕРКА ГИПОТЕЗЫ О ВИДЕ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ.

КРИТЕРИЙ

2

 

Пусть основная гипотеза H0 состоит в том, что функция распределения случайной величины есть функция F(x) , зависящая от неизвестных параметров. Наиболее часто применимым критерием проверки этой гипотезы является критерий, введенный К.Пирсоном. Его можно использовать для любых распределений, в том числе и многомерных.

Чтобы воспользоваться этим критерием, выборочные данные предварительно группируют следующим образом. Разбивают множество значений СВ X на r непересекающихся множеств Si с помощью (r-1) чисел a0 <a1<a2<…<ar:

 

S1

S2

S3

Sr 1

 

Sr

 

a0

a1

a2

a3

ar 2

ar 1 ar

Обозначим: pi=P(ai-1<X<ai)=F(ai)-F(ai-1) - вероятность попа-

дания X в интервал ai

1, ai в случае, когда предложенная ги-

 

 

r

 

потеза справедлива. Очевидно, что

pi 1. Пусть пi, i=1,...,r -

 

 

i

1

количество

элементов

выборки,

попавших в интервал

 

r

 

 

ai 1, ai ,

ni 1. Тогда ni/n есть относительная частота по-

i

1

 

 

149

падания величины X в интервал Si ai 1, ai при п наблюде-

r

 

ниях. Очевидно, что

ni / n 1.

i

1

Для приведенного на рисунке разбиения рi есть приращение гипотетической ФР F(x)на интервале Si, а ni/n - приращение эмпирической ФР F*(x) на том же интервале Si. В качестве статистики принимают следующую величину:

2

n

 

ni

2

r

ni

np

2

 

r

 

 

 

 

 

 

 

 

 

 

 

 

pi

 

 

 

 

,

i 1

pi

 

n

i 1

 

npi

 

 

 

 

 

 

являющуюся мерой отклонения эмпирической ФР от теорети-

ческой, а критическую область задают в виде Vk

Z

Z .

Таким образом, процедура применения критерия

2 для

проверки гипотезы H0 состоит из следующих этапов:

1. По выборке (2) найдем точечные оценки неизвестных параметров предполагаемого закона распределения F(x) .

2.

Разобьем числовую ось на r промежутков

a0 , a1 :

a1 , a2 ,

 

ar 1 , ar ,

 

 

 

 

 

 

a0

, ar

, a1 a2

 

ar 1 .

 

 

 

Если гипотеза H0 справедлива, то i

му промежутку

ai 1 , ai

соответствует вероятность

pi

F(ai )

F(ai 1 ) ,

i 1

r .

3.

Пусть из выборки (17.1)

ni

значений попадает в i

ый про-

межуток ai

1 , ai

 

 

 

 

 

150

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]