Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Синдлер Ю.Б. Метод двухступенчатого статистического анализа и его приложения в технике

.pdf
Скачиваний:
13
Добавлен:
24.10.2023
Размер:
9.21 Mб
Скачать

ставляет максимум функции Лагранжа (4.28) при некоторых зна­ чениях множителей Лагранжа.

Пусть TJ ( X ) и т2 (У) — статистики, на которых можно пост­ роить окончательное правило процедуры s°, a x„ (X) — статистика, на которой можно осуществить построение промежуточного пра­ вила s°.

Статистики (X) и т° (У) обычно легко определяются из выра­ жения, связывающего суммарное отношение правдоподобия I с

выборочными значениями X

и Y. Допустим, что функция I ( X , Y)

при любых

«і > 0

и л8 >

0 может быть представлена

в виде:

 

I (X,

Y)

=

h (ярх

(X),

яр2

(Y),

щ, 2),

 

пг

>

0;

 

 

 

I (X,

Y)

=

h (X)

=

h (ярх ( X ) ,

гро, П і ,

0),

п2

=

0,

( 4 '

Ь )

где h, ярІ5 я|з2 — некоторые функции; при п2

=

0 функция яр2 не за­

висит от У и равна постоянной величине яр2. Тогда TJ (X)

= ярх

( X ) ,

t 2

(У)

=

яр2

(У). Функции яр, и яр2 могут быть как скалярными, так

и

векторными.

 

 

 

 

 

 

 

 

 

 

 

 

Статистика т£ (X)

может

быть определена

из выражения

 

а (X,

щ) =

 

 

 

І

 

[I (X,

У) -

К]

(Y | X) dY.

(4.54)

 

 

 

 

 

 

Y-.ЦХ,

 

Y)>\x

 

 

 

 

 

 

 

Допустим,

что

функция

а (X, 2)

может

быть представлена в

виде

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а(Х,

гс2)

=

/ п (гр п (Х), щ),

 

 

 

 

 

 

(4.77)

где / п

и ярп

— некоторые функции. Кроме того, пусть Zj (X) явля­

ется

однозначной

функцией

от ярп. Тогда

функция А (X, п2)

(см.

(4.36)) может быть представлена как функция от ярп и тг2 и, следо­ вательно, оптимальное промежуточное правило может быть по­ строено на статистике т° = ярп (X) .

Рассмотрим часто встречающийся случай, когда выборки X и У статистически независимы при обеих гипотезах. Как известно, при этом Z (X, У) = Zj (X) 12 (У). Оптимальное окончательное пра­ вило может быть построено на статистиках хі — Іг (X) и т2 = Z2 (У). Кроме того, функция а (X, п2) может быть представлена как функция от Zx (см. разд. 4.6). Следовательно, функция А (X, ?г2) (см. (4.36)) также может быть представлена в виде функции от 1Х. Далее, значение тг2, при котором функция А (X, п2) достигает мак­ симума, зависит от Zj, и, следовательно, оптимальное промежуточ­ ное правило может быть построено на статистике Тц = Zx (X) .

Рассмотрим случай, когда выборки зависимы при одной гипо­ тезе, а при другой независимы. Тогда статистику TJ (X) = яр] (X) можно использовать для построения не только оптимального

Ш

окончательного правила, но и оптимального промежуточного пра­

вила. Действительно, допустим, что при гипотезе Нх выборки

за­

висимы,

а при

гипотезе Н0 — независимы. Тогда / 0

(У | X)

=

f0{Y).

Предположим,

что

I (X, У)

может быть

представлена

 

в виде

(4.76). Из (4.54) следует, что функцию а {X, га2) можно

рассматри­

вать как функцию статистики т? =

i[>j (X). Допустим

теперь,

что

при гипотезе Н0

выборки X и У

зависимы,

а при гипотезе Нг

независимы. Тогда

функцию

I (X,

Y) можно представить

в виде

7 (Y

Y\

-

/ '

 

У) _

/і ffl

h

_

h (X)f0(X)h(Y)

_

h

 

(X)fi(Y)

^ '

* >

-

H {X,

Y)

/„ (X,

Y)

~

f0(X,

Y)

 

 

( Y I

X) •

Поскольку lx (X) и

I (X, Y)

имеют

в качестве аргумента не саму

выборку

X,

 

а ее статистику

х°х =

^

{X), то /„ (У | X)

имеет в ка­

честве аргумента не X ,

а эту же статистику. При

рассмотренных

допущениях, как видно из (4.54), оптимальное промежуточное правило может быть построено на статистике т? (X) — ipx (X).

ЛИ Т Е Р А Т У Р А

1.Э. Леман. Проверка статистических гипотез. М., «Наука», 1964.

2.Б. Л. Ван-дер-Варден. Математическая статистика. М., ИЛ, 1960.

Г л а в а 5

МЕТОДЫ РАСЧЕТА ОПТИМАЛЬНЫХ ДВУХСТУПЕНЧАТЫХ ПРОЦЕДУР

5.1. Общие положения

В этой главе мы рассмотрим методы расчета оптимальных двух­ ступенчатых процедур, предназначенных для проверки двух ги­ потез. Эти методы будут даны применительно к процедурам детер­ минированного типа с постоянным или переменным объемом вто­ рой выборки, поскольку они представляют наибольший интерес для практики.

Как мы уже отмечали, для того чтобы построить оптимальную процедуру, нужно выбрать некоторое, количество показателей и решить условно-экстремальную задачу: найти экстремум одного показателя, когда другие удовлетворяют заданным ограничениям.

 

Основное внимание в настоящей главе будет уделено задачам,

в

которых

учитываются

четыре

показателя процедуры

s : a (s),

я

(s) = 1 —

В (s), Е0 (п, s), Ех (п, s). Напомним

(см. главу 3), что

величины a (s) и л (s) обозначают

вероятности

ошибок первого и

второго рода, a E k (n, s) — математическое ожидание

суммарного

числа наблюдений п = пх

-|- п2, если верна гипотеза Hh

(к = 0,1).

Для определенности будем рассматривать задачу

 

 

 

макс {я (s) | a (s) s£T ba,

Е0 (п, s) ^

bQ,

Ех

(п, s) ^

Ьх},

 

(5.1)

причем 0 <

ba < 1, 1 <

Ь0, Ьх

<

оо.

не

входят

вторые

моменты

 

В число

показателей

задачи

(5.1)

объема выборки, которые мы рассматривали в главах 3 и 4. На практике могут встретиться случаи, когда эти моменты необходимо принимать в расчет. В связи с этим может оказаться полезной следующая задача (методику решения которой мы приведем в кон­

це главы 5):

 

 

макс {л (s) | a ( s ) < ba,

Е0(п, s ) < 6 0 , а2 («, s)^ba},

(5.2)

где а2, (n, s) — дисперсия объема выборки при гипотезе Н0,

Ъа

максимально

допустимое

значение дисперсии.

 

Решение

задач вида (5.1) для ряда конкретных условий

будет

приведено в главах 6 и 7. Исходными

данными для решения в каж­

дом

конкретном

случае

являются

дискретные] распределения

Р0

(X, Y) и Р± (X, Y) или плотности

вероятности

/ 0

(X,

Y) и

/х

{X,

Y ) , которые

должны

быть заданы

для гипотез

Н0

и

Нх.

Обычно процедуры строят на некоторых статистиках тх (X) и т2 (У).

Иногда статистики тх (X) и т2 (У) постулируют (см., например, разд. 6.5). В этом случае для построения двухступенчатой про­ цедуры в качестве исходных данных должны быть заданы совмест­ ные распределения статистик Р0 х , т2 ) и Р х (т, т2 ) или / 0 х , т2 ) и Л fa, т2 ).

Часто оказывается возможным определить статистики т° (X) и т2 (У), на которых можно построить оптимальную двухступенча­ тую процедуру.

В главах 6 и 7 мы будем решать задачи вида (5.1) при условии, что выборочные величины X = х,...,.т„,) и У = (?/і,...,?у„г) ста­ тистически независимы, когда верна гипотеза Нп. В задачах такого типа, чтобы определить статистики тх {X) и т2 (У), следует про­ анализировать отношение заданных распределений (суммарное от­ ношение правдоподобия)

1 ( Х , У ) = £

если наблюдаемые величины дискретны, или

если

наблюдаемые

величины

непрерывны.

Допустим,

что

I

(X,

У)

может

быть представлено в

виде

некоторой

функции

h

(г[)х, гр2,

пх, п2),

где i])x = ij)x (X)

и

о))2

= я|)2

(У)

функции выбо­

рок

X и У

соответственно. Тогда

искомые

статистики

равны

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(5.3)

 

L

(s, %) =

я (s) -

М * (s) - Ь » ) -

 

0

{п, s) -

Ь0) -

l\ (Е\ (п,

s) -

 

 

 

 

 

 

 

 

 

 

 

 

-Ьх),

(5.4)

где Х А , ХІ, Х\ — множители Лагранжа.

Варьируя эти множители, мы можем максимизировать L (s, к)

ипроизвести расчет оптимальной двухступенчатой процедуры.

Впроцессе расчета процедур с постоянным объемом второй выборки должны быть определены:

— оптимальные

значения

объемов

обеих выборок щ и п2 ;

— область продолжения

испытаний

Un;,

— оптимальное

окончательное правило.

При расчете процедур с переменным объемом второй выборки должны быть определены:

— объем первой выборки /гх;

оптимальное промежуточное правило /г2 (X);

оптимальное окончательное правило.

Оптимальное окончательное правило во всех случаях может быть определено в следующем виде. Пусть в процессе эксперимента

получены выборочные

величины X = (хх,...,хПі)

и

У =

(?Д,...,2/Пг)

и вычислено суммарное отношение правдоподобия

I (X,

У). При­

нимаются решения: «верна гипотеза

Нд», если

I (X, Y)

<^ Ка, и

«верна гипотеза Нх»,

если I (X, У)

Ха. Если при каком-то исходе

X и Y имеет место

равенство I {X,

Y) = Ха,

мы

получаем две

оптимальные процедуры. В одной из них при данных X и Y при­

нимается гипотеза # 0 )

а в другой — Нх.

 

 

 

Такой же вид имеет окончательное правило, когда процедура строится па постулированных статистиках. В этом случае следует только вместо I (X, Y) взять отношение распределений статистик

Л (Ті, т2 )/^о ( f i , т2 ) и л и к fa, Та )//о fa, т2).

Заметим, что вычисление функции I (X, Y) во многих случаях затруднительно. Поэтому обычно стремятся представить оконча­ тельное правило в другой более удобной форме. Для этого преоб­ разуют неравенства I (X, Y) <[ \„ и I {X, У) ^> Ка и заменяют их более простыми соотношениями. Например, в задаче контроля доли дефектных изделий в партии продукции (см. главу 6) эти неравен­ ства приобретают вид dx -f- d2 <^ с3 и dx -f- d2 ^> с3, где число dx число дефектных изделий в первой выборке, d2 — число дефектных изделий во второй выборке, с3 — некоторая постоянная.

Методы расчета оптимальных промежуточных правил более сложны, чем методы расчета окончательных правил, и им будут специально посвящены разд. 5.2 и 5.3. В одном из этих методов, графоаналитическом, в качестве исходных данных используются рабочие характеристики второй ступени эксперимента (см. главу 3),

которые должны

быть построены для

заданных

распределений

Р 0 (X, У) и Рх (X,

У) (или /о (X, У) и fx

{X, У)).

В данной книге

мы не будем рассматривать методические вопросы, связанные с построением рабочих характеристик. Эти вопросы изложены, на­ пример, в [1]. Укажем лишь, что рабочие характеристики строятся на плоскости осу О зту для каждого значения объема второй выбор­

ки п2 = 1,2,...;

по оси О а у

откладывается

величина

О у ( * , Л а ) =

2

Po{Y\X),

(5.5)

У:13 (У|Х)>Хв /І,(Х)

апо оси О Лу — величина

 

я7(Х,щ)=

 

2

 

Pi(Y\X).

 

 

 

(5.6)

 

 

 

у:г,(У)>ха ,(х)

 

 

 

 

 

Суммирование

здесь ведется но тем

значениям

У,

при

которых

12

(У | X) > X J l x

(X);

Р0

(У | X) и

Рх (У | X) -

условные

веро­

ятности

исхода

У

при

фиксированном X , когда

верны

гипотезы

# „

и Нх

соответственно;

Z3

(У ] X) равно их отношению: 12

(У | X)

=

=

Рх (У | Х)]Р0 (У | X);

lx (X) — отношение

правдоподобия

иа

первой

ступени

эксперимента: lx (X)

= Рх (Х)/Р0

{X), где Р 0 (X)

и Рг (X) — вероятности исхода X при гипотезах Нй и Н1 соответ­ ственно.

Формулы (5.5) п (5.6) даны для случая, когда наблюдаемые величины дискретны. Если они пепрерывны, то в этих формулах

следует

Р0 (У|Х) и Рх (Y | X) заменить выражениями foJX_{X) dY

и fx (Y

\ X) dY, а суммы

заменить

интегралами.

Если

двухступенчатая

процедура

строится

на статистиках

Tj (X) и

т2 (У) (или TJ (X)

и т2 (У)),

то рабочие

характеристики

определяются такими же соотношениями. В них следует только

символ

X

заменить на r t

(или TJ), а символ

У — на т2 (или т2 ).

Как

мы

уже отмечали,

в процессе расчета

оптимальных про­

цедур некоторые их параметры находятся простым перебором. Так, прп расчете процедур с постоянным объемом второй выборки про­ стым перебором находятся оптимальные значения объемов пг и п2, а в случае процедур с переменным объемом второй выборки про­ стым перебором определится величина Помимо % и п2 в про­ цессе счета производится перебор множителей Лагранжа. Перебор множителей может быть как простым, так и направленным (ем. главу 1).

Перебор всех перечисленных величин можно производить в различном порядке. В зависимости от этого порядка и от способа поиска множителей Лагранжа мы получаем различные схемы вычислений. Некоторые из них будут рассмотрены в разд. 5.4.

5.2. Графоаналитический н численный методы построения

оптимального промежуточного правила1

Промежуточные правила с переменным объемом второй выборки

При поиске оптимальных промежуточных правил с переменным объемом второй выборки мы будем исходить из того, что множи­ тели Лагранжа (Яа , К] и %\), объем выборки на первой ступени пл и окончательное правило известны. Более того, мы примем допуще­ ние о том, что окончательное правило является оптимальным.

В разд. 4.6 предыдущей главы были приведены основные свойства оптимальных промежуточных правил. Было показано, что поиск оптимального промежуточного правила связан с поиском максимума функции А (X, п2) по п2.

Для того чтобы при некотором исходе испытания на первой ступени X найти оптимальное значение п2, следует вычислить зна­ чения функции А (X, ?г2) во всех допустимых точках п2 , 0 ^ п2 ^

N2,

и

выбрать п2

равным такому значению п\, при котором

функция

А

(X, По) достигает максимума.

1 Мы

изложим

методы

применительно к задаче (5.1).

116

Графоаналитический метод, который будет изложен ниже, соб­ ственно и заключается в поиске максимума функции А (X, п2) по п2. При применении этого метода наряду с вычислениями по формулам производятся графические построения. Правила этих построений достаточно формализованы, так что метод без особого труда может быть реализован на электронных вычислительных машинах, и в этом случае его можно рассматривать как численный метод.

Рис. 19 Рис. 20

Функцию

А(Х, щ) запишем в виде (см. разд.

4.5)

A{X,nt)

= a{X,Th)-hl(ll,nt),

(5.7)

где

 

 

ftx(ii,nO=-g-(Ai+i1^).

(5.8)

В разд. 4.5 были приведены свойства функции а (X, п2) и, в частности, показана связь этой функции с рабочими характеристи­ ками второй ступени. Функция а {X, По) может быть определена графически с помощью этих рабочих характеристик. В виде при­ мера на рис. 19 изображено качественно семейство рабочих харак­ теристик для случая, когда наблюдаемые величины во второй вы­ борке Y являются дискретными. Рабочие характеристики в этом случае представляют собой последовательности точек, которые строятся для каждого значения п2.

Заметим, что в общем случае семейства рабочих характеристик при различньїхїХ получаются различными.

Для того чтобы графическим путем определить значение функ­ ции а (X, По) для некоторых X и п2, следует сначала вычислить отношение правдоподобия ^, а затем на графике рабочей характе­ ристики, соответствующей данным X и п2, провести прямую под

%

углом arctg

к оси Оау, причем эта прямая должна проходить

хотя бы через одну точку рабочей характеристики и в то же время

ни одна точка рабочей характеристики не должна быть расположе­ на выше прямой. Этому требованию удовлетворяют, например, прямая F K и рабочая характеристика Н на рис. 19.

После того как указанная наклонная прямая построена, не­ трудно определить искомое значение функции а (X, п2): оно равно ординате точки пересечения наклонной прямой и оси ординат.

Построение оптимального промежуточного правила п2 (X) производится следующим образом. Производят перебор значений

вектора X.

Для каждого X определяют отношение правдоподобия

1Х и строят

график

функции а (X,

п2) в координатах п2Оа.

Строго

говоря,

такой график

должен был бы представлять

собой последовательность точек, определенных только для целых значений п2. Однако, учитывая, что величина п2 имеет обычно достаточно большое количество значений, можно функцию а {Х,п2)

представлять

как непрерывную кривую.

 

 

На рис. 20 показаны типичные графики этих функций для слу­

чая, когда

распределения наблюдаемых

величин

непрерывны.

В случае, когда эти величины дискретны,

характер

графиков не­

сколько изменяется, они имеют небольшую «волнистость». Под­ робно этот вопрос будет рассмотрен в главе 6.

Начальное значение функции а (X,

п2) в точке п2

= 0 зависит

от соотношения между

1Х и %а : если Іх

<^ Ка, то а (X,

0) = 0; если

1Х>К,

то а(Х,0) =

і - ^ .

 

 

Для того чтобы получить оптимальное значение

2, на графике

рис. 20 следует провести прямую под углом arctg^

-p- +

к оси

абсцисс Оп2, причем любая точка прямой должна быть расположена не ниже кривой а (X, ?г2) и в то же время прямая и кривая должны иметь хотя бы одну общую точку. Абсциссы точек совпадения определяют искомые значения п2.

Количество точек совпадения может быть различным. Допустим сначала, что имеется только одна точка совпадения. При этом бу­ дем различать три случая.

1. Наклонная прямая и кривая а (X, п2) касаются друг друга в некоторой точке F с координатами /г2 = /г° ^> 0, а ^> 0 (прямая НК на рис. 20). В этом случае рассматриваемое значение X следует отнести к области продолжения испытаний, а объем второй выбор­

ки

при этом должен быть

взят равным п\.

 

2. Наклонная прямая (например, ОС на рис. 20) и кривая а (X,

п2)

совпадают в точке тг2 =

0, а — 0. При данном значении X вто­

рая ступень эксперимента не должна проводиться; сразу же после первой ступени должна быть принята гипотеза Нй.

3. Наклонная прямая (например, прямая E D ) совпадает с кри­ вой а (X, п2) в точке п2 0, а ]> 0. Вторая ступень в этом случае также не должна проводиться; сразу после первой ступени при­ нимается гипотеза Нг.

Если при некотором X число точек совпадения равно двум или более, то, как было указано в разд. 4.6, оптимальная функция По, (X) получается неоднозначной. Мы имеем при этом две или более оптимальных стратегии поведения. Пусть, например, прямая E R совпадает с кривой а (X, п2) в двух точках; абсциссы этих точек равны 0 и ?г\. В этом случае мы имеем два различпых оптимальных решающих правила: одно из них предусматривает при данном X принятие гипотезы Ну без второй ступени, а второе — проведение второй ступени с объемом выборки п\. Оба эти правила обеспечива­ ют достижение экстремума функции Лагранжа.

Промежуточные правила с постоянным объемом второй выборки

Излагая метод построения промежуточных решающих правил с постоянным объемом второй выборки, мы будем по-прежнему ис­ ходить из предположения, что множители Лагранжа фиксированы, а окончательное правило — оптимальное. Кроме того, будем счи­ тать фиксированными значения объемов выборки на первой и вто­ рой ступенях эксперимента.

Рассмотрим вопрос о том, как построить область продолжения испытаний ипг, а также области £7° и U\ (области принятия гипо­ тез Н0 и Нг без второй ступени). Эти области могут быть определе­ ны следующим образом. Производят перебор значений вектора X. При каждом X осуществляют следующие операции:

1. Строят рабочую характеристику второй ступени для данных

X и п2.

2.Вычисляют отношение правдоподобия 1у.

3.Находят значение функции а (X, п2) описанным выше спо­

собом.

 

4. Вычисляют две величины, аг — а (X, п2) —п2 -г- -\-%\)

и а2 =

=

1

р - , и сравнивают их между собой и с нулем. Если at

> 0 и

йу

 

а2, то данный исход X следует отнести к области продолжения

испытаний Un„. Если ciy <^ 0 и а2 <[ 0, то данный исход X следует отнести к области Z7J3 (области принятия гипотезы Н0 без второй ступени). Если а2^> ау ж а2^> 0, то X следует отнести к области U\ (области принятия гипотезы Ну без второй ступени).

Мы изложили метод построения оптимального промежуточного правила в самом общем случае, когда аргументом функции п2 (X) является вектор X. Естественно, что практически производить перебор всех значений вектора X не представляется возможным. Обычно в качестве аргумента промежуточного правила использу­ ют одномерную или двумерную статистику Ху (X). Эта величина либо постулируется, либо определяется как статистика, на которой можно построить оптимальное промежуточное правило. Вместо

оптимальной функции п2 (X) мы должны в данном случае найти оптимальную функцию п2 г). Метод ее построения ничем по су­ ществу не отличается от метода построения оптимальной функции

п2 (X), и мы

не будем его

повторять.

В общем

случае, когда

величины, наблюдаемые на первой и

второй ступенях, статистически зависимы, графоаналитический ме­ тод имеет одну неприятную особенность. Эта особенность состоит в том, что рабочие характеристики второй ступени эксперимента зависят от исхода первой ступени, т. е. зависят от X (или от xx (X)). Поэтому для каждого X (для каждого хг) приходится строить ра­ бочие характеристики заново.

Если наблюдаемые величины на первой и второй ступенях ста­ тистически независимы, процесс построения оптимального проме­ жуточного правила существенно упрощается. В этом случае рабо­ чие характеристики второй ступени уже не зависят от X, и поэтому для всех X можно использовать одно и то же семейство рабочих характеристик.

Заметим, что при использовании этого метода при счете на ЭВМ зависимость рабочих характеристик от X не имеет существен­ ного значения, если эти характеристики не хранятся в памяти ЭВМ, а воспроизводятся по мере необходимости в процессе счета.

5.3. Аналитический метод определения оптимального промежуточного правила

Метод, изложенный в разд. 5.2, позволяет построить график функции п2 г), если в качестве статистики тх выбрана некоторая одномерная величина. Иногда в качестве статистики тх берут отношение правдоподобия 1Х. В некоторых случаях, в частности, когда выборки X и Y независимы, на статистике ly можно постро­ ить оптимальное промежуточное правило.

Функция п2 (ly) имеет вид ступенчатой целочисленной функции (рис. 21). Если число скачков достаточно велико, то эту функцию с некоторым приближением можно заменить непрерывной кривой g2 (ly). В тех случаях, когда мы имеем эксперимент с непрерывным временем наблюдения и непрерывными наблюдаемыми величинами, представление промежуточного правила в виде непрерывной функции является точным. В случае же, если объем второй выбор­ ки или наблюдаемые величины дискретны, такое представление является неточным, приближенным.

Допустим, что мы имеем задачу, в которой функцию п2 (1Х) можно с достаточно хорошим приближением рассматривать как непрерывную. В настоящем разделе мы приведем соотношения, с помощью которых можно получить уравнение функции g2 (ly) в удобной аналитической форме.

Напомним, что оптимальное промежуточное правило в процеду­ рах с переменным объемом второй выборки определяется из условия, чтобы был достигнут максимум функции A (ly, п2).

Соседние файлы в папке книги из ГПНТБ