книги из ГПНТБ / Синдлер Ю.Б. Метод двухступенчатого статистического анализа и его приложения в технике
.pdfПервый и второй начальные моменты числа наблюдений рав
ны:
Е\=РЦ) |
|
+ |
2Р(2) |
+ |
ЪР(Ъ), |
|
|
|
|
|
|
(2.50) |
|||||
Я2 = Р(1) + |
4Р(2) + |
№ ( 3 ) . |
|
|
|
|
|
|
|
(2.51) |
|||||||
Подставляя сюда значения Р (1), Р (2) и Р (3), получаем: |
|
||||||||||||||||
Е1 |
= |
1 + |
S /о (Zi) dZx + |
S |
j /о (Zi) /о (Z2) dltdl2, |
|
|
|
(2.52) |
||||||||
|
|
|
|
О ! |
|
|
|
С, C 3 / / i |
|
|
|
|
|
|
|
|
|
Я2 |
= |
1 + |
З J |
/0 ( |
у dZx |
+ |
5 J |
' J |
/0 |
(Z0 /о (Z2) <ВДа . |
|
(2.53) |
|||||
|
|
|
|
Сі |
|
|
|
|
C j |
С3/Ї1 |
|
|
|
|
|
|
|
Рассмотрим |
задачу |
|
|
|
|
|
|
|
|
|
|
|
|||||
макс {л | а = |
Ьа, |
Е1 |
= |
б1 , Е2 |
= &2 }, 5 = (съ |
с2, с3, с4 , с5 ), |
(2.54) |
||||||||||
|
S |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
где Ьа , Ь1 и |
— заданные |
величины. |
|
|
|
|
|
||||||||||
В некоторых случаях вместо второго начального момента мо |
|||||||||||||||||
жет быть задано значение bd |
дисперсии числа наблюдений, которая, |
||||||||||||||||
как известно, равна Е2 — (Е1)2. |
|
Тогда |
необходимая для |
задачи |
|||||||||||||
(2.54) |
постоянная Ъ2 может |
быть определена |
соотношением |
Ъ2 — |
|||||||||||||
= (b1)2 + bd. |
Обозначим через 5°= (с?, с\, с%, с\, с°) совокупность опти |
||||||||||||||||
мальных значений порогов. |
|
|
|
|
|
|
|
|
|
||||||||
Функция Лагранжа для задачи (2.54) равна |
|
|
|
||||||||||||||
L |
= |
л - |
Ха (а - |
Ьа) - |
А.1 |
(Я1 |
- |
Ьг) - |
X2 (Я2 - |
Ъ2), |
|
(2.55) |
|||||
где Ха, |
Xі, |
Я.2 — множители |
Лагранжа. |
|
|
|
|
|
|||||||||
После несложных преобразований, подставив выражения для |
|||||||||||||||||
показателей, |
получим |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
оо |
|
|
|
|
|
|
с а |
|
|
|
|
|
|
|
|
L |
= |
\ (h — К) f0 |
(h) dk |
+ |
5 A |
(Zi, |
с3 , |
с4 , с6 ) /о |
dZx + Я А |
+ |
|||||||
где |
+ |
i W + |
Я2Ь2, |
|
|
|
1 |
|
|
|
|
|
|
(2.56) |
|||
|
|
|
|
|
оо |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
^ 2 |
(Zi, с3 , с4 , сБ ) = |
^ |
(ZXZ2 |
— Яа ) / 0 |
(Z2) dZ2 + |
|
|
|
|
||||||||
|
|
|
|
|
|
+ |
S |
|
(ZiZa, c6) /0 (Z8) dZ8 — Я1 |
— ЗЯ2, |
|
(2.57) |
|||||
|
|
|
|
|
00 |
|
|
|
|
|
|
|
|
|
|
|
|
^ 3 ( Z i Z 2 l c 5 |
) = |
J (l1kl3-Xa)f0(l3)dl3-Xl-5X2. |
|
|
|
|
(2.58) |
||||||||||
Из (2.58) видно, что |
функция |
- 4 3 |
(ZXZ2, с5 ) достигает максимума |
||||||||||||||
по е° в |
точке |
съ |
— Ха. |
Поэтому |
оптимальное |
значение съ |
равно |
||||||||||
с 5 = ^ссФункция А2 (llt |
с3, с4 , Яа ) |
достигает |
максимума |
по |
с 3 в |
случае, когда |
|
4 . ( c 3 , M = 0, |
(2.59) |
а по с4 — когда |
|
А^СьЮ^Ъ-К. |
(2-60) |
Таким образом, мы получили уравнения, решение которых дает
оптимальные значения порогов с° и с\. Из (2.56) получаем анало |
||||||||
гичные уравнения: |
|
|
|
|
|
|||
А, |
[сх, с*, с о К) |
= |
0, |
|
|
|
(2.61) |
|
А2 |
(с2, eg, |
с», К) |
= |
с2 - |
К, |
|
|
(2.62) |
решение которых |
дает оптимальные |
значения порогов с? и с°. |
||||||
В качестве примера рассмотрим случай, когда требуется про |
||||||||
верить гипотезы о наличии (гипотеза Нх) |
или об |
отсутствии (ги |
||||||
потеза Н0) |
импульсных |
сигналов на |
фоне |
шума |
[21]. Предпола |
гается, что амплитуды сигналов распределены |
по закону Релея, |
фазы распределены равномерно в интервале длины 2л, амплитуды |
|
и фазы на различных ступенях статистически |
независимы. При |
этих условиях функции / 0 |
(It) и fx |
(її) имеют вид: |
|
|||||
|
' 0, |
|
|
|
|
если |
Z; < (1 + д)~и, |
|
fo(h) |
= |
|
і |
|
„ і |
|
(2.63) |
|
|
{ g - M l + |
g) |
3 |
h |
\ |
если |
Z ; > ( l + g)-i; |
|
|
о, |
|
|
|
|
если *4<(Ц-д)-\ |
(2.64) |
|
|
|
|
|
|
- 1 - і |
|
|
|
|
[q-ЦІ + д) |
1 |
h |
если |
li>(l+q)-\ |
|
||
|
q |
\ |
|
|||||
где д — отношение удвоенной средней энергии импульсного |
сиг |
|||||||
нала к спектральной |
плотности мощности |
шума. |
|
|||||
Найдем функцию |
А3(1Х12, |
Ка). |
Заметим, что поскольку |
13 ]> |
||||
^> (1 + |
q)~x, то при lxl2 |
^> Ха |
(1 + д) всегда lxl2l3 ^> %а. Поэтому при |
таких значениях 1Х12 третья ступень наблюдения никогда не прово
дится. Поэтому |
функция А3 (1Х12, |
Ха) |
представляет интерес толь |
|||||
ко в интервале |
(1 + |
g)~z < |
lxl2 |
< |
Я а |
(1 + g). |
|
|
Раскрывая (2.58), |
получаем |
|
|
|
|
|||
A s (hh, К) = |
qK |
Q(i |
+ |
q) |
9 |
(Ш |
" - b1 - 5W». |
(2.65) |
Функция j 4 2 |
(^i> c 3 ' cb |
ha) может быть определена с |
помощью |
(2.57). Для нее интервал изменения аргумента запишется в виде
(1 + |
g ) - 1 < |
lx < с\ (1 + |
д). Поскольку всегда Z 2 > ( 1 + д)"1 , ниж |
|
ний |
предел |
второго |
интеграла в (2.57) должен быть |
равным |
макс |
[(1 + |
g)~l; cl/lx]. |
Поэтому в зависимости от соотношения |
|
величин (1 - f д ) - 1 и c%ilx функция А2 (1Х, с3, с\, Ка) имеет |
различ- |
иые аналитические выражения. Раскрывая (2.57), получаем
|
(h, |
|
|
|
К) |
= |
|
И) |
ч |
Я,„ - |
X і — 5Х3 |
|
||
|
cj>, |
с» |
|
|
|
|||||||||
А 2 |
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
(1 + |
?) (<ф |
|
||
|
|
Я,1 |
+ |
5Я,2 |
|
In |
(сЬВ) |
— Л.1 |
— З?.2 , |
(2.66) |
||||
|
|
|
|
|
|
|
|
|
||||||
|
(1 + |
? ) |
В |
|
|
(1- |
|
|
|
|
|
|
|
|
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
если |
|
|
(l+q)-1<h<c°(l+q), |
|
||||
|
|
|
|
|
|
|
|
|
(2.67) |
|||||
В |
|
|
|
+ |
д), |
если |
c° (1 + |
g ) < |
i a < |
с» (1 + q). |
||||
|
|
|
|
|
||||||||||
Приведем |
численный |
пример. |
Пусть |
%а |
= |
1, Xі = |
2 5 - Ю - 3 , |
|||||||
Я,2 = |
7 5 - Ю - 3 , |
q = |
5. Подставляя эти данные |
в |
(2.65), |
получаем |
||||||||
уравнения для порогов с3 и с4 (см. (2.59) и (2.60)): |
|
|||||||||||||
|
= |
0,686, |
|
cj-a = 1,72с4 — 1,03, |
|
|
|
|
|
|||||
решая которые |
находим |
Cg = |
0,73, |
с° = |
1,65. |
Подставляя число |
вые данные в (2.66), получаем уравнения для порогов сг и с2 (см. (2.61) и (2.62)):
|
c i.a = |
0,415, |
= 1,655 с 2 |
- 1,24, |
|
|
|
откуда |
с\ = 0,48, |
с\ — 2,7. Подставив эти данные в приведенные |
|||||
выше выражения показателей а, я, 2?1 и Е2, |
имеем: а |
= |
0,055, я = |
||||
= |
0,758, Я 1 = 1,28, Е1 = 1,86. Среднеквадратичное отклонение чис |
||||||
ла |
наблюдений составляет У"1,86-(1,28)а |
= 0,48, |
т. |
е. 37,5% |
|||
от |
среднего числа наблюдений |
Е1. |
|
|
|
2.5. Некоторые вопросы методологии исследования
В разд. 2.2—2.4 мы рассмотрели ряд типов статистических экспериментов и описали отдельные процедуры, с помощью кото рых можно выполнять эти эксперименты. Мы определили логи ческие схемы процедур, а также параметры и функции, которые подлежат варьированию. Тем самым мы фактически определили некоторые множества (классы) процедур. Например, в разд. 2.2 мы рассматривали класс двухступенчатых процедур оценивания, каждая процедура которого характеризуется некоторым фиксиро ванным значением объема первой выборки /гх и некоторой целочис ленной функцией п2 (s2 ). Для каждого типа экспериментов мы вве ли в рассмотрение некоторое количество показателей процедуры и сформулировали условно-экстремальную задачу. Мы нашли алгоритмы, с помощью которых можно вычислять экстремум ли нейной комбинации показателей (функции Лагранжа), а также оп ределять процедуры, которые обеспечивают этот экстремум. Как следует из главы 1, процедуры, полученные с помощью этих ал горитмов, являются оптимальными в том смысле, что в рассмат-
риваемых классах пе существует процедур, которые были бы не хуже найденных по всем показателям и хотя бы по одному показа телю лучше.
Эксперимент, предназначенный для одной и той же цели (оценивание, поиск и т. д.), может иметь различную структуру, т. е. может быть построен по различным логическим схемам. Так, например, в разд. 2.3 был описан ряд логических схем процедур поиска объекта. Для каждой схемы можно ввести различные допу щения, касающиеся выбора ее параметров. В зависимости от при нятой структуры и принятых допущений мы будем получать про цедуры, имеющие различные свойства, характеризующие их с точки зрения экономичности, достоверности статистических вы водов и простоты их практической реализации. Допустим, напри мер, что мы выполняем ряд двухступенчатых экспериментов поис ка объекта по любой из схем разд. 2.3 и во всех экспериментах распределения вероятностей наблюдаемых величин неодинаковы. В некоторых случаях для простоты применяют во всех экспери ментах процедуры с одинаковым отношением длительностей набоюдения на первой и второй ступенях. В других случаях эти от ношения делают разными и для каждого эксперимента находят оптимальное значение отношения длительностей. Такие процеду ры более эффективны, но их труднее реализовать.
,v Таким образом, необходимым этапом исследования процедур
любого назначения является их классификация и сопоставление между собой с точки зрения экономичности, достоверности стати стических выводов и простоты реализации.
Для расчета оптимальных двухступенчатых процедур мы ис пользовали один из общих методов математического программиро вания — метод множителей Лагранжа. Как было показапо в гла ве 1, этот метод в общем случае позволяет получить решение задачи, если множество процедур рассматриваемого класса отобра
жается в |
пространстве показателей на некоторое выпуклое |
|
множество. |
Поэтому применение метода множителей Лагранжа |
|
в каждой |
конкретной задаче |
требует изучения вопроса о том, |
является ли указанное выше |
множество выпуклым. |
Функция Лагранжа в каждой задаче имеет свои специфичес кие особенности, которые полезно знать при построении алго ритма решения. Исследование свойств функции Лагранжа явля ется также необходимым звеном при изучении процедур.
Метод множителей Лагранжа во многих случаях дает только приближенное решение задачи. При этом возникает необходи мость изучения вопросов, связанных с точностью решения.
Рекомендуя какой-либо метод для решения задач определен ного типа, мы должны быть уверены, что метод не приведет к вы рожденным решениям. Так, например, в ряде задач ставится во прос об отыскании некоторой неотрицательной функции (приме ром может служить функция п2 (s2) в задаче двухступенчатого оценивания). На эту функцию мы не накладываем формально ог-
раничений сверху. Мы должны быть уверены, что в результате решения не получим функцию, имеющую бесконечные значения.
Указанные вопросы требуют проведения специальных, иссле дований. В данной книге это будет сделано для задачи проверки двух простых гипотез как задачи, имеющей наиболее широкую область приложения. Методология исследования, по-видимому, может быть использована и для других задач.
ЛИ Т Е Р А Т У Р А
1.А. Валъд. Статистические решающие функции.— В сб.: Позиционные
|
игры. Под ред. 1-І. Н. |
Воробьева п др. М., «Наука», 1967. |
|
||||||||||||||
2. |
А. Е. Башарипов, |
Б. |
С. Флейшман. |
|
Методы |
статистического |
последо |
||||||||||
|
вательного |
анализа и |
их приложения. М., |
«Советское |
радио», 1962. * |
||||||||||||
3. |
С. Stein. |
A |
two-sample |
test for a linear hyrothesis whose power is inde |
|||||||||||||
|
pendent |
of |
the variance . — A n n . Math. |
Statistics, 1945, |
16, 243. . |
||||||||||||
4. |
A. Birnbaum, |
|
W. |
C. Healy. |
Estimates |
with |
prescribed |
variance based on |
|||||||||
|
two-stage |
sampling . — A n n . Math. Statistics, 1960, 31, |
662. |
|
|||||||||||||
5. |
F. A. |
Graybill. |
Determining |
sample |
size |
for |
a |
specified |
width confidence |
||||||||
|
interval . — |
A n n . Math. |
Statistics, 1958, |
29, |
282. |
|
|
|
|
||||||||
6. |
G. B. |
Wetherill. |
Sequential |
methods |
in statistics. London, |
1966. |
|
||||||||||
7. |
A. S. |
Goldman, |
R. K. |
Zeigler. Comparisons |
of |
some |
two-stage |
sampling |
|||||||||
|
methods.— |
A n n . Math. |
Statistics, 1966, |
37, |
891. |
|
|
|
|
||||||||
8. |
Б. Л. Ван-дер-Варден. |
Математическая |
статистика. |
M . , |
ИЛ, |
1960. |
9.Ю. Б. Синдлєр. Об оптимальной двухэтапной процедуре радиолокацион ного измерения при неизвестном отношении сигнал/шум.— Радиотехни ка и электроника, 1969, 14, № 1, 75.
10.Р. Беллман. Динамическое нрограммпрование. М., ИЛ, 1960.
11. Е. S. Posner. Oprimal search procedures.— I E E E Trans . , 1963, I T - 9 ,
№3, 157.
12.В. В. Акиндиное. Относительная эффективность оптимального алгоритма
|
многоэтапного |
поиска.— Изв. |
А Н |
СССР. |
Техническая |
кибернетика, |
||||||
13. |
1966, № |
|
4, 34. |
|
|
|
Анализ |
характеристик |
обнаружения |
|||
БуреевВ.А., |
Меньшиков |
А. |
В. |
|||||||||
|
систем |
с |
переменной |
разрешающей способностью.— Радиотехника и |
||||||||
|
электроника, |
1965, 10, № 12, 2091. |
|
|
|
|
||||||
14. |
И. Н. Кузнецов. Вопросы |
радиолокационного |
поиска.— |
Радиотехника |
||||||||
|
и электроника, 1964, 9, № |
2, |
187. |
|
|
|
|
|||||
15. |
В. Д. Перов. |
Оптимальное распределение энергии при обнаружении |
||||||||||
|
сигналов |
по критерию |
Неймана — Пирсона.— Изв. А Н |
СССР. Техни |
||||||||
|
ческая кибернетика, 1963, Кг 2, 52. |
|
|
|
|
|||||||
16. |
В. О. Koopman. |
The theory |
of |
search . — Operat. R e s . , 1957, N 5, 613. |
||||||||
17. |
J . De Guenin. |
Les fondements |
d'une |
theorie |
de |
la recherche.— R e v . sta- |
||||||
|
tistique |
appl., |
1959, 7, |
4. |
|
|
|
|
|
|
|
18.9. И. Цветков. Двухэтаппые системы обнаружения с памятью и парал
лельной реализацией этапов.— Радиотехника и электропика, 1969, 14,
№10, 1804.
19.В. П. Титов. Метод определения статистических характеристик времени
поиска.— Радиотехника и электроника, 1971, 15, № 6, 1068.
20.С. С. Лавров, Л. И. Гончарова. Автоматическая обработка данных. Хра нение информации в памяти ЭВМ. М., «Наука», 1971.
21. Л. А. Вайнштейн, В. Д. Зубакое. Выделение сигналов на фоне помех.
М., «Советское радио», 1960.
22.Э. М. Хазен. Методы оптимальных статистических решений и задачи оптимального управления. М., «Советское радио», 1968.
23.А. Н. Ширяев. Статистический последовательный анализ. Оптимальные правила остановки. М., «Наука», 1969.
3 Ю. Б. Сипдлер |
65 |
Г л а и а 3
КЛАССИФИКАЦИЯ ПРОЦЕДУР ДВУХСТУПЕНЧАТОГО АНАЛИЗА, ПРЕДНАЗНАЧЕННЫХ ДЛЯ ПРОВЕРКИ ДВУХ ГИПОТЕЗ
3.1. Введение. Осповные элементы процедуры
В этой главе мы продолжим начатое в разд. 2.1 изучение проце дур двухступенчатого анализа, предназначенных для проверки двух гипотез. Мы рассмотрим основные классы двухступенчатых процедур, приведем логические схемы, по которым они строятся, и определим их показатели.
Заметим, что логические схемы многоступенчатых процедур в наиболее общем виде рассмотрены в [1].
В разд. 2.1 была приведена формулировка задачи оптимизации двухступенчатых процедур, в которой учтены четыре показателя: вероятности ошпбок первого и второго рода, а также математиче ские ожидания числа наблюдений при обеих гипотезах. В некото рых случаях может возникнуть необходимость припимать в рас чет моменты числа наблюдений не только первого, но и более высо
ких порядков. В связи с этим в главах 3 и 4 при изучении |
теорети |
|||||||||
ческих вопросов мы добавим к |
четырем упомянутым показателям |
|||||||||
еще два — вторые начальные моменты числа |
наблюдений. |
|
|
|||||||
Классы |
процедур |
будем обозначать |
символом |
S, добавляя |
к |
|||||
нему индексы. Например, класс рандомизированных |
процедур |
|||||||||
(см. разд. 3.2) обозначим через <SP. Отдельные процедуры будем |
||||||||||
обозначать символом |
s. |
|
|
|
|
|
|
|
|
|
Введем |
обозначения для |
|
шести показателей |
процедуры |
s: |
|||||
a (s) и В (s) — вероятности |
ошибок |
первого |
и |
второго |
рода, |
|||||
Е\ (п2, S)'M. |
Е\ (?i2 , s) — математические ожидания числа наблюдений |
|||||||||
на второй ступени п2 при гипотезах Н0 |
и Ну, ЕІ (?г2, s) и Е\(п2, |
S) — |
||||||||
вторые начальные моменты |
величины |
?г2 при гипотезах П0 |
и Ну. |
|||||||
Каждая процедура имеет следующие элементы: |
|
|
|
|||||||
1) объем выборки |
(число |
наблюдений) на |
первой |
ступени; |
2)правило определения объема выборки на второй ступени по результатам испытания, полученным на первой ступени;
3)правило принятия одного из альтернативных решений, ког да эксперимент окончен.
Правило, указанное в п. 2, будем называть промежуточным решающим правилом, а в п. 3 — окончательным решающим пра вилом.
Рассмотрим указанные элементы подробнее.
Объем выборки на первой ступени пі
Во всех процедурах двухступенчатого анализа, известных в ли тературе, объем выборки на первой ступени представляется как постоянный параметр процедуры. Такое допущение будет принято
издесь.
Внекоторых случаях величину пх определяют при расчете процедуры: варьируют этот параметр и ищут его оптимальное зна чение. В других случаях величина пг считается заданной.
|
В алгоритмах, которые будут приведены ниже, вычисление |
|
пх |
производится простым перебором в заданном интервале 1 |
|
^ |
пг |
Nx с некоторым шагом. К сожалению, другие способы неиз |
вестны. |
Заметим, однако, что, поскольку величина пг является |
одномерной, поиск ее оптимального значения связан с увеличе нием объема вычислительной работы практически всего лишь на порядок по сравнению со случаем, когда величина пх задана. Та кое увеличение объема вычислений следует считать сравнительно небольшим.
В главах 3 и 4 при изучении теоретических вопросов мы будем считать величину пх заданной.
Промежуточное решающее |
правило |
|
Это правило позволяет определить объем выборки на второй |
||
ступени п2 в зависимости |
от вектора X = (хх, |
хПі), который |
мы получаем на первой ступепи. Промежуточное правило обозна чил! в виде п2 (X). Способы построения промежуточных правил будут рассмотрены ниже, а пока сделаем ряд замечаний общего характера.
В каждом эксперименте п2 выбирается из множества целых неотрицательных чисел, лежащих в пределах 0 ^ п2 =С N2.
Подчеркнем, что в числе возможных значений п2 находится и нулевое значение. Если выбрано п2 — 0, это означает, что решено не проводить вторую ступень эксперимента.
Заметим, что множество значений п2 может состоять не обяза тельно из чисел, следующих друг за другом через единицу. Оно может представлять собой любой ряд целых неотрицательных чи сел, обязательно включающий в себя нулевое значение. Для прос тоты будем считать, что числа в этом ряду следуют подряд через единицу.
С практической точки зрения величину п2 всегда можно огра ничить сверху некоторым числом N2. В следующей главе будет по казано, что если N2 достаточно велико, то промежуточное правило оптимальной процедуры s° (являющейся решением задачи (2.4)), не зависит от N2. Поэтому N2 является несущественным парамет ром в излагаемой теории.
Промежуточное правило п2 {X) можно представить в виде двух промежуточных правил: промежуточного правила, предназна ченного для выбора одного из двух решений: п2 = 0 или п2 ] > 0;
3* 67
промежуточного правила, предназначенного для выбора п% в пре
делах 1 --С л2 |
N4 . В дальнейшем мы ипогда будем пользоваться |
|||||
таким |
представлением. |
|
|
|
||
Рассмотрим некоторые типы промежуточных правил. |
||||||
Промежуточные |
правила, |
|
|
|
||
построенные па полной выборке |
X и на статистике |
тп(X) |
||||
Если промежуточное правило представляется некоторой функ |
||||||
цией п2 |
= / (-Ти |
х,и) — f |
(X), |
имеющей в качестве аргументов |
||
пх величин х17 |
|
х,и, будем |
говорить, что оно построено на пол |
|||
ной выборке |
X. |
|
|
|
|
|
Допустим, что имеется некоторая статистика т п |
(X), т. е. функ |
|||||
ция выборочных величин х-у, |
|
хПх. Мы скажем, что промежуточ |
ное правило построено на статистике т п (X), если оно может быть представлено некоторой функцией этой статистики: ?г2 — А (^п)- Заметим, что статистика т п (X) может быть как одномерной величиной, так и вектором. Последний случай мы рассмотрим в
разд. 7.4 и 7.5.
Если функция т п (Х) является одномерной или двумерной и мо жет быть представлена в аналитическом виде, то использование этой статистики при построении промежуточного правила позво ляет сильно упростить процедуру и облегчить задачу ее оптимиза ции.
В общем случае построение промежуточного правила на статис тике т п (X) может привести к ухудшению показателей процедуры по сравнению со случаем, когда правило построепо па полной вы борке X. Часто, однако, оказывается возможным найти такую ста тистику Тд (X), что ухудшение показателей не имеет места. До пустим, что при решении задачи вида (2.4) мы пашли опти мальное промежуточное правило, построенное на полной выбор ке X, и это правило может быть представлено в виде функции
некоторой статистики Тц (X) : ?г2 = Д (тп ). Это означало бы, что
оптимальное промежуточное правило можно построить |
|
на стати |
стике Тп (X). |
|
|
Промежуточные правила, |
|
|
детерминированные и рандомизированные |
|
|
Рассмотрим случай, когда промежуточное правило |
строится |
|
на полной выборке X. Функция пг = f {X) — f (xlt |
Хп) может |
быть в одних случаях детерминированной, в других — случай ной. Промежуточное правило будем называть детерминированным, если при всех X функция пг — f (X) является детерминированной. Если хотя бы при одном значении X функция 7гг = f (X) является случайной, т. е. с некоторыми вероятностями может принимать различные значения, то промежуточное правило будем называть р андомизир ов энным.
При рандомизированном промежуточном правиле определение величины п2 производится с помощью вспомогательного экспери мента, который проводится после первой ступени основного экс перимента. Вспомогательный эксперимент может иметь JV2 + 1 исходов: пг = 0,1, N2. Вероятность каждого исхода представ ляется как некоторая функция qn, (X). Для любого X должно быть выполнено условие
N,
2 Яъ(Х) = 1-
пз=0
Промежуточные правила с постоянным и с переменным объемом второй выборки
В литературе (см., например, [2—7]) широкое распространение получили двухступенчатые процедуры, в которых объем второй выборки при различных значениях X может иметь только два зна чения, причем одно из них равно нулю, а другое — некоторой вели
чине п\. Величина |
/г* определяется при расчете процедуры. В на |
|
шем случае щ может |
быть выбрано из множества чисел 0,1, ... |
|
Nz. В случае п2 |
= |
0 двухступенчатая процедура превращается |
в одноступенчатую. Функция п2 = f (X) при одномерном X имеет вид, изображенный на рис. 14.
Правила такого рода будем называть правилами с постоянным
объемом второй |
выборки. |
|
Ч |
|
N, |
|
Ч |
|
^Х |
Рис. 14 |
Рис. 15 |
В некоторых работах (см., например, [8—10]) рассматривается случай, когда при различных значениях X величина объема вы борки на второй ступени п2 может иметь число значений больше двух. Такие правила будем называть правилами с переменным объе
мом второй |
выборки. |
Пример такого правила при одномерном |
X изображен |
на рис. |
15. При поиске правил с переменным объе |
мом второй выборки рассматриваются функции п2 = f (X) с лю бым числом значений, вплоть до N2 + 1. В примере на рис. 15 число таких значений равно семи.
Окончательные решающие правила |
|
|
|
|
|
||||
После того как эксперимент окончен, должно быть принято |
од |
||||||||
но из двух решений: решение б 0 о Т О Л І , |
Ч Т О |
верна гипотеза Н0, |
|
или |
|||||
решение бх о том, что верна гипотеза |
I I х . |
|
|
|
|
||||
В общем виде окончательное решающее правило может быть |
|||||||||
формально определено следующим образом. Для |
значений |
п2 |
= |
||||||
= 1, |
N2 |
вводится функция ф„3 (X, Y) |
от пх + |
п2 переменных |
|||||
хх, |
хп„ ух, |
уПа. |
Помимо этого, для |
пг — О Б В О Д И Т С Я |
функ |
||||
ция ф0 |
(X) от переменных хх, |
хП1. |
|
|
|
|
за |
||
В дальнейшем нам будет удобно применять единую форму |
|||||||||
писи функций ф„а (X, |
Y) для |
всех значений п2, включая и нулевое |
значение. При этом будем иметь в виду, что для ?г2 = 0 функция Фо (X, Y) зависит лишь от выборки X.
Для всех значений п2, X |
и Y должно быть выполнено |
условие: |
0 < ф п Д Х , У ) < 1. |
принимается следующим |
образом. |
Окончательное решение |
Производится вспомогательный случайный эксперимент с двумя исходами: с исходом б 0 , который имеет вероятность 1 — фП г (X, Y ) , и с исходом 8Х, вероятность которого равна ф„2 (X, Y ) .
Окончательные правила, детерминированные п рандомизированные
Окончательное правило будем называть детерминированным, если при всех исходах испытания на первой и второй ступенях функции фп . (X, Y) (п2 = 0,1, N2) принимают только два зна чения: 0 и 1. Случайный эксперимент по принятию окончатель ного решения в этом случае вырождается в детерминированную операцию:
если |
фп ,(Х, Y) = 0, |
принимается решение б0 ; |
если |
ф П ; (Х, Y) — 1, |
принимается решение 8Х. |
Окончательное правило будем называть рандомизированным, если хотя бы при одном значении X и Y и хотя бы при одном п2 функция ф„2 (X, Y) имеет значение, лежащее внутри интервала [0,1]. В этом случае решение является случайным.
|
Окончательные правила, построенные на полных выборках |
X и Y |
|||||
|
и |
на статистике х$(Х, |
Y) |
|
|
|
|
|
Выше мы ввели величины |
фп „ |
представляя |
их как |
функции |
||
пг |
+ |
п2 переменных хг, |
Яп„ |
ух, |
уп,- При |
этом будем гово |
|
рить, |
что окончательное правило построено на полных выборках |
||||||
X |
и У. |
|
|
|
|
|
Допустим, что имеется некоторая функция т0 (X, Y) и величи на ф„, представляет собой функцию ф„. = / (т0 ). В этом случае мы будем говорить, что окончательное правило построено на ста тистике т0 (X, Y ) .