Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Вапник В.Н. Теория распознавания образов. Статистические проблемы обучения

.pdf
Скачиваний:
102
Добавлен:
25.10.2023
Размер:
12.29 Mб
Скачать

§ 4. ДОКАЗАТЕЛЬСТВО НЕОБХОДИМОСТИ

259

Положим теперь0

8

и рассмотрим величину К',

отличающуюся от

правой

части

(11.19)

лишь иными

пределами суммирования,

 

 

 

Г,

р Т р І - Г

.

p t p l - r - t

 

 

 

1 V

°P(kVv 2l-n-p(k)

Л

Z j

p l

p r Z j

p l - r

'

 

r

к

 

l-n

 

где г и t пробегают значения, удовлетворяющие следую щим неравенствам:

 

п

< еп ,

(11.21)

 

г — ~2

t

р(к) ( 1 - г )

<^81.

(11.22)

21-

 

 

 

 

 

При r u t , удовлетворяющих (11.21) и (11.22), автомати­ чески выполняется (11.20). Действительно, при этом

r | 2 l - f .

і Г л

.

2р

[j

п

\

 

 

----- 1—

 

+

 

 

 

 

»)]

 

 

- 2 d - P\ > - r [ i r - B(n + 2l+wz:

 

Поскольку было принято, что] ql<C.n<^l, 6 =

, е

,

то

Так как область суммирования в выражении для К ' вкла­ дывается в область суммирования (11.19), то

 

К > К '.

 

Далее, для всякого г] > 0 найдется

10, зависящее

только от ц и д, такое, что для всех Z>

10

2

С;' т :П> 1 - П

(11.23)

г

°21

 

(суммирование ведется по г, удовлетворяющим (11.21)) и

2

Ctp(S Lp > 1 - 4

(11.24)

t

° 2 l - n

 

(суммирование ведется по t, удовлетворяющим (11.22)).

9*

260 гл . XI. НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЯ

Действительно,

Сп-С21t--гП

сггI

есть вероятность вынуть г черных шаров из урны, содер­ жащей п черных и 21 п белых шаров, когда вынимается случайно I шаров без возвращения. При этом математи­ ческое ожидание числа черных шаров в выборке равно nt2 и правая часть формулы (11.23) выражает вероят­ ность того, что число черных шаров в выборке отклонит­ ся от математического ожидания более чем на гп. Пос­ кольку для схемы без возвращения справедлив закон больших чисел, формула (11.23) верна, начиная с дос­ таточно больших I.

Аналогично

есть вероятность вынуть t черных шаров из урны, содер­ жащей р черных и 21 п р белых шаров, когда вынимается шаров, опять-таки без возвращения. Математическое ожидание черных шаров в выборке равно

гР ( і - г ) l 2I п р

и, следовательно, формула (11.24) выражает закон боль­ ших чисел в этом случае.

Тогда, учитывая что число разбиений R k подвыборки

Х п для фиксированного

г равно Сгп,

получим при I

/0

К >

(1 - ц )\

 

 

Окончательно для ^ |0

и

S(c) = J

 

 

Р { Ps (*i,..., я2;)>26} >

 

^

К{хъ ..., x2l) X

 

lg, As

(sci......лг2г)

с

 

 

 

гг

> Т

 

х й Р ( Х 2г)>(і-т])*(і-р-(-і-, г)).

§ 5. ПРИМ ЕРЫ И ДОПОЛНИТЕЛЬНЫ Е КРИТЕРИИ

261

Поскольку, согласно лемме 2,

- 0'

 

lim Р {ps й ^

М

 

имеем

 

 

 

( а . ! , х21) >

26} > (1 — ц)2.

 

1—*оО

 

 

 

Ввиду произвольной малости ц

 

 

lim iD{ps (a;1,

x2,)>2ö} = 1.

 

*<х>

 

 

 

Теорема доказана.

§ 5. Примеры и дополнительные критерии

При выводе необходимых и достаточных условий по­ путно было установлено (§ 4), что если

# S(2Z)

,

 

21

~~ у’

 

ТО

 

1

Pt{sup I v' (А) — ѵ" (Л)| > 1} =

Aes

 

 

и соответственно

 

 

Р{вир|Р(Л) — V (4)j > 0 ,5 } =

1,

AsS

 

 

т. е. в этом случае максимальное отклонение частоты от вероятности остается большим даже при сколь угодно длинных выборках.

1. В примере 2 § 3 главы X было принято, что X — сегмент [0, 1], система S состоит из всех множеств, каж­ дое из которых является объединением конечного числа замкнутых сегментов с рациональными концами. Система

S счетна. Было установлено, что

А« (хи . . ., я,) = 2г,

если только выборка не содержит повторений.

При любом непрерывном распределении выборка с вероятностью 1 не содержит повторений. Поэтому

262 ГЛ. X I. НЕОБХОДИМ Ы Е И ДОСТАТОЧНЫЕ УСЛОВИЯ

и, следовательно, с вероятностью 1

sup IV (Ä) P (A) I > 0,5

A e s

(в действительности нетрудно убедиться, что в данном

случае почти наверное sup | ѵ (.4) —- Р (А) \ = 1). AeS

Таким образом, равномерной сходимости нет, несмот­ ря на то, что система S содержит лишь счетное число событий.

2. В примере 3 § 3 главы X рассматриваются «-мер­ ное пространство Е п и система событий вида

: (.X, ф) > 0}

цри всевозможных ф (ф=^0).

Нетрудно убедиться, что если точки хѵ . . ., х2і на«

ходятся в общем положении при 21 ^ п,

то

As (Xl , . .

., x2l) = 22г.

 

При любом непрерывном

распределении,

как известно,

с вероятностью 1 выборка удовлетворяет условию общ­ ности положения. Поэтому при 1< - т

Л І Ш - і 21 — А

и

sup IV (4) — Р (A) I ]> 0,5

Ae S

свероятностью 1. Таким образом, пока длина выборки меньше половины размерности пространства, максималь­ ное уклонение частоты от вероятности остается большим.

3.Установим еще один критерий, который позволяет судить о наличии равномерной сходимости в тех случаях, когда достаточные условия не выполняются.

Теорема 11.2. Пустъ в пространстве X заданы веро­ ятностная мера Р (х) и система событий S . Допустим,

что для всякого е 0 можно указать

системы А'1(е) и

S г(б), удовлетворяющие условию равномерной сходимости,

так что

для всякого множества

А S

найдутся мно­

жества В

S x и С ЕЕ S 2 такие,

что

 

В ^ А ^ С

§ 5. ПРИМЕРЫ И ДОПОЛНИТЕЛЬНЫЕ КРИТЕРИИ

263

и

I Р (А) - Р (В) I < 6, I Р (А) - Р (С) I < е.

Тогда для системы S также имеет место равномерная сходимость частот к вероятностям (по вероятности).

Д о к а з а т е л ь с т в о .

В самом деле, пусть

е >» О

и т] > 0 — произвольные числа. Выберем такое

10,

чтобы

выполнялось

 

 

 

 

 

 

 

 

 

 

р \

sup I v' (Л) — Р (Л) I >

-|Л < Т],

 

 

 

UeS,(e/4)

 

 

 

 

4 )

 

(11.25)

 

р {

sup ! ѵ Д Л ) - [ Р ( Л )|> - іЛ < п

 

 

 

 

 

lAeS2(£/4)

 

 

 

 

4 J

 

 

для всех

I >

l0.

 

 

 

 

 

 

 

 

Возьмем произвольное событие А ее S и найдем для

него события

£ g ^

и С е

5 2 такие,

что В ZD А э С и

\ Р ( А ) - Р ( В )

K - J - ,

\ Р ( А ) - Р ( С ) \ < ^ .

.

(11.26)

Тогда

 

V (В) > V (А) >

V (С).

 

(11.27)

 

 

 

Сопоставляя (11.25),

(11.26) и

(11.27), получаем, что

 

Р (sup IV1(А) Р (,4) I

 

е} <( 2г|.

 

 

 

 

A e s

 

 

 

 

 

 

 

 

Теорема доказана.

примера,

где применяется этот кри­

4.

Приведем два

терий.

X — счетное

множество,

на

котором задана

Пусть

вероятностная

мера

Р (х),

S — произвольная

система

подмножеств. Занумеруем каким-либо образом элементы X. Поскольку

2 р (*і) = 1-

г= 1

то по всякому е > 0 можно указать п такое, что

п}

2 Р ( х ;) > 1 - 6 ,

264 ГЛ. X I. НЕОБХОДИМ Ы Е И ДОСТАТОЧНЫЕ УСЛОВИЯ

Обозначим

конечное

множество ху , . . хп через

X (п).

В качестве системы

возьмем все подмножества X

(п), а

в качестве

S ±— все множества вида

 

Си ( Х / Х п),

где Q произвольное подмножество X (п).

При этом для каждого А ЕЕ S можно указать В g= S t и С S 2, удовлетворяющие условию теоремы, а именно:

С = А {] X (п),

В = {А О X (п)) U (X I X (п)).

Поскольку системы S x и <5>2 конечны, для них выпол­ няется равномерная сходимость, а следовательно, она имеет место и для системы S. Таким образом, если X — счет­ ное множество, то равномерная сходимость частот к вероятнос­ тям имеет место всегда. При этом^ система S может быть та­ кой, "что ms (I) == 21. В этом случае скорость сходимости мо­ жет быть сколь угодно низкой.

5. Рассмотрим еще один лю бопытный пример. Пусть X — двумерная плоскость, а систе­ ма S состоит из всех выпуклых замкнутых множеств на плос­ кости. В этом случае

ms (I) == 2'.

В самом деле, разместим I точек хъ . . ., х х на окружно­ сти (рис. 22). Рассмотрим любую подпоследовательность x t , . . . , хіг (на рисунке эти точки отмечены крестиками, а остальные — кружками). Вписанный замкнутый вы­ пуклый многогранник с вершинами в точках'жг , . . ., хіг, очевидно, содержит эти точки и не содержит никаких других из числа хг , . . . , x t. Значит, система S инду­ цирует на хг , . . . , хі любую подвыборку:

A s О н , • • •, я г) = 2 '

§ 5. ПРИМЕРЫ И ДОПОЛНИТЕЛЬНЫЕ КРИТЕРИЙ

265

и поэтому

ms (I) = 21.

Таким образом, в этом примере достаточные условия не выполнены.

Равномерная сходимость по классу событий S может выполняться или нет в зависимости от распределения. Например, если вероятностная мера сосредоточена на не­ которой окружности и равномерно распределена по ней, то с вероятностью 1

sup|v(4) — Р(Л )| =

 

1 ,

 

лея

 

 

 

как бы длинна ни была выборка.

 

все точки выборки

В самом деле, с вероятностью 1

 

хх , . . ., х г лягут на окружность. Натянем

на них вы­

пуклую оболочку. Она представляет

собой

вписанный

многогранник А с вершинами хх , .

.

. , x t. Этот много­

гранник содержит все точки хи . . .,

x t и пересекается с

окружностью на множестве меры нуль.

Если же вероятность равномерно распределена в не­ котором круге О, то равномерная сходимость имеет место. Действительно, в этом случае достаточно рассмотреть сис­ тему S *, состоящую из выпуклых замкнутых множеств, целиком вкладывающихся в круг О. Дело в том, что с вероятностью 1 все точки выборки лежат в круге. Поэ­ тому для произвольного А GE S и В = A f]0 оказывается

V {А) = V (В), Р (А) ~ Р (В).

В свою очередь В — А f] О будет замкнутым выпуклым множеством и вкладывается в круг О.

Таким образом, с вероятностью 1

sup IV (А) — Р (Л) I =

sup IV (4) — Р (А) I.

Аеs

Ass*

Далее, элементарным построением можно показать, что по заданному е > 0 для всякого выпуклого множества из S* можно найти вложенный в него и объемлющий его /с-сторонние многоугольники, так что их мера отличается не более чем на е, причем число к можно зафиксировать для данного е.

266 гл. XI. НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЙ

Следовательно, выполнены условия теоремы настоя­ щего параграфа, так как для систем S lf S 2, состоящих из выпуклых многоугольников с фиксированным числом сторон, равномерная сходимость установлена (пример 5 § 8 главы X).

Значит, равномерная сходимость имеет место при исследуемом распределении и для произвольных выпук­ лых множеств.

Отметим, что во всех рассмотренных ранее примерах непрерывное распределение было наиболее неблагоприят­ ным, а в данном случае ситуация обратная.

Г л а в а X II

О Ц Е Н К И Р А В Н О М Е Р Н О Г О О Т Н О С И Т Е Л Ь Н О Г О У К Л О Н Е Н И Я

Ч А С Т О Т О Т В Е Р О Я Т Н О С Т Е Й

ВК Л А С С Е С О Б Ы Т И Й

§1 . О равномерном относительном уклонении

Полученные в главе X оценки скорости равномерной сходимости в действительности оказываются завышенны­

ми.

Это связано

с тем, что пришлось пойти

на

завыше­

ние

оценок во

избежание чрезмерной громоздкости

самих оценок

и технических сложностей

при

их вы­

воде. Но в еще большей степени это вызано тем, что, желая получить общий результат, пришлось ориентиро­ ваться на наихудший случай (с точки зрения оценивае­ мой величины) по тем параметрам, которые не входят явно в оценку.

В частности, для того чтобы уложиться в заданное абсолютное уклонение частоты от вероятности для не­ которого события А, придется взять большую выборку,

если вероятность А близка к 1/2,

и меньшую при Р (А ),

близком к 0 или 1. В самом деле,

для Р (Л) = 0,5 и до­

пустимого уклонения в 1%

(т. е.

ѵ (Л) =

Р (Л)

±

0,01)

необходимо 104 показов,

тогда

как при

Р (Л)

=

0,01

и том же допустимом уклонении

достаточна длина вы­

борки ~ 100 -г- 200. Если же необходимо получить оцен­ ку сверху, не зависящую от Р (Л), то приходится ориен­ тироваться на наихудший случай, т. е. Р (Л) = 0,5.

В нашем доказательстве тоже фактически необходимо было ориентироваться на тот случай, когда вероятности Р (Л) всех событий близки к Ѵ2.

Вообще известно, что для фиксированного события Л отклонение частоты от вероятности имеет порядок е, если

268 ГЛ. XII. ОЦЕНКИ ОТНОСИТЕЛЬНОГО УКЛОНЕНИЯ

среднеквадратичное уклонение а частоты имеет порядок е. В свою очередь

° = y f V P { A ) { \ - P { A ) ) ,

т. е. при фиксированном I отклонение пропорционально

У Р 1 - Р) .

Поэтому естественно было бы и равномерное уклоне­ ние измерять в относительных единицах, т. е. потребо­ вать, чтобы

sup

у (А) Р (А)

- 0 .

А

У Р (А) (1 - Р (Л)) 7

Однако такого рода оценку при разумных предпо­ ложениях удается получить только для равномерного уклонения частот в двух последующих полувыборках, нормированного к эмпирической оценке величины

У Р (А) (1 — Р (Л)) по всей выборке. А именно, в следу­ ющем параграфе будет выведена оценка:

sup

|ѵ' б 4 )-ѵ ''(Л )|

> 8 <

иes

/ Н + А ) ( 1 — V( Л ) 21

гЧ

4ms (21) е 4

где ѵ' (А) и ѵ" (А) — частоты выпадения события А со­ ответственно на первой и второй полувыборках, а ѵ(А) =

ѵ' (А) -|- ѵ" (А)

А

.

на полной вы­

= — ■■9----—----частота выпадени і

 

борке.

При этом достигается определенное «равноправие» со­ бытий класса S. Что же касается равномерного относи­ тельного уклонения частот от вероятностей, то здесь удается получить одностороннюю оценку:

£*/

(1 2 . 1 )

Нормирующий делитель У 1J (А) при малых Р (А) близок к величине У Р (А) (1 — Р (А)).

Соседние файлы в папке книги из ГПНТБ