книги из ГПНТБ / Вапник В.Н. Теория распознавания образов. Статистические проблемы обучения
.pdf§ 4. ДОКАЗАТЕЛЬСТВО НЕОБХОДИМОСТИ |
259 |
Положим теперь0 |
8 |
и рассмотрим величину К', |
|||
отличающуюся от |
правой |
части |
(11.19) |
лишь иными |
|
пределами суммирования, |
|
|
|
||
Г, |
р Т р І - Г |
. |
p t p l - r - t |
|
|
|
|
1 V |
°P(kVv 2l-n-p(k) |
||
Л |
Z j |
p l |
p r Z j |
p l - r |
' |
|
r |
к |
|
l-n |
|
где г и t пробегают значения, удовлетворяющие следую щим неравенствам:
|
п |
< еп , |
(11.21) |
|
|
г — ~2 |
|||
t |
р(к) ( 1 - г ) |
<^81. |
(11.22) |
|
21- |
|
|||
|
|
|
|
|
При r u t , удовлетворяющих (11.21) и (11.22), автомати чески выполняется (11.20). Действительно, при этом
r | 2 l - f . |
і Г л |
. |
2р |
[j |
п |
\ |
|
|
----- 1— |
|
+ |
|
|
|
|
»)] |
|
|
- 2 d - P\ > - r [ i r - B(n + 2l+wz: |
|
||||||
Поскольку было принято, что] ql<C.n<^l, 6 = |
, е |
, |
||||||
то
Так как область суммирования в выражении для К ' вкла дывается в область суммирования (11.19), то
|
К > К '. |
|
Далее, для всякого г] > 0 найдется |
10, зависящее |
|
только от ц и д, такое, что для всех Z> |
10 |
|
2 |
С;' т :П> 1 - П |
(11.23) |
г |
°21 |
|
(суммирование ведется по г, удовлетворяющим (11.21)) и
2 |
Ctp(S Lp > 1 - 4 |
(11.24) |
t |
° 2 l - n |
|
(суммирование ведется по t, удовлетворяющим (11.22)).
9*
260 гл . XI. НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЯ
Действительно,
Сп-С21t--гП
сггI
есть вероятность вынуть г черных шаров из урны, содер жащей п черных и 21 — п белых шаров, когда вынимается случайно I шаров без возвращения. При этом математи ческое ожидание числа черных шаров в выборке равно nt2 и правая часть формулы (11.23) выражает вероят ность того, что число черных шаров в выборке отклонит ся от математического ожидания более чем на гп. Пос кольку для схемы без возвращения справедлив закон больших чисел, формула (11.23) верна, начиная с дос таточно больших I.
Аналогично
есть вероятность вынуть t черных шаров из урны, содер жащей р черных и 21 — п — р белых шаров, когда вынимается шаров, опять-таки без возвращения. Математическое ожидание черных шаров в выборке равно
гР ( і - г ) l 2I — п — р
и, следовательно, формула (11.24) выражает закон боль ших чисел в этом случае.
Тогда, учитывая что число разбиений R k подвыборки
Х п для фиксированного |
г равно Сгп, |
получим при I |
/0 |
|
К > |
(1 - ц )\ |
|
|
|
Окончательно для ^ |0 |
и |
S(c) = J |
|
|
Р { Ps (*i,..., я2;)>26} > |
|
^ |
К{хъ ..., x2l) X |
|
lg, As |
(sci......лг2г) |
с |
|
|
|
|
гг |
> Т |
|
х й Р ( Х 2г)>(і-т])*(і-р-(-і-, г)).
§ 5. ПРИМ ЕРЫ И ДОПОЛНИТЕЛЬНЫ Е КРИТЕРИИ |
261 |
||
Поскольку, согласно лемме 2, |
- 0' |
|
|
lim Р {ps й ^ |
М |
|
|
имеем |
|
|
|
( а . ! , х21) > |
26} > (1 — ц)2. |
|
|
1—*оО |
|
|
|
Ввиду произвольной малости ц |
|
|
|
lim iD{ps (a;1, |
x2,)>2ö} = 1. |
|
|
*<х> |
|
|
|
Теорема доказана.
§ 5. Примеры и дополнительные критерии
При выводе необходимых и достаточных условий по путно было установлено (§ 4), что если
# S(2Z) |
, |
|
21 |
~~ у’ |
|
ТО |
|
1 |
Pt{sup I v' (А) — ѵ" (Л)| > 1} = |
||
Aes |
|
|
и соответственно |
|
|
Р{вир|Р(Л) — V (4)j > 0 ,5 } = |
1, |
|
AsS |
|
|
т. е. в этом случае максимальное отклонение частоты от вероятности остается большим даже при сколь угодно длинных выборках.
1. В примере 2 § 3 главы X было принято, что X — сегмент [0, 1], система S состоит из всех множеств, каж дое из которых является объединением конечного числа замкнутых сегментов с рациональными концами. Система
S счетна. Было установлено, что
А« (хи . . ., я,) = 2г,
если только выборка не содержит повторений.
При любом непрерывном распределении выборка с вероятностью 1 не содержит повторений. Поэтому
262 ГЛ. X I. НЕОБХОДИМ Ы Е И ДОСТАТОЧНЫЕ УСЛОВИЯ
и, следовательно, с вероятностью 1
sup IV (Ä) — P (A) I > 0,5
A e s
(в действительности нетрудно убедиться, что в данном
случае почти наверное sup | ѵ (.4) —- Р (А) \ = 1). AeS
Таким образом, равномерной сходимости нет, несмот ря на то, что система S содержит лишь счетное число событий.
2. В примере 3 § 3 главы X рассматриваются «-мер ное пространство Е п и система событий вида
{х : (.X, ф) > 0}
цри всевозможных ф (ф=^0).
Нетрудно убедиться, что если точки хѵ . . ., х2і на«
ходятся в общем положении при 21 ^ п, |
то |
|
As (Xl , . . |
., x2l) = 22г. |
|
При любом непрерывном |
распределении, |
как известно, |
с вероятностью 1 выборка удовлетворяет условию общ ности положения. Поэтому при 1< - т
Л І Ш - і 21 — А
и
sup IV (4) — Р (A) I ]> 0,5
Ae S
свероятностью 1. Таким образом, пока длина выборки меньше половины размерности пространства, максималь ное уклонение частоты от вероятности остается большим.
3.Установим еще один критерий, который позволяет судить о наличии равномерной сходимости в тех случаях, когда достаточные условия не выполняются.
Теорема 11.2. Пустъ в пространстве X заданы веро ятностная мера Р (х) и система событий S . Допустим,
что для всякого е 0 можно указать |
системы А'1(е) и |
||
S г(б), удовлетворяющие условию равномерной сходимости, |
|||
так что |
для всякого множества |
А 6Е S |
найдутся мно |
жества В |
S x и С ЕЕ S 2 такие, |
что |
|
В ^ А ^ С
§ 5. ПРИМЕРЫ И ДОПОЛНИТЕЛЬНЫЕ КРИТЕРИИ |
263 |
и
I Р (А) - Р (В) I < 6, I Р (А) - Р (С) I < е.
Тогда для системы S также имеет место равномерная сходимость частот к вероятностям (по вероятности).
Д о к а з а т е л ь с т в о . |
В самом деле, пусть |
е >» О |
||||||||
и т] > 0 — произвольные числа. Выберем такое |
10, |
чтобы |
||||||||
выполнялось |
|
|
|
|
|
|
|
|
|
|
|
р \ |
sup I v' (Л) — Р (Л) I > |
-|Л < Т], |
|
|
|||||
|
UeS,(e/4) |
|
|
|
|
4 ) |
|
(11.25) |
||
|
р { |
sup ! ѵ Д Л ) - [ Р ( Л )|> - іЛ < п |
|
|||||||
|
|
|
||||||||
|
lAeS2(£/4) |
|
|
|
|
4 J |
|
|
||
для всех |
I > |
l0. |
|
|
|
|
|
|
|
|
Возьмем произвольное событие А ее S и найдем для |
||||||||||
него события |
£ g ^ |
и С е |
5 2 такие, |
что В ZD А э С и |
||||||
\ Р ( А ) - Р ( В ) |
K - J - , |
\ Р ( А ) - Р ( С ) \ < ^ . |
. |
(11.26) |
||||||
Тогда |
|
V (В) > V (А) > |
V (С). |
|
(11.27) |
|||||
|
|
|
||||||||
Сопоставляя (11.25), |
(11.26) и |
(11.27), получаем, что |
||||||||
|
Р (sup IV1(А) — Р (,4) I |
|
е} <( 2г|. |
|
|
|||||
|
|
A e s |
|
|
|
|
|
|
|
|
Теорема доказана. |
примера, |
где применяется этот кри |
||||||||
4. |
Приведем два |
|||||||||
терий. |
X — счетное |
множество, |
на |
котором задана |
||||||
Пусть |
||||||||||
вероятностная |
мера |
Р (х), |
S — произвольная |
система |
||||||
подмножеств. Занумеруем каким-либо образом элементы X. Поскольку
2 р (*і) = 1-
г= 1
то по всякому е > 0 можно указать п такое, что
п}
2 Р ( х ;) > 1 - 6 ,
264 ГЛ. X I. НЕОБХОДИМ Ы Е И ДОСТАТОЧНЫЕ УСЛОВИЯ
Обозначим |
конечное |
множество ху , . . хп через |
X (п). |
В качестве системы |
возьмем все подмножества X |
(п), а |
|
в качестве |
S ±— все множества вида |
|
|
Си ( Х / Х п),
где Q произвольное подмножество X (п).
При этом для каждого А ЕЕ S можно указать В g= S t и С S 2, удовлетворяющие условию теоремы, а именно:
С = А {] X (п),
В = {А О X (п)) U (X I X (п)).
Поскольку системы S x и <5>2 конечны, для них выпол няется равномерная сходимость, а следовательно, она имеет место и для системы S. Таким образом, если X — счет ное множество, то равномерная сходимость частот к вероятнос тям имеет место всегда. При этом^ система S может быть та кой, "что ms (I) == 21. В этом случае скорость сходимости мо жет быть сколь угодно низкой.
5. Рассмотрим еще один лю бопытный пример. Пусть X — двумерная плоскость, а систе ма S состоит из всех выпуклых замкнутых множеств на плос кости. В этом случае
ms (I) == 2'.
В самом деле, разместим I точек хъ . . ., х х на окружно сти (рис. 22). Рассмотрим любую подпоследовательность x t , . . . , хіг (на рисунке эти точки отмечены крестиками, а остальные — кружками). Вписанный замкнутый вы пуклый многогранник с вершинами в точках'жг , . . ., хіг, очевидно, содержит эти точки и не содержит никаких других из числа хг , . . . , x t. Значит, система S инду цирует на хг , . . . , хі любую подвыборку:
A s О н , • • •, я г) = 2 '
§ 5. ПРИМЕРЫ И ДОПОЛНИТЕЛЬНЫЕ КРИТЕРИЙ |
265 |
и поэтому
ms (I) = 21.
Таким образом, в этом примере достаточные условия не выполнены.
Равномерная сходимость по классу событий S может выполняться или нет в зависимости от распределения. Например, если вероятностная мера сосредоточена на не которой окружности и равномерно распределена по ней, то с вероятностью 1
sup|v(4) — Р(Л )| = |
|
1 , |
|
лея |
|
|
|
как бы длинна ни была выборка. |
|
все точки выборки |
|
В самом деле, с вероятностью 1 |
|
||
хх , . . ., х г лягут на окружность. Натянем |
на них вы |
||
пуклую оболочку. Она представляет |
собой |
вписанный |
|
многогранник А с вершинами хх , . |
. |
. , x t. Этот много |
|
гранник содержит все точки хи . . ., |
x t и пересекается с |
||
окружностью на множестве меры нуль.
Если же вероятность равномерно распределена в не котором круге О, то равномерная сходимость имеет место. Действительно, в этом случае достаточно рассмотреть сис тему S *, состоящую из выпуклых замкнутых множеств, целиком вкладывающихся в круг О. Дело в том, что с вероятностью 1 все точки выборки лежат в круге. Поэ тому для произвольного А GE S и В = A f]0 оказывается
V {А) = V (В), Р (А) ~ Р (В).
В свою очередь В — А f] О будет замкнутым выпуклым множеством и вкладывается в круг О.
Таким образом, с вероятностью 1
sup IV (А) — Р (Л) I = |
sup IV (4) — Р (А) I. |
Аеs |
Ass* |
Далее, элементарным построением можно показать, что по заданному е > 0 для всякого выпуклого множества из S* можно найти вложенный в него и объемлющий его /с-сторонние многоугольники, так что их мера отличается не более чем на е, причем число к можно зафиксировать для данного е.
266 гл. XI. НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЙ
Следовательно, выполнены условия теоремы настоя щего параграфа, так как для систем S lf S 2, состоящих из выпуклых многоугольников с фиксированным числом сторон, равномерная сходимость установлена (пример 5 § 8 главы X).
Значит, равномерная сходимость имеет место при исследуемом распределении и для произвольных выпук лых множеств.
Отметим, что во всех рассмотренных ранее примерах непрерывное распределение было наиболее неблагоприят ным, а в данном случае ситуация обратная.
Г л а в а X II
О Ц Е Н К И Р А В Н О М Е Р Н О Г О О Т Н О С И Т Е Л Ь Н О Г О У К Л О Н Е Н И Я
Ч А С Т О Т О Т В Е Р О Я Т Н О С Т Е Й
ВК Л А С С Е С О Б Ы Т И Й
§1 . О равномерном относительном уклонении
Полученные в главе X оценки скорости равномерной сходимости в действительности оказываются завышенны
ми. |
Это связано |
с тем, что пришлось пойти |
на |
завыше |
ние |
оценок во |
избежание чрезмерной громоздкости |
||
самих оценок |
и технических сложностей |
при |
их вы |
|
воде. Но в еще большей степени это вызано тем, что, желая получить общий результат, пришлось ориентиро ваться на наихудший случай (с точки зрения оценивае мой величины) по тем параметрам, которые не входят явно в оценку.
В частности, для того чтобы уложиться в заданное абсолютное уклонение частоты от вероятности для не которого события А, придется взять большую выборку,
если вероятность А близка к 1/2, |
и меньшую при Р (А ), |
||||
близком к 0 или 1. В самом деле, |
для Р (Л) = 0,5 и до |
||||
пустимого уклонения в 1% |
(т. е. |
ѵ (Л) = |
Р (Л) |
± |
0,01) |
необходимо 104 показов, |
тогда |
как при |
Р (Л) |
= |
0,01 |
и том же допустимом уклонении |
достаточна длина вы |
||||
борки ~ 100 -г- 200. Если же необходимо получить оцен ку сверху, не зависящую от Р (Л), то приходится ориен тироваться на наихудший случай, т. е. Р (Л) = 0,5.
В нашем доказательстве тоже фактически необходимо было ориентироваться на тот случай, когда вероятности Р (Л) всех событий близки к Ѵ2.
Вообще известно, что для фиксированного события Л отклонение частоты от вероятности имеет порядок е, если
268 ГЛ. XII. ОЦЕНКИ ОТНОСИТЕЛЬНОГО УКЛОНЕНИЯ
среднеквадратичное уклонение а частоты имеет порядок е. В свою очередь
° = y f V P { A ) { \ - P { A ) ) ,
т. е. при фиксированном I отклонение пропорционально
У Р 1 - Р) .
Поэтому естественно было бы и равномерное уклоне ние измерять в относительных единицах, т. е. потребо вать, чтобы
sup |
у (А) — Р (А) |
- 0 . |
|
А |
У Р (А) (1 - Р (Л)) 7 |
Однако такого рода оценку при разумных предпо ложениях удается получить только для равномерного уклонения частот в двух последующих полувыборках, нормированного к эмпирической оценке величины
У Р (А) (1 — Р (Л)) по всей выборке. А именно, в следу ющем параграфе будет выведена оценка:
sup |
|ѵ' б 4 )-ѵ ''(Л )| |
> 8 < |
|
иes |
/ Н + А ) ( 1 — V( Л ) ■ 21 |
гЧ
4ms (21) е 4
где ѵ' (А) и ѵ" (А) — частоты выпадения события А со ответственно на первой и второй полувыборках, а ѵ(А) =
ѵ' (А) -|- ѵ" (А) |
А |
. |
на полной вы |
= — ■■9----—----частота выпадени і |
|
борке.
При этом достигается определенное «равноправие» со бытий класса S. Что же касается равномерного относи тельного уклонения частот от вероятностей, то здесь удается получить одностороннюю оценку:
£*/
(1 2 . 1 )
Нормирующий делитель У 1J (А) при малых Р (А) близок к величине У Р (А) (1 — Р (А)).
