Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

tjurin_teorija_verojatn_978-5-94057-540-5_1

.pdf
Скачиваний:
1858
Добавлен:
02.06.2015
Размер:
4.26 Mб
Скачать

§ 1. Закон больших чисел

211

 

 

беремся в том, как надо понимать символ сходимости (стрелку) в формуле nS p.

1.3.Вероятностный предел

Втеории вероятностей и математической статистике предельные переходы и соответствующие обозначения используются так же широко, как и в математическом анализе. Однако понятие предела толкуется здесь, как правило, в своем особом смысле, отличном от того, который вкладывается в него в математическом анализе.

Действительно, вспомним принятое в математическом анализе

определение предела последовательности. Мы говорим, что an a при n →∞, если для любого ǫ > 0 найдется такое N, что при n > N

будет выполняться неравенство |an a|. Для теоремы Бернулли это значило бы, что для достаточно больших n действует соотношение

nS

p

< ǫ.

 

 

 

К сожалению, это утверждение неверно. Хотя и с малой вероятностью, но значения p и S/n могут отличаться значительно. Например, с положительной вероятностью S может быть равно 0. (Событие S =0 означает, что все n испытаний окончились неудачами. Вероятность этого события (1 − p)n мала для больших n, но не равна 0.)

Поэтому нельзя рассчитывать на непременное выполнение соотноше-

ния nS

p < ǫ, и для случайных последовательностей используется

 

 

 

 

 

 

другое

понятие

предела: для любого ǫ>0 имеет место сходимость

 

 

P nS

p

< ǫ → 1

 

 

 

 

 

 

при n →∞. Чтобы отличать это понятие

предела от того, которое ис-

пользуется в математическом анализе, говорят: «последовательность случайных величин сходится по вероятности».

Итак, событие

 

 

< ǫ

не является достоверным, но теорема

nS

p

 

 

 

 

 

Бернулли утверждает, что оно практически достоверно при достаточно больших n.

Подведем итог сказанному выше в точной математической форме.

Теорема Бернулли. Пусть S — число успехов в n испытаниях Бернулли (число n не случайное; оно не зависит от результатов испытаний). Пусть p >0 — вероятность успеха в одном испытании. Тогда

212

Глава 4. Предельные законы теории вероятностей

 

для любых ǫ>0 имеет место сходимость

 

P nS

p

< ǫ → 1

 

 

 

 

 

 

 

 

при достаточно больших n.

Тот же результат можно высказать короче и выразительнее:

Sn p при n → ∞ по вероятности.

Для доказательства теоремы Бернулли нам понадобятся еще некоторые вспомогательные утверждения. А пока сделаем важное для практики замечание.

1.4. Замечание о связи частоты и вероятности

Для многих практических задач одного лишь приближенного равенства

n( A)

n P( A)

может оказаться недостаточно. Важен вопрос о точности этого приближенного равенства. Возникает и вопрос о числе опытов n, необходимых для достижения заранее заданной точности. Ответы на эти вопросы даются в математической статистике, где общенаучное понятие о точности приближения реализуется посредством доверительных интервалов, или доверительного оценивания.

Эти темы выходят за рамки курса теории вероятностей. Поэтому здесь мы приведем и поясним лишь несколько наглядных примеров без математического вывода обсуждаемых результатов.

Пример 1. Рассмотрим случайный эксперимент, в котором некоторая монета подбрасывается n =100 раз. Зафиксируем число орлов S, наблюдаемых в таком эксперименте. Если мы предполагаем, что монета правильная, т. е. вероятность выпадения орла p =1/2, то с ве-

роятностью 0,95 (ее обычно называют уровнем доверия) величина nS отклонится от p не более чем на 0,1. Это, в частности, означает, что ес-

ли по результатам такого эксперимента величина nS примет значение 0,41 или 0,59, то на принятом уровне доверия 0,95 их нельзя считать противоречащими предположению о том, что монета правиль-

ная. А скажем, результат Sn =0,30 с высокой вероятностью позволит утверждать, что вероятность выпадения герба на этой монете меньше

0,5. Из этого примера видно, что точность приближения nS к p при таком значении n невелика, порядка 0,1. Если мы захотим повысить

§ 1. Закон больших чисел

213

 

 

уровень доверия к своему выводу до 99%, то увидим, что величина

возможного отклонения nS от p =0,5 увеличится и может достигать уже не 0,1, а 0,13.

Пример 2. Заменим в предыдущем примере монету игральной костью. Вместо выпадения орла нас теперь будет интересовать выпадение шестерки. Если игральная кость правильная, то эта вероятность p =1/6. Как сильно могут отклониться показания эксперимента от этой величины? С вероятностью примерно 0,95 величина

Sn отклоняется от p не более чем на 0,073. Видно, что величина отклонения в этом случае несколько меньше, чем в предыдущем примере. Можно ли считать такую точность достаточной? Для этого посмотрим на относительную погрешность приближения, т. е. на отношение величины возможного отклонения к измеряемой вероятности p = 1/6 ≈ 0,167, выраженное в процентах. Относительная погрешность (с вероятностью 0,95) этого эксперимента составляет:

0,073

0,167 ·100% = 43,7%,

что совсем не мало. Заметим, что возможная относительная погрешность в предыдущем примере с вероятностью 0,95 не превышает 20%.

Пример 3. Рассмотрим случайный эксперимент, в котором некоторая монета подбрасывается n =1000 раз. Опять зафиксируем число орлов S, наблюдаемых в таком эксперименте. Можно утверждать,

что с вероятностью 0,95 величина Sn отклонится от p =1/2 не более чем 0,031. Сравним этот результат с аналогичным в примере 1. Величина возможного отклонения сократилась более чем в три раза.

В таком эксперименте наблюдаемое значение Sn =0,41 уже позволяет явно усомниться в том, что монета правильная, так как 0,41 отклоняется от p =0,5 существенно больше, чем на 0,031. Относительная погрешность такого эксперимента в 95% случаях лежит в пределах

6,2%.

Итак, задав вопрос об измерении вероятностей, мы столкнулись с неприятной неожиданностью — это измерение оказалось, вопервых, непростым с чисто физической точки зрения (многократное повторение опыта), а во-вторых, сопряженным с новыми и довольно сложными понятиями.

Особо надо подчеркнуть, что описанные выше опыты должны происходить независимо друг от друга в неизменных условиях, чтобы вероятность события сохранялась постоянной. При большом числе повторений опытов соблюсти это требование зачастую оказывается

214

Глава 4. Предельные законы теории вероятностей

 

 

нелегко. Даже небольшие отклонения от статистической устойчивости могут оказать воздействие на результаты, особенно при высоких требованиях к точности выводов, не говоря уже о том, что повторения опытов, да еще многократные, далеко не всегда возможны.

Поэтому вероятности некоторых важных случайных событий известны нам лишь приближенно. Например, вероятность рождения мальчика считается равной приблизительно 0,51. В третьем знаке после запятой уверенности уже нет. В литературе можно встретить разные значения: от 0,512 до 0,515. Среди специалистов нет даже уверенности в том, что эта вероятность не изменяется в зависимости от социальных или иных условий.

1.5. Неравенство Чебышёва

Для доказательства теоремы Бернулли и ее обобщений нам потребуется неравенство Чебышёва. Мы приведем его сначала в более общей и, одновременно, более простой для доказательства формулировке. Сам П. Л. Чебышёв доказал частный, но более важный для практики случай этого общего утверждения, который также часто именуют неравенством Чебышёва.

Неравенство Чебышёва (общая формулировка). Пусть Y — неотрицательная случайная величина, причем ее математическое ожидание EY существует. Тогда для любого ǫ >0 выполняется неравен-

ство

P(Y ¾ǫ) ¶ EYǫ .

Доказательство. Проведем доказательство этого неравенства сначала для случайной величины, имеющей плотность вероятности f ( x):

ZZ

P(Y ¾ǫ) = f ( x) dx ǫx f ( x) dx

ǫǫ

1ǫ

Zxf ( x) dx +Zǫ xf ( x) dx = EYǫ ,

 

ǫ

0

что и требовалось. Мы воспользовались, во-первых, тем, что при x ¾ǫ величина ǫx ¾1 и, следовательно f ( x) ¶ ǫx f ( x), а во-вторых, тем, что интеграл от неотрицательной функции xf ( x) неотрицателен:

Zǫ

xf ( x) dx ¾0.

0

§ 1. Закон больших чисел

215

 

 

Для дискретной случайной величины доказательство практически повторяется:

P(Y ¾ǫ) = XP(Y = x) ¶Xǫx P(Y = x) ¶ 1ǫ XxP(Y = x) = 1ǫ EY .

x¾ǫ x¾ǫ x¾0

Как следствие этого общего результата нетрудно получить утверждение, сформулированное и доказанное Чебышёвым.

Неравенство Чебышёва. Пусть X — такая случайная величина, что ее дисперсия DX существует. Тогда для любого ǫ>0 выполнялось неравенство

P(|X EX| ¾ǫ) ¶ ǫ12 DX.

Доказательство. События {|X EXǫ} и {( X EX)2 ¾ǫ2} включают одни и те же элементарные исходы. Поэтому

P(|X EX| ¾ǫ) = P(( X EX)2 ¾ǫ2 ).

Применим неравенство Чебышёва к неотрицательной случайной величине Y =( X EX)2 . (Заметим, что EY существует, так как это не что иное, как дисперсия случайной величины X, т. е. DX.) Получим, что

P(|X EX| ¾ǫ) = P(( X EX)2 ¾ǫ2) ¶ ǫ12 E( X EX)2 = ǫ12 DX,

что и требовалось доказать.

Есть много других неравенств, использующих ту же, что и выше, идею Чебышёва в различных специальных обстоятельствах. Они носят другие имена.

Упражнения

1.Пусть случайная величина X равна числу гербов при ста бросаниях монеты, т. е. она имеет имеющая биномиальное распределение вероятностей с параметрами n =100 и p =0,5. С помощью неравенства Чебышёва оцените:

а) P(|X EX|¾10); б) P(|X EX|¾20); в) P(|X EX|¾30).

2.Пусть случайная величина X имеет биномиальное распределение вероятностей с параметрами n =100 и p =0,2. С помощью неравенства Чебышёва оцените:

а) P(|X EX|¾5); б) P(|X EX|¾10); в) P(|X EX|¾15).

216

Глава 4. Предельные законы теории вероятностей

 

 

Полученные оценки дают некоторое грубое представление о вероятностях «больших отклонений» числа успехов в серии испытаний Бернулли от ожидаемого среднего значения. (Сравните результаты

п.a) упражнения 1 с результатами примера 1.)

3.Для случайной величины X, имеющей стандартное нормальное распределение X N(0, 1), вычислите по таблице P(|X|¾0,1) и сравните эту вероятность с той оценкой, которую дает неравенство Чебышёва.

4.Для случайной величины X, распределенной равномерно на отрезке [0, 1], вычислите P(|X EXǫ для ǫ =0,05 и сравните эту вероятность с оценкой, которую для этой вероятности дает неравенство Чебышёва.

Обратите внимание на то, что в заданиях 3 и 4 различие между вычисленными вероятностями и их оценками велико. Неравенство Чебышёва и следствие из него дают не значение вероятности, хотя бы приближенное, но лишь его оценку сверху.

1.6. Доказательство теоремы Бернулли

Применим неравенство Чебышёва к случайной величине X = Sn . Мы знаем (см. § 1 гл. 3), что

ES = np, DS = np(1 −p).

Согласно свойствам математического ожидания и дисперсии получаем

E S

= p,

D S

=

p(1 p)

.

 

n

 

n

 

n

Применительно к случайной величине X = nS как следствие из неравенства Чебышёва получаем

 

 

 

 

 

1

 

p(1 p)

 

 

 

 

 

 

P

nS

p

¾ǫ

ǫ2

·

n

.

 

S

 

¾

 

 

 

 

 

 

 

 

 

 

 

 

При n

правая часть, т. е. оценка сверху для P

n

p

 

ǫ , при

 

 

 

 

 

 

 

 

 

 

 

 

 

 

всяком (фиксированном) ǫ>0 стремится к нулю. Следовательно, и сама вероятность, будучи неотрицательной, тоже стремится к нулю, когда n неограниченно увеличивается, что и требовалось доказать.

1.7. Закон больших чисел

Теорему Бернулли можно считать частным случаем гораздо более общей закономерности, называемой законом больших чисел.

§ 1. Закон больших чисел

217

 

 

Вспомним, что, когда мы вычисляли математическое ожидание ES и дисперсию DS числа успехов S в серии из n испытаний Бернулли, мы представляли S в виде суммы независимых случайных величин:

S = x1 +x2 +… +xn,

где xi =1, если испытание номер i оканчивалось успехом; xi =0, если это испытание оканчивалось неудачей. При этом случайные величины x1, …, xn независимы, так как каждая относится к одному испытанию, независимому от прочих.

По аналогии с S рассмотрим сумму независимых случайных величин X1, …, Xn, распределенных одинаково, но произвольно. Впрочем, не совсем произвольно: потребуем, чтобы у случайной величины X1 существовал второй момент EX12 . Можно показать, что тогда у случайной величины X1 существуют и математическое ожидание EX1, и дисперсия DX1 . Для краткости записей общее для всех случайных величин Xi математическое ожидание обозначим a =EXi, общую для всех этих величин дисперсию обозначим σ2 = DXi. Наконец, рассмотрим

(по аналогии с Sn ) среднее арифметическое величин X1 , …, Xn: случайную величину

¯X¯ = 1n ( X1 + X2 +… + Xn).

Такое обозначение среднего арифметического широко принято в статистике.

Сформулируем закон больших чисел в одной из форм теоремы Чебышёва.

Неравенство Чебышёва. Пусть X1, , Xn суть независимые одинаково распределенные случайные величины, дисперсия которых существует. Пусть a =EXi — их (общее) математическое ожидание. Тогда

¯X a при n → ∞ по вероятности.

Доказательство этой теоремы тоже проводится с применением неравенства Чебышёва и по сути не отличается от приведенного выше доказательства теоремы Бернулли.

Доказательство. Применим неравенство Чебышёва к случайной величине ¯X¯ . В силу свойств математического ожидания и дисперсии находим, что

¯¯

¯¯

σ2

E X = a,

D X =

n .

Пусть ǫ>0 — произвольное число. С помощью неравенства Чебышёва находим, что

¯¯

 

σ2

 

P(|X

a| ¾ǫ) ¶ nǫ2 .

218

Глава 4. Предельные законы теории вероятностей

 

 

При n →∞ правая часть этого неравенства стремится к нулю. Поэтому и его левая часть, будучи неотрицательной, тоже стремится к нулю:

P(|¯X¯ a| ¾ǫ) → 0

при n →∞ для любого фиксированного ǫ>0. Теорема доказана.

1.8. Правило усреднения

Теорема Чебышёва дает основание известному правилу среднего арифметического, постоянно употребляющемуся в теории и практике измерений. Предположим, что производится измерение некоторой неизвестной величины a. Повторив измерения n раз в одинаковых условиях, наблюдатель получает не вполне совпадающие результаты x1, x2, …, xn. В качестве приближенного значения a принято брать

a x1 +x2 ++xn . n

Если измерения независимы и лишены систематической ошибки (т. е. Exi =a), то согласно этой теореме при достаточно больших n с вероятностью, близкой к 1, мы получаем значение, близкое к a.

Предположение об отсутствии систематической ошибки очень важно. Усреднение позволяет уменьшить только случайную ошибку. Систематические ошибки за счет повторения измерений и усреднения ни устранить, ни даже уменьшить нельзя.

Отсутствие в измерениях систематической ошибки — это идеальная ситуация. Реально предположение об отсутствии систематической ошибки означает, что эта ошибка мала по сравнению со случайной составляющей ошибки и что основную роль играют именно случайные ошибки. В таком случае усреднение улучшает результат: случайная ошибка уменьшается.

Исторический пример. Мореплаватели только сравнительно недавно получили возможность определять координаты своего корабля вдали от берегов. Если широту корабля несложно установить с помощью астрономических наблюдений, то для определения долготы, т. е. угла поворота земного шара, при котором совмещаются местный меридиан и Гринвичский, надо точно знать гринвичское время. Следовательно, до появления радио было необходимо иметь на корабле часы, точно идущие по гринвичскому времени.

Однако до XIX в. существовавшие часы не обеспечивали необходимой для измерения долготы точности. Лишь в XIX в. были сконструированы особые корабельные часы — хронометр. Само их название timekeeper (англ.) подчеркивало их назначение — «хранить гринвичское время».

И когда в 1831 г. в кругосветное плавание для составления карт отправлялся корабль «Бигль» (эта экспедиция сейчас широко известна благодаря участию в ней молодого тогда Ч. Дарвина), капитан этого корабля, человек просвещенный и ученый, взял

§ 1. Закон больших чисел

219

 

 

с собой 24(!) хронометра. Гринвичское время капитан определял усреднением показателей всех хронометров. Обозначим показание i-го хронометра через xi, i =1, …, n, — это измерение, независимое от других хронометров. Подразумевается, что конструкция хронометра такова, что в работе этого прибора отсутствует систематическая ошибка. Это значит, что одни экземпляры хронометров могут «уходить», другие «отставать», но эти ошибки случайные, связанные с изготовлением данного образца. Математически это условие формулируется так: Exi = a, где a — истинное время в момент его измерения, xi — показание хронометра i, i =1, …, n. Качество конструкции и технологии изготовления хронометров характеризуется тем, насколько однородна по точности хода вся продукция в целом. Математически это выражается разбросом показаний отдельных приборов, т. е. дисперсией случайных величин xi. При доказательстве закона больших чисел мы выяснили, что D¯x в n раз меньше Dxi. Поэтому «среднее время» ¯x¯ ближе к истинному, чем можно того ожидать от отдельного показания хронометра.

1.9. Закон больших чисел. Продолжение

Строго говоря, сам Чебышёв опубликовал формально более общую теорему.

Неравенство Чебышёва. Пусть X1, , Xn — последовательность попарно независимых случайных величин, имеющих конечные дисперсии, ограниченные некоторой постоянной:

 

 

 

DX1 C,

DX2 C,

, DXn C.

Тогда для любого ǫ>0

X

 

 

 

 

 

 

X

 

 

 

 

 

 

 

1

n

1

n

 

 

 

 

P

 

 

 

i=1

Xi n

i=1

EXi

 

< ǫ

→ 1 при n → ∞.

 

n

 

 

 

 

 

 

 

 

 

 

 

 

Доказательство. Пользуясь свойствами математического ожидания и дисперсии, находим, что

 

 

 

X

 

 

X

 

 

X

 

 

 

X

 

 

 

n

 

 

n

 

 

 

n

 

 

 

 

n

En1 i=1 Xi

= n1 i=1 EXi, Dn1 i=1 Xi=

1

i=1 DXi.

n2

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

По условиям теоремы iP=1 DXi nC, так что

 

 

 

 

 

 

 

 

 

 

 

 

Dn1

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1 Xi

Cn .

 

 

 

 

 

Применяя к случайной величине 1

n

 

 

 

 

 

 

находим, что

 

X

 

 

X

 

n iP=1

Xi

неравенство Чебышёва,

 

 

 

 

 

 

 

 

X

 

 

1

n

 

1

n

 

1

 

 

1

n

 

C

P

 

 

 

Xi n i=1 EXi

 

¾ǫ ǫ2 D

n i=1 Xi

ǫ2 n .

n i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

220

Глава 4. Предельные законы теории вероятностей

 

 

При n →∞ правая часть приведенного выражения стремится к 0, что и доказывает утверждение теоремы.

Из этой теоремы следует, что среднее арифметическое большого числа независимых случайных слагаемых ведет себя практически как неслучайная величина. Она объясняет, почему средние значения

идругие сводные показатели, в формировании которых участвует много изменчивых, подверженных действию случайности величин, сами ведут себя практически как постоянные величины.

Поучительно сравнить суммирование случайных и неслучайных

слагаемых. Пусть X1, …, Xn — независимые одинаково распределенные случайные величины, a — их математическое ожидание, σ2

дисперсия. Рассмотрим их сумму Sn = X1 +… + Xn. Не будь слагаемые случайными, их сумма равнялась бы na. В разбираемых услови-

ях Sn не равно na, но ожидаемое значение Sn, т. е. ESn равно na. Сумма Sn, будучи случайной величиной, может в разных опытах, в зависимости от случая, принимать разные значения. При неза-

висимых повторениях опыта численные значения Sn будут колебаться около na. Масштаб этих случайных колебаний численно ха-

рактеризуется стандартным отклонением Sn (квадратным корнем из дисперсии Sn). Оно равно p. Как видим, размах случайных колебаний, как и ожидаемое значение суммы, растет вместе с ро-

стом числа слагаемыхp. Однако растет гораздо медленнее: пропорционально не n, но n. Если,pнапример, n = 100, то стандартное отклонение пропорционально 100 =10, что составляет 10% от n; если n = 1000, то p1000 ≈31,6, так что стандартное отклонение пропорционально величине n и чуть большей 3% от ожидаемого значения, и т. д.

Из сказанного можно сделать кое-какие практические выводы

идля себя. Предположим, вы решили участвовать в лотерее, т. е. купить лотерейные билеты — один или несколько. Разберем, как связаны расходы и возможные выигрыши. Условия лотерей всегда таковы, что математическое ожидание результата, т. е. математическое ожидание выигрыша за вычетом потраченных на билеты денег, всегда отрицательно. Поэтому в среднем участие в лотереях денежно невыгодно, и чем больше лотерейных билетов вы купите, тем вернее ваш общий проигрыш будет больше, тем меньше у случайности шансов изменить знак общих расходов с отрицательного на положительный.

Люди все это, конечно, знают или хотя бы чувствуют, но, тем не менее, в лотереях участвуют. Видимо, человека привлекает азарт

инадежда на большой выигрыш: ведь вероятность этого положитель-

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]