Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистические методы анализа и обработки наблюдений

..pdf
Скачиваний:
11
Добавлен:
15.11.2022
Размер:
10.29 Mб
Скачать

2.2. РАСПРЕДЕЛЕНИЕ СЛУЧАЙНОЙ ВЕ ЛИЧИНЫ

41

вероятностью. Как мы уже знаем, такие значения есть и у

конечнозначной, и у дискретной

величины — это

как раз

все их допустимые значения. При

этих х функция

распре­

деления F(x) имеет скачок. На рис. 6 приводится

график

функции распределения для числа выпадений герба при трех бросаниях монеты. При его составлении использовался тот факт, что для конечнозначной величины функция распределе­ ния F(x) равна сумме

вероятностей всех допус­ тимых значений, мень­ ших, чем х.

Если функция рас­ пределения непрерывна, то соответствующая слу­ чайная величина также называется непрерывной.

Непрерывная случайная величина каждое свое значение принимает с нулевой вероятностью,

поэтому для нее строгие и нестрогие знаки неравенства можно не различать.

Непрерывные случайные величины будут основными в нашем дальнейшем изложении, ибо именно к ним в боль­ шинстве своем относятся результаты количественных наблю­ дений (см. об этом подробнее в § 4).

Функция распределения случайной величины скрады­ вает распределение вероятностей по отдельным значениям этой величины. Увеличиваясь от значения к значению, она является как бы функцией «накопленной вероятности». Ве­ роятность Р{х<;£<;х+Дх} наглядней характеризует зна­ чение х, особенно при малых Ах. Однако, эта вероятность зависит еще и от Ах и стремится к нулю при неограничен­ ном уменьшении Ах. Деля Р{хС|<[х+Дх} на Ах, мы от последнего недостатка можем, вообще говоря, избавиться, но остается еще зависимость от Ах. И наконец, зависимость от Ах исчезает, если в полученном частном устремить Ах к нулю и рассмотреть функцию

f (*) = lim Р

< дс + Ах}

Д А.-+-Р

Дх

42

§2. СЛ УЧ АЙНЫЕ ВЕЛИЧИНЫ

Эта функция называется плотностью распределения слу­ чайной величины. В ее определении участвует предел, кото­ рый не всегда существует. Поэтому в дальнейшем будут рас­ сматриваться только такие непрерывные величины, у кото­ рых можно определить плотность.

Плотность легко выразить через функцию распреде­ ления:

Д х - М )

а х

т. е. плотность есть производная функции распределения.

Поэтому по формуле Ньютона — Лейбница

ь

$ f(x)dx = F(b)— F(a).

а

А это значит, что с помощью плотности можно вычислять вероятность неравенства

ь

Р { a ^ l < b \ = ^f(x)dx.

а

В частности,

X

F (х) = Р {— оо < I < х] — J / (х) dx.

со

Отсюда же можно вывести еще одно важное свойство плот­

ности:

00

$ / (x)dx = 1. —00 '

Действительно, попадание случайной величины в ин­ тервал — оо<£<оо есть достоверное событие.

Наконец, отметим, что в силу самого своего определения плотность не может быть отрицательной.

Связь между плотностью и вероятностью хорошо иллю­ стрируется геометрически: вероятность того, что непрерыв­ ная случайная величина примет значение из интервала (а, b), равна площади криволинейной трапеции, ограниченной осью х, прямыми х=а и х=Ь и графиком плотности / (х) (рис. 7).

2.3. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ

43

Выше мы рассматривали случайную величину, связан­ ную с геометрическим определением вероятности — коорди­ нату точки, случайно выбранной на отрезке [0,1]. Согласно

геометрическому определению, вероятность попадания слу­ чайной точки в интервал (а, Ь) будет здесь равна длине ин­ тервала bа. Поэтому

Р { х ^ £ < а: + Дх[ = Да;,

если только O sS xd —Ах. Отсюда

/ (*) = lira Д а * = 1 •

Д* - М )

т.е. плотность постоянна для всех х из отрезка [0,1] и равна единице. Если вместо отрезка [0,1] за основу испытания взять какой-нибудь другой отрезок длины /, то получится

плотность f (х) =-|- для всех точек л; из рассматриваемого

отрезка. Вне этого отрезка плотность, очевидно, будет равна нулю.

Распределение, плотность которого постоянна на неко­ тором отрезке, а вне его равна нулю, называется непрерыв­ ным равномерным распределением. На рис. 8 приведен гра­ фик соответствующей функции распределения.

2.3. Числовые характеристики случайных величин.

В приложениях теории вероятностей нередко бывает, что распределение случайной величины известно с точностью до одного-двух неопределенных параметров. В этом случае для описания случайной величины достаточно лишь дополни­ тельно задать несколько общих числовых характеристик распределения. Наиболее употребительны при этом такие

2.3.

ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ

45

Отношения ^ ^

,

., ^ будут частотами появления

со­

ответствующих значений. Если число испытаний N велико, то эти частоты, согласно общему определению вероятности, должны лишь незначительно отличаться от соответствую­ щих вероятностей:

k2

К

Рп

77 ~ Р1’ Tv ~ ^2’

N

Поэтому, заменяя в формуле математического ожидания ве­

роятности р1г р2..... рп на частоты

^ , мы до­

пустим лишь незначительную ошибку, т. е.

дд£ ^ 1*1 4 ~^2*2 + •••+ k n X n

В числителе получившейся дроби каждое значение х{ повторяется слагаемым (с помощью умножения на £,) ровно столько раз, сколько раз это значение возникало в процессе испытаний. Иными словами, получившийся числитель равен сумме всех N результатов испытаний (каждый результат прибавляется к общей сумме независимо от того, встречался он уже раньше или нет). А так как эта сумма затем делится на N, то оказывается, что математическое ожидание конечнозначной случайной величины приближенно равно сред­ нему арифметическому всех результатов, полученных при большом числе испытаний над этой величиной.

Формула математического ожидания легко обобщается на дискретные случайные величины. Математическим ожи­ данием такой величины называется сумма ряда

ас

= 2 Pkxk> k=i

если ряд расходится, то математическое ожидание равно бес­ конечности .

Найдем, например, математическое ожидание в случае распределения Пуассона (см. предыдущий пункт). Случай­ ная величина £, распределенная по закону Пуассона, при­ нимает значения 6=0, 1,2, с вероятностями

Pk k\

46

§2. С Л УЧ А ЙН ЫЕ В Е ЛИ Ч И Н Ы

 

Поэтому

 

ake~a _

у 1 ак~ ле~а

k—1

~бГ =

к=i (6 —1)! •

Но

 

 

 

 

'Y’' ak~Je~a

■ay ak~l

=

e aea = 1.

Z* (6— 1)! =e

(6 1)!

 

k-1

k= i v

 

 

Следовательно, M |= a. Мы видим, что математическое ожи­ дание совпадает с основным параметром распределения Пуассона.

Математическое ожидание непрерывной случайной вели­ чины определяется с помощью интеграла

CD

М £= ^ xf(x)dx,

где f {х) — плотность распределения.

Рассмотрим в качестве примера непрерывное равномер­ ное распределение на отрезке [0,1], плотность которого

была найдена в предыдущем пункте:

 

1, если 0 ^ х ^

1,

0 для прочих

х.

Для этого распределения

 

= Л х dx = у *

 

2

 

о

 

Можно показать, что и для любого отрезка математическое ожидание непрерывной равномерно распределенной слу­ чайной величины есть середина этого отрезка.

Найденный выше смысл математического ожидания как среднего арифметического результатов при большом числе испытаний сохраняется для дискретных и непрерывных слу­ чайных величин. Это позволяет находить математическое ожидание любой случайной величины опытным путем (при­ ближенно).

Математическое ожидание случайной величины обладает рядом свойств, облегчающих его вычисление. Мы приведем

2.3. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ

47

эти свойства без доказательства (их нетрудно проверить, например, для равномерного распределения, что мы и ре­ комендуем проделать читателю).

1. Если все значения случайной величины, не меняя их ве­ роятностей, уменьшить (увеличить) на некоторое число, то математическое ожидание уменьшится (увеличится) на это же число.

2. Если все значения случайной величины, не меняя их вероятностей, уменьшить (увеличить) в некоторое число раз, то математическое ожидание уменьшится (увеличится) во столько же раз.

Благодаря этим двум свойствам при вычислении мате­ матического ожидания (в частности, среднего арифмети­ ческого) можно все значения сокращать, избавляться от дробей, приводить значения к новому началу отсчета и т. п. Например, разыскивая среднее арифметическое чисел 47,3; 47,1; 47,2; 46,8; 46,9; 47,1, можно отнять от всех чисел 47 и умножить их на 10. В результате получатся новые числа,

3, 1, 2, - 2 , - 1 , 1,

среднее арифметическое которых подсчитывается много

легче, чем для прежних, и равно у

Значит,

среднее ариф-

метическое первоначальных чисел

1

2

2

равно уу у + 4 7 = 4 7 ^

Следующие два свойства математического ожидания свя­ заны с действиями над случайными величинами — сложе­ нием и умножением. Случайные величины складываются и умножаются своими значениями. При этом слагаемые (или сомножители) могут встречаться в различных комби­ нациях; вероятность каждой такой комбинации подсчиты­ вается по законам теории вероятностей, если только извест­ ны вероятности сомножителей (слагаемых). Примером суммы двух случайных величин может служить сумма очков, вы­ павших на двух игральных кубиках — закон распреде­ ления этой суммы был найден в предыдущем пункте (таб­ лица 2.1).

Распределение суммы или произведения двух случайных величин можно найти, если известны распределения этих величин. Однако расчеты при этом, как правило, бывают очень сложными. Тем ценнее возможность находить

48

§ 2. С Л У Ч А ЙН ЫЕ В Е Л И Ч И Н Ы

математические ожидания суммы и произведения непо­ средственно по математическим ожиданиям слагаемых или сомножителей.

Продолжим изложение свойств математического ожи­ дания.

3.Математическое ожидание суммы случайных величин равно сумме математических ожиданий слагаемых.

4.Математическое ожидание произведения независимых*) случайных величин равно произведению математических ожиданий сомножителей.

Вкачестве приложения этих свойств найдем математи­ ческое ожидание числа появлений события А с вероятностью

рв п независимых испытаниях (биномиальное распределе­ ние). Это число k равно сумме п случайных величин:

^ = ^ 1 + ^ 2 +

+М-П»

где каждое р,- равно 1, если событие А появилось в i-м ис­ пытании, и равно 0, если событие А в этом испытании не появилось. Все р,- имеют одинаковое распределение: они принимают значение 1 с вероятностью р и значение 0 с ве­ роятностью q= 1—р. Поэтому все они имеют одинаковое математическое ожидание

Мр,- = р - 1 +q- 0 = p.

Но тогда в силу третьего свойства

 

Mfc = Мрх Мр2+

+ М р л = пр.

Таким образом, математическое ожидание числа появлений события А в п испытаниях оказалось равным пр. В п. 1.5 было найдено наивероятнейшее число появлений события Л. Легко видеть, что это число отличается от пр менее, чем на 1. Поэтому в случае, когда пр есть целое число, наи­ вероятнейшее число появлений события А и математическое ожидание числа появлений совпадают друг с другом. Это раскрывает еще один смысл математического ожидания.

Если представлять себе,что значения случайной величины рассеяны вдоль числовой оси, то математическое ожидание

*) Случайные величины называют независимыми, если каждая из них имеет самостоятельное распределение, не зависящее от возможных значений других величин. Более подробно об этом см. ниже, в § 9.

50 § 2. С Л УЧ А ЙН ЫЕ В Е Л И Ч И Н Ы

которое в точности совпадает с дисперсией рассматриваемой случайной величины.

Таким образом, дисперсия есть естественная, простей­ шая мера рассеяния случайной величины вокруг ее математи­ ческого ожидания.

Для практических приложений часто оказывается удоб­ ной другая формула дисперсии.

Используя свойства математического ожидания, можно записать, что

D£ = М [Е2— 2 Ш + (ME)2] = МЕ2 - 2МЕ• ME + (ME)2,

т. е., окончательно,

DE = ME2- (M E )2.

При вычислении дисперсии также полезно опираться на

еесвойства.

1.Дисперсия случайной величины не изменится, если все

еезначения уменьшить (увеличить) на одно и то же число, не меняя их вероятностей.

2.Если все значения случайной величины, не меняя их вероятностей, умножить на некоторый множитель, то дисперсия умножится на квадрат этого множителя.

3.Дисперсия суммы независимых случайных величин равна сумме дисперсий этих величин.

Найдем, пользуясь третьим свойством, дисперсию числа появлений k события А в п независимых испытаниях (бино­ миальное распределение). Для этого найдем вначале диспер­ сии величин р,-, определенных при вычислении математи­ ческого ожидания числа k.

Мы получим, что

Dр ,= М (р,- —Мр,)2 = М (р,- — р)2 = (1 —р)2 р + (0—py q =

= я *р + р 2я = р я ( я + р ) = р я ,

т. е. дисперсии всех р,- совпадают менаду собой. А тогда

D/e=Dp1+ Dp2+

+D \Ln = npq.

Третье свойство дисперсии особенно важно при изучении воздействия каких-либо факторов на результат наблюдения. Эти факторы редко удается изучать по отдельности, поэтому

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]