Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

tjurin_teorija_verojatn_978-5-94057-540-5_1

.pdf
Скачиваний:
1858
Добавлен:
02.06.2015
Размер:
4.26 Mб
Скачать

§ 2. Числовые характеристики случайных величин

111

 

 

Верхней квартилью называется квантиль, соответствующая значению p =0,75. Нижней квартилью называется квантиль, соответствующая значению p =0,25.

Вописательной статистике и в социально-экономических приложениях нередко используют децили, т. е. квантили уровней 0,1, 0,2, … …, 0,9. Знание децилей позволяет неплохо представлять поведение графика функции y =F( x) в целом.

Вкачестве примера использования понятия децилей в социальноэкономической практике скажем, как вычисляется степень различия доходов бедных и богатых в обществе. Рассматривая распределение доходов, надо найти децили x0,1 и x0,9, и соотнести их между собой.

Вэтом случае дециль x0,1 покажет наибольший доход среди 10% самых бедных, а дециль x0,9 — наименьший доход среди 10% самых богатых. Если эти две децили различаются в десятки раз, то в обществе есть предпосылки к социальной напряженности.

Отметим, что уравнение F( x) = p, определяющее p-квантили, для некоторых значений p (0 < p < 1) может не иметь решений либо иметь неединственное решение. Для соответствующей случайной величины X это означает, что некоторые p-квантили не существуют, а некоторые определены неоднозначно.

Упражнения

1.Случайная величина X — число очков, выпавшее при бросании одной кости. Укажите, для каких значений вероятности p решение уравнения F( x) = p: a) отсутствует; б) не единственно.

2.Случайная величина X имеет равномерное распределение вероятностей на отрезке [a, b]. Найдите значения нижней и верхней квартилей этой случайной величины и ее медиану.

3.Случайная величина X имеет экспоненциальное распределение

спараметром θ =1 (см. пример 1 п. 1.3). Для p =0,95 найдите кван-

тиль xp.

4.Случайная величина X имеет экспоненциальное распределение

спараметром θ =2 (см. пример 1 п. 1.3). Найдите нижнюю и верхнюю квартили этой случайной величины и ее медиану.

5.Непрерывная случайная величина X имеет симметричную плотность распределения вероятностей p(t), т. е. для любого t выполняется равенство p(t) = p(−t). Найдите медиану этой случайной величины. Как связаны между собой нижняя и верхняя квартили этой случайной величины?

6.Известно, что медиана случайной величины X равна a. Найдите медиану случайной величины X +c, где c — константа.

112

Глава 2. Случайные величины

 

 

§ 3. Несколько случайных величин. Независимые случайные величины

3.1. Совместные распределения

Рассмотрим случайный эксперимент. Когда мы в результате этого эксперимента получаем число (случайное число, так как исход эксперимента случаен), мы говорим, что в этом эксперименте мы наблюдаем случайную величину. Если в случайном эксперименте мы каждый раз получаем несколько чисел, мы говорим, что наблюдаем несколько случайных величин. (Иногда в такой ситуации говорят о случайной величине со значением в многомерном пространстве, но мы этого выражения постараемся не употреблять.) Пример: у наудачу взятого человека есть рост, вес, возраст, денежный доход и т. д. Все это случайные величины, появляющиеся совместно при упомянутом случайном выборе.

То же самое можно сказать более формально. Случайный эксперимент имеет пространство элементарных исходов Ω. Мы рассматриваем на Ω несколько функций, зависящих от ω Ω: X1 = f1 (ω), X2 = f2 (ω), … Это случайные величины, одновременно появляющиеся в данном опыте.

Далее ради простоты будем говорить о совместном поведении двух случайных величин. Обозначим их X и Y . Каждая из этих случайных

величин X и Y определяет вероятности P(a1 X a2 ), P(b1 Y b2) событий вида A =(a1 X a2) и B =(b1 Y b2 ) для произвольных

чисел a1 <a2, b1 <b2 . Тем самым каждая случайная величина задает некоторое распределение вероятностей на числовой прямой. Взятые вместе, случайные величины X и Y определяют вероятности случайных событий

A B = (a1 X a2 ) ∩(b1 Y b2 ),

(3.1.1)

т. е. вероятности вида

 

P( A B) = P(a1 X a2, b1 Y b2 ).

(3.1.2)

Такие события и вероятности определяют совместное поведение случайных величин X и Y и их совместное распределение вероятностей.

Здесь уместно использовать геометрические представления и рассматривать пару чисел ( x, y) как точку на числовой плоскости (точку с координатами ( x, y)). Тогда пара случайных величин ( X, Y ) определяет случайную точку числовой плоскости. При таком взгляде на

Рис. 2.8. Событие, относящееся к случайному эксперименту, в котором наблюдаются две случайные величины, при котором каждая из этих случайных величин попадает
в некоторый интервал

§ 3. Несколько случайных величин

113

 

 

вещи упомянутое выше событие состоит в том, что случайная точка ( X, Y ) попадает в выделенный прямоугольник (рис. 2.8).

Вертикальная заштрихованная полоса на рис. 2.8 — это область

(a1 x a2) = {( x, y) : a1 x a2 },

горизонтальная заштрихованная полоса — это область

(b1 y b2 ) = {( x, y) : b1 y b2}.

Дважды заштрихованный прямоугольник на рис. 2.8 — это область {( x, y) : a1 x

a2, b1 y b2 }.

В общем виде события, относящиеся к паре случайных величин ( X, Y ), можно описать так: пара ( X, Y ) принимает значение, попадающее в некоторую область D числовой плоскости (рис. 2.9).

Рис. 2.9. Произвольное событие, относящееся к случайному эксперименту, в котором наблюдаются две случайных величины

Можно представить себе дело так: преобразование X = f1 (ω), Y = f2(ω) переносит на числовую плоскость то распределение вероятностей, которое существует на множестве Ω и порождено случайным экспериментом. Но если само пространство Ω нас не интересует, мы можем о нем не вспоминать, а говорить сразу о том, что пара случайных величин ( X, Y ) задает на плоскости некоторое распределение вероятностей. Его называют совместным распределением случайных величин X и Y . Взятые по отдельности распределения случайных величин X и Y называются частными (реже — маргинальными) распределениями вероятностей.

114

Глава 2. Случайные величины

 

 

Выделяют два типа совместных распределений: дискретные и непрерывные (как и для одной случайной величины).

3.1.1. Дискретные распределения. В дискретном случае возможные значения пары ( X, Y ) — это отдельные точки ( x, y) координатной плоскости. Для полного описания дискретного распределения надо указать все эти точки и присущие им вероятности. Особой разницы между одной и двумя случайными величинами тут нет: это все также отдельные точки и их вероятности.

Для более детального обсуждения дискретных распределений разумно ввести какую-либо нумерацию возможных значений случайных величин X и Y . Пусть для X возможные значения суть числа x1, … …, xm; для Y — числа y1, …, yn. Если какое-либо множество возможных значений бесконечно (счетно), то полагаем формально m (или n) =∞. При такой нумерации возможные значения ( X, Y ) — это пары чисел ( xi, yj ), где индекс i пробегает множество 1, …, m, а индекс j — множество 1, …, n. Для вероятностей этих возможных значений примем обозначения

pij = P(( X, Y ) = ( xi, yj )),

или

 

 

pij = P( X = xi, Y = yj ), i = 1, …, m;

j = 1, …, n.

Частные распределения случайных величин X и Y можно полу-

чить, зная их совместное распределение:

 

P( X = xi) = pi1 +… + pin,

 

или, более коротко,

 

 

n

 

 

P( X = xi) = Xj=1 pij.

(3.1.3)

Аналогично

 

 

m

 

 

P(Y = yj ) = Xi=1

pij.

(3.1.4)

Совместное распределение пары случайных величин часто оформляют в виде таблицы.

По вертикали слева указаны возможные значения X, по горизонтали сверху — возможные значения Y . В клетках таблицы записаны вероятности pij возможных значений пары X и Y . Для того чтобы получить из таблицы 2.6 частное распределение случайной величины X (т. е. для каждого возможного значения xi указать его вероятность P( X =xi)), надо для каждой i-й строки этой таблицы просуммировать

 

§ 3. Несколько случайных величин

115

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.6

 

 

 

 

 

 

 

 

 

 

X \Y

y1

y2

yj

yn

 

 

x1

p11

p12

p1 j

p1n

 

 

x2

p21

p22

p2 j

p2n

 

 

.

.

.

 

.

 

.

 

 

.

.

.

 

.

 

.

 

 

.

.

.

 

.

 

.

 

 

xi

pi1

pi2

pij

xin

 

 

 

 

 

 

 

 

.

.

.

 

.

 

.

 

 

.

.

.

 

.

 

.

 

 

.

.

.

 

.

 

.

 

 

xm

xn1

xn2

pmj

xmn

 

по j (т. е. по столбцам) вероятности pij. Частное распределение случайной величины Y из таблицы 2.6 получается соответственно суммированием вероятностей pij по строкам.

3.1.2. Непрерывные распределения. В непрерывном случае распределение вероятностей на числовой плоскости R2 описывает функция плотности. Это неотрицательная функция двух переменных x и y, которую мы также обозначим, p( x, y). Функцию p( x, y) называют плотностью совместного распределения случайных величин X и Y или, коротко, совместной плотностью X и Y .

Смысл у функции плотности — как одномерной, так и двумерной — один: это тот числовой множитель, на который надо умножить размер (длину, площадь, объем и т. д.) маленькой области, чтобы получить приблизительную вероятность присущей этой области вероятности.

Если U — некоторая область на плоскости, которая содержит точку ( x, y) и диаметр которой мал, то

P(( X, Y ) U) ≈ p( x, y)|U|,

где |U| обозначает площадь области U.

Математически точное выражение этой мысли включает переход к пределу: если d — диаметр области U, то совместная плотность p( x, y) в точке ( x, y) пары случайных величин ( X, Y ) равна

p( x, y) = lim

P(( X , Y ) U)

,

(3.1.5)

|U|

d→0

 

 

если этот предел существует.

С помощью двумерной плотности можно выразить вероятность того, что случайная точка ( X, Y ) при осуществлении эксперимента окажется внутри данной двумерной области, скажем области D. Эта ве-

116

Глава 2. Случайные величины

 

 

 

 

 

роятность равна

P(( X, Y ) D) = ZZ

 

 

 

p( x, y) dx dy.

(3.1.6)

(x, y) D

Собственно, именно это интегральное равенство обычно принимают за определение плотности. Формула (3.1.5) при этом оказывается ее следствием. В частности, если D — это некоторый прямоугольник (со сторонами, параллельными координатным осям), то

P(a1 X a2 , b1 Y b2) = Za2 Zb2 p( x, y) dx dy.

(3.1.7)

a1 b1

 

Как и в одномерном случае, ту же вероятность имеют события (a1 <

< X a2, b1 <Y b2 ), (a1 X <a2, b1 Y <b2 ) и т. д. для всех комбинаций знаков ¶и <. Из формул (3.1.6) и (3.1.7) следует, в частности, что

интеграл от плотности, взятой по всему пространству, равен 1. Заметим, что участвующая в формуле (3.1.6) функция плотно-

сти может быть изменена в отдельных точках, на отдельных линиях и т. п. множествах меры нуль без изменения значений интегралов (3.1.6). Это замечание относится к любым плотностям. Оно означает, что плотности не вполне однозначно определяются вероятностями. Возможны несущественно различающиеся варианты. Ввиду этого данную выше формулу (3.1.5) надо уточнить: указанный предел должен существовать для «почти всех» ( x, y). Для приложений эти математические тонкости не очень важны. На практике, разумеется, выбирают для ( X, Y ) наиболее просто и регулярно устроенную функцию плотности p( x, y).

Если пара ( X, Y ) имеет плотность, то плотности, уже одномерные, имеют и случайные величины X и Y по отдельности. При этом частная (маргинальная) плотность, скажем, случайной величины X в точке x R1 (почти для всех x — обычная математическая оговорка) равна

Z+∞

f ( x) = p( x, y) dy.

−∞

Аналогично частная плотность величины Y в точке y R1 равна

Z+∞

g( y) = p( x, y) dx.

−∞

Заметно сходство между совместными распределениями вероятностей одной или нескольких случайных величин и распределения-

§ 3. Несколько случайных величин

117

 

 

ми вероятностей на непрерывных пространствах элементарных исходов. Это последнее распределение мы обсуждали ранее. Это сходство не случайно: если в случайном эксперименте мы ограничиваем свой интерес лишь наблюдением за одним или несколькими числовыми показателями (случайными величинами), у нас нет необходимости рассматривать какое-либо промежуточное пространство Ω, на котором интересующие нас случайные величины будут определены как функции. В этом случае мы можем в качестве пространства элементарных исходов рассмотреть то множество (числовую прямую, числовая плоскость и т. д.), в котором принимают значения интересующие нас случайные величины — одна или несколько. Поэтому и математические средства, описывающие распределения вероятностей, одинаковы.

Упражнения

1.Плотность распределения пары случайных величин ( X, Y ) является ненулевой константой на квадрате [0, 1] ×[0, 1] и равна нулю для всех остальных точек числовой плоскости. Найдите значение функции плотности на квадрате [0, 1] ×[0, 1]. Найдите частные функции плотности случайных величин X и Y . (Это распределение называют равномерным распределением на единичном квадрате.)

2.Плотность распределения пары случайных величин ( X, Y ) является ненулевой константой на прямоугольнике [0, a] ×[0, b] (a >0

иb >0) и равна нулю для всех остальных точек числовой плоскости. Найдите значение функции плотности на квадрате [0, a] ×[0, b]. Найдите частные функции плотности случайных величин X и Y .

3.Плотность распределения пары случайных величин ( X, Y ) задана на всей числовой плоскости следующим образом:

1 x2 + y2 p( x, y) = 2π exp − 2 .

Найдите частные функции плотности случайных величин X и Y . Для решения задачи надо вспомнить стандартное нормальное распределение на числовой прямой. (Приведенное распределение пары случайных величин называют стандартным двумерным распределением. Ниже мы поговорим о нем более подробно.)

3.2. Числовые характеристики совместных распределений

Из числовых характеристик двух или нескольких случайных величин наиболее важны их моменты — первые и вторые. Для одной случайной величины X первый момент — это ее математическое ожидание EX, второй (центральный) момент X — это дисперсия

118

Глава 2. Случайные величины

 

 

DX =E( X EX)2. Подобно этому, первый момент пары случайных величин ( X, Y ) — это пара чисел (EX, EY ). При геометрическом взгляде на ( X, Y ) как на случайную точку на координатной плоскости ( x, y) первый момент — это точка этой плоскости с координатами (EX, EY ), в определенном смысле центр распределения вероятности на этой плоскости.

Вторых центральных моментов у пары ( X, Y ) три: помимо уже известных вторых моментов (дисперсий) каждой из случайных величин X и Y : DX =E( X EX)2 и DY =E(Y EY )2, есть еще смешанный второй центральный момент E[( X EX)(Y EY )]. Его называют ковариацией.

Ковариация Cov( X, Y ) случайных величин X и Y входит в выражение для D( X +Y ). Следуя определению дисперсии, найдем, что

D( X +Y ) = E[( X EX) +(Y EY )]2 = E( X EX)2 +

+2E[( X EX)(Y EY )] +E(Y EY )2 = DX +2 Cov( X, Y ) +DY ,

если эти моменты существуют.

Определение 3.2.1. Ковариацией Cov( X, Y ) пары совместно распределенных случайных величин ( X) и (Y ) называют

Cov( X, Y ) = E[( X EX)(Y EY )],

если указанное математическое ожидание существует. Легко видеть, что верна и другая формула:

Cov( X, Y ) = EXY EX ·EY .

Очевидно, что Cov( X, Y ) =Cov(Y , X). Из свойств ковариации отметим, что для произвольных чисел A, a, B, b выполняется равенство

Cov(aX + A, bY +B) = ab Cov( X, Y ).

Это свойство вытекает из свойств математического ожидания случайных величин.

Из вторых центральных моментов пары случайных величин ( X, Y ) образуют симметричную матрицу, называемую матрицей ковариа-

ции:

 

 

.

 

DX

Cov( X, Y )

 

Cov( X, Y )

DY

В формулах, приведенных выше, участвуют не только математические ожидания случайных величин X и Y порознь, но и математические ожидания функций от пары ( X, Y ), в частности математическое ожидание их произведения EXY . Ясно, что XY тоже случайная величина и что ее математическое ожидание можно определить обычным

§ 3. Несколько случайных величин

119

 

 

порядком, с помощью функции распределения XY или ее плотности. По счастью, прибегать к этому сложному способу нет необходимости: математическое ожидание EXY можно вычислить и более просто.

Для дискретных случайных величин ( X, Y ) имеем

X

EXY =

xi yj pij.

(i, j)

Если пара ( X, Y ) имеет совместную плотность p( x, y), то

ZZ+∞

EXY = xy ·p( x, y) dx dy.

−∞

Вообще, для случайной величины g( X, Y ), где g( x, y) — некоторая

функция двух переменных, в дискретном случае

X

Eg( X, Y ) = g( xi, yj ) pij,

(i, j)

а если есть совместная плотность, то

ZZ+∞

Eg( X, Y ) = g( x, y) p( x, y) dx dy.

−∞

Для существования математических ожиданий необходимо, чтобы указанные ряды и интегралы сходились абсолютно.

Другие известные в одномерном случае числовые характеристики распределения вероятностей, такие как квантили (медиана, квантили, квартили, децили и т. д.), общепринятых многомерных аналогов не имеют.

3.3. Независимые случайные величины

Понятие независимости случайных величин столь же важно для теории вероятностей, как независимость событий или независимость случайных экспериментов; оно тесно с ними связано. Говоря описательно, случайные величины X и Y , наблюдаемые в одном эксперименте (по-другому говоря, имеющие совместное распределение), называются независимыми (стохастически независимыми), если независимы любые события, которые по отдельности выражаются через X и через Y .

Мы говорим, что случайное событие A выражается с помощью случайной величины X (через X), если описание события A связано только со значением, которое принимает X в случайном опыте. Событие A произойдет в опыте, только если значение X окажется удовлетворяющим определенным условиям. Таковы, например, события ( X =a),

120

Глава 2. Случайные величины

 

 

( X a), (a < X <b), (a X b) либо ( X >c) и т. д. (Здесь a, b, c — числа.) События, которые можно выразить с помощью X, разнообразны

имогут формулироваться сложно (так же как события, выражающиеся через Y ). И все такие события должны быть попарно независимы. Впрочем, для независимости величины X и Y достаточно, чтобы

независимыми были события вида (a1 X a2) и (b1 Y b2). Тогда, как можно показать, попарно независимыми окажутся и все прочие события.

Поэтому в качестве определения независимости можно принять такое определение.

Определение 3.3.1. Случайные величины X и Y независимы, если при любых числах a1, a2, b1 , b2 независимы события A =(a1 < X <a2)

иB =(b1 <Y <b2 ), т. е. если

P( A B) = P( A)P(B).

Проверять независимость случайных величин с помощью этого определения приходится редко. Скорее наоборот, из независимости случайных величин, которая устанавливается как-то иначе, мы получаем способ для вычисления вероятностей событий вида A B. Независимость же случайных величин чаще всего обеспечивается постановкой либо свойствами случайного эксперимента, когда, например, эти случайные величины определяются результатами независимых опытов.

Для дискретных случайных величин условия независимости упрощаются и определение 3.3.1 может быть преобразовано.

Дискретные случайные величины X и Y независимы тогда и только тогда, когда для всех их возможных значений ( x, y) выполняются равенства

P( X = x, Y = y) = P( X = x)P(Y = y)

для всех возможных значений ( x, y). Здесь P( X = x) и P(Y = y) задаются формулами (3.1.3) и (3.1.4) и являются частными распределениями случайных величин X и Y в совместном эксперименте.

Для непрерывных случайных величин X и Y , имеющих совместную плотность распределения p( x, y), необходимое и достаточное условие их независимости — представление p( x, y) в виде произведения их частных (маргинальных) плотностей f ( x) и g( x)

p( x, y) = f ( x)g( y)

(с обычными для плотностей оговорками относительно возможных нарушений этого равенства в отдельных точках, на отдельных линиях и т. п.).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]