tjurin_teorija_verojatn_978-5-94057-540-5_1
.pdf§ 2. Числовые характеристики случайных величин |
111 |
|
|
Верхней квартилью называется квантиль, соответствующая значению p =0,75. Нижней квартилью называется квантиль, соответствующая значению p =0,25.
Вописательной статистике и в социально-экономических приложениях нередко используют децили, т. е. квантили уровней 0,1, 0,2, … …, 0,9. Знание децилей позволяет неплохо представлять поведение графика функции y =F( x) в целом.
Вкачестве примера использования понятия децилей в социальноэкономической практике скажем, как вычисляется степень различия доходов бедных и богатых в обществе. Рассматривая распределение доходов, надо найти децили x0,1 и x0,9, и соотнести их между собой.
Вэтом случае дециль x0,1 покажет наибольший доход среди 10% самых бедных, а дециль x0,9 — наименьший доход среди 10% самых богатых. Если эти две децили различаются в десятки раз, то в обществе есть предпосылки к социальной напряженности.
Отметим, что уравнение F( x) = p, определяющее p-квантили, для некоторых значений p (0 < p < 1) может не иметь решений либо иметь неединственное решение. Для соответствующей случайной величины X это означает, что некоторые p-квантили не существуют, а некоторые определены неоднозначно.
Упражнения
1.Случайная величина X — число очков, выпавшее при бросании одной кости. Укажите, для каких значений вероятности p решение уравнения F( x) = p: a) отсутствует; б) не единственно.
2.Случайная величина X имеет равномерное распределение вероятностей на отрезке [a, b]. Найдите значения нижней и верхней квартилей этой случайной величины и ее медиану.
3.Случайная величина X имеет экспоненциальное распределение
спараметром θ =1 (см. пример 1 п. 1.3). Для p =0,95 найдите кван-
тиль xp.
4.Случайная величина X имеет экспоненциальное распределение
спараметром θ =2 (см. пример 1 п. 1.3). Найдите нижнюю и верхнюю квартили этой случайной величины и ее медиану.
5.Непрерывная случайная величина X имеет симметричную плотность распределения вероятностей p(t), т. е. для любого t выполняется равенство p(t) = p(−t). Найдите медиану этой случайной величины. Как связаны между собой нижняя и верхняя квартили этой случайной величины?
6.Известно, что медиана случайной величины X равна a. Найдите медиану случайной величины X +c, где c — константа.
112 |
Глава 2. Случайные величины |
|
|
§ 3. Несколько случайных величин. Независимые случайные величины
3.1. Совместные распределения
Рассмотрим случайный эксперимент. Когда мы в результате этого эксперимента получаем число (случайное число, так как исход эксперимента случаен), мы говорим, что в этом эксперименте мы наблюдаем случайную величину. Если в случайном эксперименте мы каждый раз получаем несколько чисел, мы говорим, что наблюдаем несколько случайных величин. (Иногда в такой ситуации говорят о случайной величине со значением в многомерном пространстве, но мы этого выражения постараемся не употреблять.) Пример: у наудачу взятого человека есть рост, вес, возраст, денежный доход и т. д. Все это случайные величины, появляющиеся совместно при упомянутом случайном выборе.
То же самое можно сказать более формально. Случайный эксперимент имеет пространство элементарных исходов Ω. Мы рассматриваем на Ω несколько функций, зависящих от ω Ω: X1 = f1 (ω), X2 = f2 (ω), … Это случайные величины, одновременно появляющиеся в данном опыте.
Далее ради простоты будем говорить о совместном поведении двух случайных величин. Обозначим их X и Y . Каждая из этих случайных
величин X и Y определяет вероятности P(a1 ¶X ¶a2 ), P(b1 ¶Y ¶b2) событий вида A =(a1 ¶ X ¶a2) и B =(b1 ¶Y ¶b2 ) для произвольных
чисел a1 <a2, b1 <b2 . Тем самым каждая случайная величина задает некоторое распределение вероятностей на числовой прямой. Взятые вместе, случайные величины X и Y определяют вероятности случайных событий
A ∩B = (a1 ¶ X ¶ a2 ) ∩(b1 ¶ Y ¶ b2 ), |
(3.1.1) |
т. е. вероятности вида |
|
P( A ∩B) = P(a1 ¶ X ¶ a2, b1 ¶ Y ¶ b2 ). |
(3.1.2) |
Такие события и вероятности определяют совместное поведение случайных величин X и Y и их совместное распределение вероятностей.
Здесь уместно использовать геометрические представления и рассматривать пару чисел ( x, y) как точку на числовой плоскости (точку с координатами ( x, y)). Тогда пара случайных величин ( X, Y ) определяет случайную точку числовой плоскости. При таком взгляде на
§ 3. Несколько случайных величин |
113 |
|
|
вещи упомянутое выше событие состоит в том, что случайная точка ( X, Y ) попадает в выделенный прямоугольник (рис. 2.8).
Вертикальная заштрихованная полоса на рис. 2.8 — это область
(a1 ¶ x ¶ a2) = {( x, y) : a1 ¶ x ¶ a2 },
горизонтальная заштрихованная полоса — это область
(b1 ¶ y ¶ b2 ) = {( x, y) : b1 ¶ y ¶ b2}.
Дважды заштрихованный прямоугольник на рис. 2.8 — это область {( x, y) : a1 ¶ x ¶
¶a2, b1 ¶y ¶b2 }.
В общем виде события, относящиеся к паре случайных величин ( X, Y ), можно описать так: пара ( X, Y ) принимает значение, попадающее в некоторую область D числовой плоскости (рис. 2.9).
Рис. 2.9. Произвольное событие, относящееся к случайному эксперименту, в котором наблюдаются две случайных величины
Можно представить себе дело так: преобразование X = f1 (ω), Y = f2(ω) переносит на числовую плоскость то распределение вероятностей, которое существует на множестве Ω и порождено случайным экспериментом. Но если само пространство Ω нас не интересует, мы можем о нем не вспоминать, а говорить сразу о том, что пара случайных величин ( X, Y ) задает на плоскости некоторое распределение вероятностей. Его называют совместным распределением случайных величин X и Y . Взятые по отдельности распределения случайных величин X и Y называются частными (реже — маргинальными) распределениями вероятностей.
114 |
Глава 2. Случайные величины |
|
|
Выделяют два типа совместных распределений: дискретные и непрерывные (как и для одной случайной величины).
3.1.1. Дискретные распределения. В дискретном случае возможные значения пары ( X, Y ) — это отдельные точки ( x, y) координатной плоскости. Для полного описания дискретного распределения надо указать все эти точки и присущие им вероятности. Особой разницы между одной и двумя случайными величинами тут нет: это все также отдельные точки и их вероятности.
Для более детального обсуждения дискретных распределений разумно ввести какую-либо нумерацию возможных значений случайных величин X и Y . Пусть для X возможные значения суть числа x1, … …, xm; для Y — числа y1, …, yn. Если какое-либо множество возможных значений бесконечно (счетно), то полагаем формально m (или n) =∞. При такой нумерации возможные значения ( X, Y ) — это пары чисел ( xi, yj ), где индекс i пробегает множество 1, …, m, а индекс j — множество 1, …, n. Для вероятностей этих возможных значений примем обозначения
pij = P(( X, Y ) = ( xi, yj )),
или |
|
|
pij = P( X = xi, Y = yj ), i = 1, …, m; |
j = 1, …, n. |
|
Частные распределения случайных величин X и Y можно полу- |
||
чить, зная их совместное распределение: |
|
|
P( X = xi) = pi1 +… + pin, |
|
|
или, более коротко, |
|
|
n |
|
|
P( X = xi) = Xj=1 pij. |
(3.1.3) |
|
Аналогично |
|
|
m |
|
|
P(Y = yj ) = Xi=1 |
pij. |
(3.1.4) |
Совместное распределение пары случайных величин часто оформляют в виде таблицы.
По вертикали слева указаны возможные значения X, по горизонтали сверху — возможные значения Y . В клетках таблицы записаны вероятности pij возможных значений пары X и Y . Для того чтобы получить из таблицы 2.6 частное распределение случайной величины X (т. е. для каждого возможного значения xi указать его вероятность P( X =xi)), надо для каждой i-й строки этой таблицы просуммировать
|
§ 3. Несколько случайных величин |
115 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 2.6 |
|
|
|
|
|
|
|
|
|
|
X \Y |
y1 |
y2 |
… |
yj |
… |
yn |
|
|
x1 |
p11 |
p12 |
… |
p1 j |
… |
p1n |
|
|
x2 |
p21 |
p22 |
… |
p2 j |
… |
p2n |
|
|
. |
. |
. |
|
. |
|
. |
|
|
. |
. |
. |
|
. |
|
. |
|
|
. |
. |
. |
|
. |
|
. |
|
|
xi |
pi1 |
pi2 |
… |
pij |
… |
xin |
|
|
|
|
|
|
|
|||
|
. |
. |
. |
|
. |
|
. |
|
|
. |
. |
. |
|
. |
|
. |
|
|
. |
. |
. |
|
. |
|
. |
|
|
xm |
xn1 |
xn2 |
… |
pmj |
… |
xmn |
|
по j (т. е. по столбцам) вероятности pij. Частное распределение случайной величины Y из таблицы 2.6 получается соответственно суммированием вероятностей pij по строкам.
3.1.2. Непрерывные распределения. В непрерывном случае распределение вероятностей на числовой плоскости R2 описывает функция плотности. Это неотрицательная функция двух переменных x и y, которую мы также обозначим, p( x, y). Функцию p( x, y) называют плотностью совместного распределения случайных величин X и Y или, коротко, совместной плотностью X и Y .
Смысл у функции плотности — как одномерной, так и двумерной — один: это тот числовой множитель, на который надо умножить размер (длину, площадь, объем и т. д.) маленькой области, чтобы получить приблизительную вероятность присущей этой области вероятности.
Если U — некоторая область на плоскости, которая содержит точку ( x, y) и диаметр которой мал, то
P(( X, Y ) U) ≈ p( x, y)|U|,
где |U| обозначает площадь области U.
Математически точное выражение этой мысли включает переход к пределу: если d — диаметр области U, то совместная плотность p( x, y) в точке ( x, y) пары случайных величин ( X, Y ) равна
p( x, y) = lim |
P(( X , Y ) U) |
, |
(3.1.5) |
|
|U| |
||||
d→0 |
|
|
если этот предел существует.
С помощью двумерной плотности можно выразить вероятность того, что случайная точка ( X, Y ) при осуществлении эксперимента окажется внутри данной двумерной области, скажем области D. Эта ве-
116 |
Глава 2. Случайные величины |
|
|
|
|
|
|
роятность равна |
P(( X, Y ) D) = ZZ |
|
|
|
p( x, y) dx dy. |
(3.1.6) |
(x, y) D
Собственно, именно это интегральное равенство обычно принимают за определение плотности. Формула (3.1.5) при этом оказывается ее следствием. В частности, если D — это некоторый прямоугольник (со сторонами, параллельными координатным осям), то
P(a1 ¶ X ¶ a2 , b1 ¶ Y ¶ b2) = Za2 Zb2 p( x, y) dx dy. |
(3.1.7) |
a1 b1 |
|
Как и в одномерном случае, ту же вероятность имеют события (a1 <
< X ¶a2, b1 <Y ¶b2 ), (a1 ¶X <a2, b1 ¶Y <b2 ) и т. д. для всех комбинаций знаков ¶и <. Из формул (3.1.6) и (3.1.7) следует, в частности, что
интеграл от плотности, взятой по всему пространству, равен 1. Заметим, что участвующая в формуле (3.1.6) функция плотно-
сти может быть изменена в отдельных точках, на отдельных линиях и т. п. множествах меры нуль без изменения значений интегралов (3.1.6). Это замечание относится к любым плотностям. Оно означает, что плотности не вполне однозначно определяются вероятностями. Возможны несущественно различающиеся варианты. Ввиду этого данную выше формулу (3.1.5) надо уточнить: указанный предел должен существовать для «почти всех» ( x, y). Для приложений эти математические тонкости не очень важны. На практике, разумеется, выбирают для ( X, Y ) наиболее просто и регулярно устроенную функцию плотности p( x, y).
Если пара ( X, Y ) имеет плотность, то плотности, уже одномерные, имеют и случайные величины X и Y по отдельности. При этом частная (маргинальная) плотность, скажем, случайной величины X в точке x R1 (почти для всех x — обычная математическая оговорка) равна
Z+∞
f ( x) = p( x, y) dy.
−∞
Аналогично частная плотность величины Y в точке y R1 равна
Z+∞
g( y) = p( x, y) dx.
−∞
Заметно сходство между совместными распределениями вероятностей одной или нескольких случайных величин и распределения-
§ 3. Несколько случайных величин |
117 |
|
|
ми вероятностей на непрерывных пространствах элементарных исходов. Это последнее распределение мы обсуждали ранее. Это сходство не случайно: если в случайном эксперименте мы ограничиваем свой интерес лишь наблюдением за одним или несколькими числовыми показателями (случайными величинами), у нас нет необходимости рассматривать какое-либо промежуточное пространство Ω, на котором интересующие нас случайные величины будут определены как функции. В этом случае мы можем в качестве пространства элементарных исходов рассмотреть то множество (числовую прямую, числовая плоскость и т. д.), в котором принимают значения интересующие нас случайные величины — одна или несколько. Поэтому и математические средства, описывающие распределения вероятностей, одинаковы.
Упражнения
1.Плотность распределения пары случайных величин ( X, Y ) является ненулевой константой на квадрате [0, 1] ×[0, 1] и равна нулю для всех остальных точек числовой плоскости. Найдите значение функции плотности на квадрате [0, 1] ×[0, 1]. Найдите частные функции плотности случайных величин X и Y . (Это распределение называют равномерным распределением на единичном квадрате.)
2.Плотность распределения пары случайных величин ( X, Y ) является ненулевой константой на прямоугольнике [0, a] ×[0, b] (a >0
иb >0) и равна нулю для всех остальных точек числовой плоскости. Найдите значение функции плотности на квадрате [0, a] ×[0, b]. Найдите частные функции плотности случайных величин X и Y .
3.Плотность распределения пары случайных величин ( X, Y ) задана на всей числовой плоскости следующим образом:
1 x2 + y2 p( x, y) = 2π exp − 2 .
Найдите частные функции плотности случайных величин X и Y . Для решения задачи надо вспомнить стандартное нормальное распределение на числовой прямой. (Приведенное распределение пары случайных величин называют стандартным двумерным распределением. Ниже мы поговорим о нем более подробно.)
3.2. Числовые характеристики совместных распределений
Из числовых характеристик двух или нескольких случайных величин наиболее важны их моменты — первые и вторые. Для одной случайной величины X первый момент — это ее математическое ожидание EX, второй (центральный) момент X — это дисперсия
118 |
Глава 2. Случайные величины |
|
|
DX =E( X −EX)2. Подобно этому, первый момент пары случайных величин ( X, Y ) — это пара чисел (EX, EY ). При геометрическом взгляде на ( X, Y ) как на случайную точку на координатной плоскости ( x, y) первый момент — это точка этой плоскости с координатами (EX, EY ), в определенном смысле центр распределения вероятности на этой плоскости.
Вторых центральных моментов у пары ( X, Y ) три: помимо уже известных вторых моментов (дисперсий) каждой из случайных величин X и Y : DX =E( X −EX)2 и DY =E(Y −EY )2, есть еще смешанный второй центральный момент E[( X −EX)(Y −EY )]. Его называют ковариацией.
Ковариация Cov( X, Y ) случайных величин X и Y входит в выражение для D( X +Y ). Следуя определению дисперсии, найдем, что
D( X +Y ) = E[( X −EX) +(Y −EY )]2 = E( X −EX)2 +
+2E[( X −EX)(Y −EY )] +E(Y −EY )2 = DX +2 Cov( X, Y ) +DY ,
если эти моменты существуют.
Определение 3.2.1. Ковариацией Cov( X, Y ) пары совместно распределенных случайных величин ( X) и (Y ) называют
Cov( X, Y ) = E[( X −EX)(Y −EY )],
если указанное математическое ожидание существует. Легко видеть, что верна и другая формула:
Cov( X, Y ) = EXY −EX ·EY .
Очевидно, что Cov( X, Y ) =Cov(Y , X). Из свойств ковариации отметим, что для произвольных чисел A, a, B, b выполняется равенство
Cov(aX + A, bY +B) = ab Cov( X, Y ).
Это свойство вытекает из свойств математического ожидания случайных величин.
Из вторых центральных моментов пары случайных величин ( X, Y ) образуют симметричную матрицу, называемую матрицей ковариа-
ции: |
|
|
. |
|
DX |
Cov( X, Y ) |
|
|
Cov( X, Y ) |
DY |
В формулах, приведенных выше, участвуют не только математические ожидания случайных величин X и Y порознь, но и математические ожидания функций от пары ( X, Y ), в частности математическое ожидание их произведения EXY . Ясно, что XY тоже случайная величина и что ее математическое ожидание можно определить обычным
§ 3. Несколько случайных величин |
119 |
|
|
порядком, с помощью функции распределения XY или ее плотности. По счастью, прибегать к этому сложному способу нет необходимости: математическое ожидание EXY можно вычислить и более просто.
Для дискретных случайных величин ( X, Y ) имеем
X
EXY = |
xi yj pij. |
(i, j)
Если пара ( X, Y ) имеет совместную плотность p( x, y), то
ZZ+∞
EXY = xy ·p( x, y) dx dy.
−∞
Вообще, для случайной величины g( X, Y ), где g( x, y) — некоторая
функция двух переменных, в дискретном случае
X
Eg( X, Y ) = g( xi, yj ) pij,
(i, j)
а если есть совместная плотность, то
ZZ+∞
Eg( X, Y ) = g( x, y) p( x, y) dx dy.
−∞
Для существования математических ожиданий необходимо, чтобы указанные ряды и интегралы сходились абсолютно.
Другие известные в одномерном случае числовые характеристики распределения вероятностей, такие как квантили (медиана, квантили, квартили, децили и т. д.), общепринятых многомерных аналогов не имеют.
3.3. Независимые случайные величины
Понятие независимости случайных величин столь же важно для теории вероятностей, как независимость событий или независимость случайных экспериментов; оно тесно с ними связано. Говоря описательно, случайные величины X и Y , наблюдаемые в одном эксперименте (по-другому говоря, имеющие совместное распределение), называются независимыми (стохастически независимыми), если независимы любые события, которые по отдельности выражаются через X и через Y .
Мы говорим, что случайное событие A выражается с помощью случайной величины X (через X), если описание события A связано только со значением, которое принимает X в случайном опыте. Событие A произойдет в опыте, только если значение X окажется удовлетворяющим определенным условиям. Таковы, например, события ( X =a),
120 |
Глава 2. Случайные величины |
|
|
( X ¶a), (a < X <b), (a ¶X ¶b) либо ( X >c) и т. д. (Здесь a, b, c — числа.) События, которые можно выразить с помощью X, разнообразны
имогут формулироваться сложно (так же как события, выражающиеся через Y ). И все такие события должны быть попарно независимы. Впрочем, для независимости величины X и Y достаточно, чтобы
независимыми были события вида (a1 ¶X ¶a2) и (b1 ¶Y ¶b2). Тогда, как можно показать, попарно независимыми окажутся и все прочие события.
Поэтому в качестве определения независимости можно принять такое определение.
Определение 3.3.1. Случайные величины X и Y независимы, если при любых числах a1, a2, b1 , b2 независимы события A =(a1 < X <a2)
иB =(b1 <Y <b2 ), т. е. если
P( A ∩B) = P( A)P(B).
Проверять независимость случайных величин с помощью этого определения приходится редко. Скорее наоборот, из независимости случайных величин, которая устанавливается как-то иначе, мы получаем способ для вычисления вероятностей событий вида A ∩ B. Независимость же случайных величин чаще всего обеспечивается постановкой либо свойствами случайного эксперимента, когда, например, эти случайные величины определяются результатами независимых опытов.
Для дискретных случайных величин условия независимости упрощаются и определение 3.3.1 может быть преобразовано.
Дискретные случайные величины X и Y независимы тогда и только тогда, когда для всех их возможных значений ( x, y) выполняются равенства
P( X = x, Y = y) = P( X = x)P(Y = y)
для всех возможных значений ( x, y). Здесь P( X = x) и P(Y = y) задаются формулами (3.1.3) и (3.1.4) и являются частными распределениями случайных величин X и Y в совместном эксперименте.
Для непрерывных случайных величин X и Y , имеющих совместную плотность распределения p( x, y), необходимое и достаточное условие их независимости — представление p( x, y) в виде произведения их частных (маргинальных) плотностей f ( x) и g( x)
p( x, y) = f ( x)g( y)
(с обычными для плотностей оговорками относительно возможных нарушений этого равенства в отдельных точках, на отдельных линиях и т. п.).