ТВиМС / Вероятн_Лекц / Вер_Примитивы / ВерЭР_1_Пр
.doc2.3.6 Примеры распределений.
2.3.6.1 Биномиальное распределение.
Многократные испытания по схеме Бернулли, рассмотренные в параграфе 2.1.9.1, более полно и, одновременно, просто моделируются не по схеме случайных событий, а по схеме случайных величин. При этом, хотя речь и пойдет об одномерной СВ, проще рассмотреть её ЧХ с использованием теорем о ЧХ ССВ.
Пусть X = {количество появлений некоторого примитива A при испытаниях Бернулли} = {x0 = 0, x1 = 1, x2 = 2,…,xm = m,…,xn = n}. При этом, вероятности возможных значений этой СВ X вычисляются по формуле (28), в которой число m заменено возможным значением x:
= . (139)
Величина X по описанию представляет собой одномерную ДСВ, спектр которой образован n первыми числами натурального ряда. Вероятности элементов спектра pm = P(xm) (аналитическая форма закона распределения), вычисляемые по (139), позволяют получить табличную форму этого закона – ряд распределения:
X = xm |
0 |
1 |
… |
m |
… |
n |
pm |
p0 |
p1 |
… |
pm |
… |
pn |
(140)
Распределение (139) называется биномиальным, в связи с тем, что множители совпадают с коэффициентами бинома Ньютона.
Определение основных числовых характеристик биномиального закона (МО, дисперсии и стандарта) непосредственно по формулам (51), (59) и (62) затруднительно. Задача упрощается, если её … усложнить. Представим элемент спектра xm СВ X в виде суммы некоррелированных постоянных индикаторов событий (см. 2.2.6.1):
xm = = 0 + 1 + 0 +…+ 1 + 0 = 1 + 1 +…+ 1 + 0 + 0 +…+ 0 = m.
m раз (n – m) раз
Теперь, учитывая, что E = p, а D= pq, находим по формулам (109) и (116) МО и дисперсию биномиального распределения:
E(X) = E() = = = np, (141)
D(X) = = = = npq. (142)
Стандарт этого распределения будет равен
x = . (143)
Кроме определения основных ЧХ биномиального закона, интерес представляет задача нахождения, при больших n, вероятности Pn(X = x) и вероятности того, что X принимает ряд последовательных значений от xi до xj включительно, т.е. P(xi ≤ X ≤ xj).
Прямые вычисления по формуле (139) приемлемы, когда параметр n не выходит за пределы первого десятка. Кардинальное решение проблемы было найдено еще в XVIII веке, благодаря исследованиям Муавра и Лапласа. Они установили, что биномиальное распределение хорошо аппроксимируется нормальным законом, когда p ≈ q и n > 20. С этой целью используются приводимые ниже без доказательства локальная (144) и интегральная (145) теоремы Муавра-Лапласа, позволяющие вычислять указанные выше вероятности [3]:
Pn(x) f(t) / , (144)
= F(tj) – F(ti), (145)
где t = (x – np) / , а f(t) и F(t) – стандартная нормальная плотность и стандартная нормальная функция соответственно.
Задача 2.16 Оценить вероятность того, что из 16-и некоррелированных измерений 14 будут отягощены положительными случайными ошибками, полагая их равновероятными с отрицательными ошибками.
Дано: p+ = p- = q+ = 1 / 2; n = 16; x = 14.
Найти: Pn(x) – ?
Решение: Воспользуемся формулой (144), вычислив предварительно ЧХ по (141) и (143):
E(X) = np = 16 * 0.5 = 8;
= = (16 * 0.5 * 0.5)1/2 = 2.
Pn(x) = P16(14) f((14 – 8) / 2) / 20.0044 / 2 0.0022. #
Как видим, вероятность такого события практически ничтожна, что наводит нас на мысль об ошибочности предположения о равновероятности знаков «+» и «–» у наблюдённых погрешностей. Очевидно, мы имеем дело не со случайными , а с истинными ошибками , содержащими систематическую составляющую .
2.3.6.2 Двумерное дискретное распределение.
В качестве примера двумерного дискретного распределения рассмотрим задачу о двукратном подбрасывании двух монет.
Введем два компонента ССВ: X = {количество появлений герба на первой монете} и Y = {количество появлений герба на второй монете}. Необходимо: построить матрицу распределений ДССВ; установить, связаны ли стохастически компоненты системы; вычислить МО и дисперсию функции Z={количество появлений герба на обеих монетах}.
Дано: X = {кол-во появлений герба на 1-ой монете};
Y = {кол-во появлений герба на 2-ой монете};
Z = {кол-во появлений герба на обеих монетах}.
Найти: 1) вероятности pij , px , и py матрицы распределения;
2) МО, дисперсии и ковариацию X и Y;
3) МО и дисперсию СВ Z.
Решение:
-
Для нахождения вероятностей состояния pij ДССВ необходимо построить общее пространство элементарных событий как прямое декартово произведение (83) отдельных пространств X и Y, на которых построены СВ X и Y, соответственно. Пространства X и Y строятся так, как это было сделано в разделе 2.2.1 (Задача 2.9):
= { = (цц), = (цг), = (гц), = (гг)}, i = x,y.
В таком случае, общее пространство = X Y будет иметь следующую структуру:
= {ω1 = (цц цц); ω2 = (цц цг); ω3 = (цц гц); ω4 = (цц гг);
ω5 = (цг цц); ω6 = (цг цг); ω7 = (цг гц); ω8 =(цг гг);
ω9 = (гц цц); ω10 = (гц цг); ω11 = (гц гц); ω12 =(гц гг);
ω13 = (гг цц); ω14 = (гг цг); ω15 = (гг гц); ω16 = (гг гг)}.
В силу симметрии этого пространства =1/16 для всех шестнадцати элементарных исходов. Теперь заполним матрицу распределения (Табл. 2.4), вычислив pij по формуле (84), а и по (85).
В качестве примера продемонстрируем процедуру вычисления вероятностей p23, и , выполняемую по следствию Аксиомы 3 (2.1.6) и указанным выше формулам:
p23 = P((X = x2 = 1)(Y = y3 = 2)) = =
= + = 1/16 + 1/16 = 2/16;
= = p21 + p22 + p23 = 2/16 + 4/16 + 2/16 = 1/2;
= = p13 + p23 + p33 = 1/16 + 2/16 + 1/16 = 1/4.
-
Числовые характеристики компонентов ССВ найдем по формулам таблицы начальных и центральных моментов ССВ. (Табл. 2.3):
E(X) = = 0 * 1/4 + 1 * 1/2 + 2 * 1/4 = 1;
E(Y) = = 0 * 1/4 + 1 * 1/2 + 2 * 1/4 = 1;
D(X) = = (2)X – = – (E(X))2 = 1/2;
D(Y) = = ()Y - = – (E(Y))2 = 1/2;
KXY = 11 – (1)X * ()Y = – E(X) * E(Y) =
= 0 * 0 * 1/16 + 0 * 1 * 2/16 + 0 * 2 * 1/16 +
+1 * 0 * 2/16 + 1 * 1 * 4/16 + 1 * 2 * 2/16 +
+ 2 * 0 * 1/16 + 2 * 1 * 2/16 + 2 * 2 * 1/16 – 1 * 1 = 1 – 1 = 0. #
Равенство нулю ковариации является необходимым условием попарной стохастической несвязанности компонентов ССВ. Достаточное условие несвязанности (92) здесь также выполняется для всех i и j. Например:
p13 = 1/16 = *= 1/4 * 1/4.
Матрица распределения двумерной дискретной ССВ. Табл. 2.4
Y X |
y1 = 0 |
y2 = 1 |
y3 = 2 |
P(X=xi) = |
x1 = 0 |
p11 = = 1/16 |
p12 = = 2/16 |
p13 = = 1/16 |
= 1/4 |
x2 = 1 |
p21 = = 2/16 |
P22 = = 4/16 |
p23 = = 2/16 |
= 1/2 |
x3 = 2 |
p31 = = 1/16 |
p32 = = 2/16 |
p33 = = 1/16 |
= 1/4 |
P(Y = yj)= = |
= 1/4 |
= 1/2 |
= 1/4 |
[] = [] = = [] = 1 |
3)МО и дисперсию СВ Z = {количество появлений герба на обеих монетах} можно найти двумя способами:
а) построив ряд распределения СВ Z и вычислив её ЧХ по формулам (51) и (59);
б) применив формулы (109) и (116).
Воспользуемся обоими вариантами.
Построим ряд распределения СВ Z на пространстве =X Y.
Z = zm |
z1 = 0 |
z2 = 1 |
z3 = 2 |
z4 = 3 |
z5 = 4 |
P(Z = zm) |
p1 = 1/16 |
p1 = 4/16 |
p3 = 6/16 |
p4 = 4/16 |
p5 = 1/16 |
Вычислим ее МО и дисперсию:
E(Z) = = 0 * 1/16 + 1 * 4/16 + 2 * 6/16 + 3 * 4/16 + 4 * 1/16 = 2,
D(Z) = =(2)Z – =- (E(Z))2 = 02*1/16 + 12* 4/16 + 22 * 6/16 + + 32 * 4/16 +42 * 1/16 = 5 – 4 = 1.
С другой стороны, СВ Z – это сумма случайных компонентов X и Y, т.е. Z = X + Y. Следовательно,
E(Z) = E(X + Y) = E(X) + E(Y) = 1 + 1 = 2,
D(Z) = D(X + Y) = = += 1 / 2 + 1 / 2 = 1.
Результаты, как видим, совпадают, а объем вычислений значительно меньше.
2.3.6.3 Двумерное нормальное распределение.
Двумерное нормальное распределение используется для вероятностного моделирования положения случайной точки на плоскости. В геодезии и смежных науках с его помощью характеризуют точность местоположения объекта.
Плотность вероятности двумерного нормального распределения учитывает возможную стохастическую связанность компонентов X и Y [4]:
f(x,y) = *
* (146)
Здесь в качестве параметров выступают: МО компонентов E(X) и E(Y), их стандарты X и Y, а так же коэффициент корреляции ρXY.
Отметим одну очень важную особенность двумерного нормального распределения: некоррелированность его компонентов (ρXY = 0) равносильна их несвязанности, т.к. в этом случае плотность ССВ становится равной произведению плотностей её компонентов, что является необходимым и достаточным условием несвязанности (93):
f(x,y) = = f1(x) * f2(y) =
=*.
Вероятность попадания случайной точки внутрь области G, ограниченной некоторым контуром, определяется интегралом (89):
= .
Будем искать уравнение контура области G в классе кривых, образующихся при сечении поверхности (146) плоскостями, параллельными плоскости XOY. Указанные сечения образуют эллипсы, параметры которых (большую и малую полуоси) и ориентировку относительно оси OX нам предстоит определить. Центры проекций таких эллипсов на плоскость XOY совпадают с точкой {E(X); E(Y)}. Возьмем в качестве секущей плоскость
f(x,y) = const =* (147)
где – произвольная постоянная, фиксирующая величину этой плотности. Сопоставляя уравнения (147) и (146), получаем уравнение эллипса, являющегося сечением поверхности плотности вероятности плоскостью f(x,y) = const:
= 2 (148)
Уравнение эллипса сечения (148), называемого эллипсом рассеивания, для стохастически несвязанных компонентов упрощается, и его главные оси оказываются параллельными осям X и Y:
=2.
Если же, дополнительно, E(X) = 0 и E(Y) = 0, то уравнение эллипса рассеивания становится каноническим:
=1. (149)
Отсюда легко выразить полуоси эллипса в долях стандартов компонентов:
a = X; b = Y.
Становится очевидным и физический смысл константы : это – число кратности полуосей эллипса стандартам X и Y.
Вероятность попадания случайной нормальной точки в такой эллипс определяется интегралом (89) [4]:
= = 1 – . (150)
Например, вероятность попадания в область G, оконтуренную эллипсом, с полуосями, равными удвоенным стандартам X и Y, т.е. = 2, и с центром в точке {E(X); E(Y)}, равна
P({XY} G= 1 – e-2 = 0,865.
Для построения на плоскости эллипса равной плотности, необходимо перейти, в общем случае, от системы координат XOY к системе координат , оси которой ориентированы по главным осям эллипса [4]:
= (X – E(X)) * cos(T) + (Y – E(Y)) * sin(T)
. (151)
= – (X – E(X)) * sin(T) + (Y – E(Y)) * cos(T)
Найдем угол разворота T осей под условием представления уравнения эллипса (148) в канонической форме (149). Следствием этого требования будут такие ограничения: E() = 0, E() = 0 и K= 0.
По определению ковариации, с учетом только что введенных ограничений, и опустив элементарные тригонометрические преобразования, имеем:
K=E() = (– 0.5+ 0.5)*sin(2T) +(cos2T – sin2T)*=0.
Откуда
– 0.5 sin(2T)*( – ) + cos(2T)*KXY = 0.
Далее, окончательно, находим угол между осями X и :
T = 0.5 arctg (KXY/( - ). (152)
Задача 2.17 Для двумерного нормального распределения с параметрами E(X) = 4, E(Y) = 2, X = 2, Y = 3 и ρXY = – 0,25 необходимо:
а) построить эллипс рассеивания, полуоси которого равны стандартам X и Y, т.е. = 1;
б) определить вероятность попадания в этот эллипс случайной точки.
Решение. Определим по (152) угол между осью абсцисс 0X и большой полуосью эллипса:
T=0.5 arctg (2(–0.25)*2*3/(4-9))=0.5 arctg (0.6)=15029'.
Теперь вычислим искомую вероятность по формуле (150):
P({XY} G= 1 – e-1/2 = 0.393.
На рисунке (Рис. 2.22) изображен рассчитанный эллипс.
Рис. 2.22. Эллипс рассеивания.
Задача 2.18 Результаты математической обработки геодезических измерений могут сопровождаться ковариационной матрицей уравненных координат {} точек геодезической сети. Если сеть плановая, то элементы двух соседних строк и двух соответствующих столбцов такой матрицы позволяют определить ориентировку эллипса рассеивания, характеризующего уравненное положение соответствующей точки:
{KX}i,j = = (153)
В этой ситуации формула (152), определяющая угол разворота T большой полуоси эллипса рассеивания относительно оси абсцисс, принимает вид:
T = 0,5 arctgKij / (). (154)
Теперь, в точке с координатами {} мы можем построить эллипс рассеивания, полуоси которого кратны стандартам: a = i и b = j , а большая полуось a наклонена к оси абсцисс под углом T. По числу кратности в соответствие с формулой (150) находим вероятность того, что построенный эллипс накрывает истинное положение точки {Xi; Xj}. Обычно, для всей геодезической сети выбирают одно и то же число .
Резюмируя содержание данного параграфа, можно сказать, что положение точки на плоскости – это совокупность двух случайных чисел. Когда такая совокупность представляет собой систему двух нормальных компонентов, то её можно дополнительно характеризовать эллипсом рассеивания, расширив эту информацию соответствующей вероятностью.
Традиционно используемая в геодезии ошибка положения точки = характеризует стандарт (среднее квадратическое отклонение) случайного вектора = , являющегося векторной моделью положения точки на плоскости. При этом очень важно отметить, что ошибка положения не реагирует на коррелированность уравненных координат X и Y, так как, не смотря на то, что формально