Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Медич Д. Статистически оптимальные линейные оценки и управление

.pdf
Скачиваний:
86
Добавлен:
25.10.2023
Размер:
13.81 Mб
Скачать

Предполагается, что читатель имеет некоторое пред­ варительное представление о теории вероятностей и эле­ ментарной теории множеств. Более чем достаточную подготовку могут дать, например, книги Феллера [Л. 3-1, 3-2], Гнеденко [Л. 3-3], Папулиса [Л. 3-4] и Парзена [Л. 3-5].

3-1. ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ И СЛУЧАЙНОЙ ВЕЛИЧИНЫ

Рассмотрим эксперимент, исход которого является неопределенным, например, бросание игральной кости или измерение шумового напряжения на выходе элек­ тронной цепи в некоторый определенный момент време­ ни. Множество всех возможных результатов такого экс­ перимента называют выборочным пространством экспе­ римента. Обозначим это множество через й, а его эле­ мент через со. Если й имеет конечное или счетное число элементов, оно называется дискретным выборочным про­ странством. В качестве примера можно привести выбо­ рочное пространство игры в рулетку.

Выборочное пространство может быть также несчет­ ным множеством, таким, например, как множество дей­ ствительных непрерывных функций, определенных на

интервале [0, 1]. В этом случае Q является

непрерыв­

ным выборочным пространством.

 

Событие определяется как некоторое подмножество

множества исходов эксперимента. Событие А

называет­

ся происходящим тогда и только тогда, когда наблю­

даемый исход эксперимента является элементом

А.

Теперь

предположим,

что

эксперимент

проводится

N раз и среди этих N испытаний

событие А

происходит

N(A)

раз. Тогда говорят,

что

вероятность

события А,

обозначаемая Р(А),

определяется соотношением

 

 

 

 

Р(Л) =

Ц

ш

^

 

(3-1)

в предположении,

что указаный

предел существует.

Так

как

0<^N(A)<^N,

то 0 < Р ( Л ) ^ 1 .

Кроме того,

заметим, что P(Çi)

= \ и Р(<р)=0, где <р — пустое

множе­

ство, т. е. множество, не содержащее ни одного исхода эксперимента.

Мы рассмотрели определение вероятности через ин­ туитивное понятие «относительной частоты появления

80

события». Однако интуитивная основа едва ли подходит для строгого изложения теории вероятностей. Поэтому современная теория опирается на определение вероят­ ности с помощью трех основных аксиом. Сформулируем

это

аксиоматическое

определение.

 

 

 

 

 

 

Пусть

Q — пространство

элементов

ш,

а

& — боре-

левское

поле

подмножеств Q, т. е. класс

 

подмножеств

АІ,

Аь

...,

 

An

таких,

что

 

 

 

 

 

 

 

 

 

а)

O S T ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б)

если

 

Л С г ^ ,

то

и A*Ç^!F,

где

Л* — дополнение

А;

в)

если

 

Л„ Л2 ,

 

Л„,

 

 

то

"

faGf.

 

 

Из

п. «а»

и «б» следует,

что

ф о ^ " , так

как

=p =

ü*;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ОО

 

 

 

 

 

из

п. «б» и

«в»

следует,

что [)

А І ^ З ^ , поскольку

и

А ' <

 

 

оо

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

tel

 

 

 

 

 

 

 

 

 

 

 

 

 

tel

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кроме того, для A, Bç^fF, очевидно, справедливо со­

отношение

 

 

 

 

А-В

=

 

А(]В*^ЭГ.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теперь

пусть

Р(•)

— действительная скалярная функ­

ция,

определенная

на

 

множестве

событий

З 1 ' .

Говорят,

что

Р()

является

вероятностью

события

 

АС^

тогда

и только

 

тогда,

когда

она

удовлетворяет

следующим

трем

аксиомам:

 

 

 

 

 

 

 

 

 

 

 

 

 

1.

Р ( А )

> 0

для

всех А .

 

 

 

 

 

 

 

 

2.

P(Q)

= 1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3.

Для

 

любой

последовательности

событий Л,, Л2 , ...

Л„, ... из ¥ ,

такой,

что

Л » П ^ =

<р» i=£ j ,

выполня­

ется соотношение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Р

 

А І

) = % Р № .

 

 

 

 

 

 

 

 

 

 

 

 

 

Ч |

= 1

;

te.

 

попарно

несовме­

События в аксиоме 3 называются

стимыми.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Формулировка

аксиом

согласуется

с

интуитивными

представлениями о вероятности. Приведем еще два ре­

зультата, также согласующихся с интуицией.

 

Во первых,

из АаВ

следует,

что Р(Л)<Р(В).

Что­

бы убедиться в

этом,

отметим,

что B = A\J(A*Ç\B)

и

Л (~)[{А* О B) =

f. Следовательно,^ события А и (Л* р) В)

6—85

 

 

 

81

несовместимы

и

из

аксиомы 3

следует,

что

7?(ß) —

= Р(Л) +

Р(Л* П В).

 

 

 

 

 

 

 

Однако

в

силу аксиомы 1, P(A*Ç}B)>0,

откуда сразу

получаем

требуемый

результат.

 

 

 

 

 

 

 

Во-вторых, полагая

B = ü

и

используя

аксиому

2,

получим P(A)^P(Çî)

=

1. В сочетании

с аксиомой 1 это

означает,

что

О^Р(А)<с;

1.

 

 

 

 

 

 

Говорят, что

тройка

(О, <F, Р)

определяет

вероятно­

стное пространство.

Очевидно,

У следует

выбирать

та­

ким

образом,

чтобы

выполнялись

три аксиомы,

и не

яс­

но,

можно

ли

считать !F произвольным.

Действительно,

можно показать, что имеются случаи, когда нельзя най­ ти вероятностное пространство, удовлетворяющее аксио­

ме 3, если

<F

представляет

собой класс всех

подмно­

жеств Q. В этом случае класс

¥

оказывается

слишком

широким. Поэтому естественно

выбирать в качестве У

более узкий класс подмножеств Q, включающий

рассма­

триваемые события и удовлетворяющий

условиям «а» —

«в», для которого можно найти

 

вероятностное простран­

ство, удовлетворяющее

трем

аксиомам.

 

 

Для целей данной книги достаточно считать Q мно­

жеством

точек

я-мерного

евклидова

пространства,

а У — к л а с с о м

подмножеств

Q вида

 

 

 

 

{ш : cos^a,

соей} *,

 

 

где со — произвольный

я-вектор;

с — я-вектор,

имеющий

определенное значение.

Если

с такими

подмножествами

провести операции объединения и пересечения, то ясно,

что подмножества

[а> : а^ы^Ь},

{со : a<co<: £>} и

{со:а<

<co<ô}, так же как и отдельные

точки вида со = а,

явля­

ются элементами

(здесь а

и

Ь — заданные

я-век-

торы).

 

 

 

 

Такой подход

можно обосновать

тем, что в физиче­

ских системах со случайными явлениями обычно встре­

чаются вероятности, связанные с

такими величинами,

как напряжения, силы, давления,

концентрации реаги­

рующих веществ, скорости и т. д. Например, можно ис«

следовать

вероятность

того, что

шумовое

напряжение

в

каждом

из

каналов

сложной

системы

связи лежит

в

некоторый

момент

времени

в заданных пределах.

 

* ш^а

означает cujü^a*

для і=1

п.

 

82

Пусть х(Т)—и-вектор шумового напряжения в момент Т. Тогда искомая вероятность имеет вид:

Р ( Л ) = Р ( а < х ( Г ) < 6 ) ,

где а и Ъ — известные я-векторы; А обозначает событие a^x(T)^ib. Выборочное пространство здесь, очевидно, непрерывно.

В более общем случае для произвольного вероятност­ ного пространства (О, cF, Р) часто требуется ввести представление выборочного пространства через действи­ тельные числа для облегчения количественного анализа. Это можно сделать с помощью понятия случайной ве­ личины.

Случайной

величиной

называется

действительная

функция

Х(а),

определенная

 

на

Çi,

такая,

 

что

любое

множество

вида

{<в : Х(ау) ^х}

при

действительном х

является

элементом

<F', где

с о е й .

 

 

 

 

Функция Х(-) может быть как скалярной, так и век­

торной. В

последнем

случае

она

называется

векторной

случайной

 

величиной

или

просто

случайным

 

вектором.

В скалярном случае используют термины скалярная

слу­

чайная величина

 

или просто

случайная

величина.

 

В дальнейшем О представляет собой «-мерное евкли­

дово

пространство, У—класс

подмножеств

вида

{ш:со<

^ а ,

а е й } , а в

качестве Х(-)

выбирается

тождествен­

ное

преобразование.

Случайный

вектор Х(-)

в

этом

случае, очевидно, является непрерывным, т. е. все его компоненты могут принимать любые значения в интер­ вале ( — о о, о о ) .

Так как в дальнейшем рассматриваются только не­ прерывные по выборочному пространству случайные векторы, то при изложении теории вероятностей в на­ стоящей главе и теории случайных процессов в следую­ щей внимание сосредоточено в основном на них.

3-2. ФУНКЦИИ РАСПРЕДЕЛЕНИЯ

Функция распределения

вероятностей

и плотность

распределения

Обычно случайный вектор описывают с помощью распределения вероятностей, которое определяется сле­ дующим образом. Пусть Х-случайный гс-вектор, а х —

6*

83

произвольный я-вектор. Скалярная функция, соответст­

вующая

вероятности

того,

что X^zx,

 

называется

функ­

цией распределения

вероятностей

X

и

обозначается

 

Fx(x)=P(X^x)=P(Xi^Xu

 

 

 

Хп<хп).

 

 

(3-2)

Пусть

А

обозначает событие

Х<^х.

Тогда

 

Fx(x) =

Р{А)

И становится

очевидным,

что

речь идет

о

функ­

 

 

 

 

 

ции Р(-),

удовлетворяющей

хг+ахг

 

 

 

трем

аксиомам

вероятно­

 

 

 

сти.

 

 

 

Fx{x)

 

 

 

 

 

 

 

 

Функцию

 

также

 

 

 

 

 

называют

функцией

совме­

 

 

 

 

 

стного

распределения

 

веро­

 

 

 

 

А

ятностей случайных

величин

 

 

 

 

ХІ, ...,

Х П .

Однако здесь при­

0

 

X,

x,+A х1

лагательное

«совместный»

Рис. 3 1. Двумерное представ-

будет

применяться

для

двух

и более

 

случайных

векто­

ление

события

{ я і ^ Х і ^ * ! - ! -

 

-f-Дх,;

 

х2*£.Х2г^.х2+Ах2}.

 

ров. Для простоты в дальней­

 

F(x) вместо Fx(x),

шем

используется

 

обозна­

чение

поскольку

это не может

при­

вести к недоразумению. Аналогичное упрощение будет использоваться и в других случаях.

Поскольку Q соответствует событию Х^.+оо,

а ф —

событию Х^: — со,

ясно, что

F( + oo) = 1,

a F(—со)

=0.

Следовательно,

0^F(x)^l.

 

 

a<b\

А — со-

Пусть а и

Ъ — два n-вектора,

причем

бытие Х^а,

а В

событие

X<cb.

Ясно, что AczB,

так

что Р(А)^Р(В)

 

или, что то же самое,

 

 

 

 

 

F(a)<rzF(b).

 

 

 

Это значит,

что

 

F(x)—монотонно

неубывающая

функция X.

 

 

 

 

 

которой равен-

Если существует функция f(-)>

Д л я

ство

 

 

 

 

 

 

 

F(x)=

J " . . .

[ " / < S , . . . , C n ) < Ä . . - - r Ä »

 

 

 

—00

—00

 

 

 

выполняется

при

любом

х, то эта

функция

называется

плотностью

распределения

вероятностей

X.

Приведен­

ное выше выражение иногда

записывают в сокращенном

виде,

используя

обозначение

вместо

..., £») и

(или)

d\ вместо

а\% . . . е?£„.

 

 

 

 

Ясно, что

 

 

 

 

 

 

 

 

 

 

 

 

Эти

два результата следуют

из

основной

теоремы

анализа

и из того, что F(-)—монотонно

 

неубывающая

функция.

 

 

 

 

 

 

 

 

 

 

 

 

 

Теперь рассмотрим случай двумерного вектора X и

исследуем

событие

{ x ^ X i s ^ X i + Äxi,

 

 

х222+Ах2},

где

Ахи

Ax 2 >0, в предположении, что функция

 

 

 

 

 

 

f ,

.

"d*F

( х , , х а )

 

 

 

 

 

существует и

непрерывна.

Рассматривая

события

на

плоскости

ХіХ2

(рис. 3-1), можно

легко

показать, что

 

 

Р'^х^Х^х^

 

Ах^

х2 < Х2 < хг -f- AxJ

=

 

 

 

— F(xt-\-

Axt,

х2 + Ах,) F {xlt

х 2

+

Дх2 ) -

 

 

 

 

 

- F (*, - f Ах„

х2) +

F (х„ хг).

 

 

(3-3)

По

определению

d*F

(х,,х2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

д х , д х г

 

 

 

 

 

 

 

 

_ _ j

j m F ( Х . + Д Х , ,

Х г + Д Х г ) — F (Xi,

Х + Д Х г ) — F

( X i - f Д Х , , X g ) + F

( * i . Х г )

Ajt.-H)

 

 

 

 

Д х , Д Х 2

 

 

 

 

 

 

 

Лл:,-*0

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно,

 

 

 

 

 

 

 

 

 

 

|

j m

Я ( Х , <

< X i + A x t , Х г <

Х г <

Х г + Д х а )

=

f(xt,xù

 

 

 

 

 

 

Д х , Д х 2

 

 

 

 

 

 

 

 

 

и можно

записать:

 

 

 

 

 

 

 

 

 

 

 

 

 

Р (Хі^Хіт^Хіахі,

x2<cXt^x2+dx2)

 

=

 

 

 

 

 

 

 

 

=f(Xi,

x2)dxidx2.

 

 

 

 

 

 

Тогда

для

произвольной

замкнутой

области

R

на

плоскости

 

 

 

 

 

 

 

 

 

 

 

 

где X — двумерный

вектор.

В

частности,

для

R =

=

fê:a<i|<b},

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S,

а —

я,

 

6 =

6.

 

 

 

 

 

 

 

 

Et

 

Яг

 

 

 

 

 

 

 

85

имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P(a<X<b)J\]f

 

 

 

y

Ä s Ä r

 

 

 

 

Приведенные здесь рассуждения можно распростра­

нить на

л-мерное евклидово

пространство и получить:

 

 

 

 

P(XG/?) =

j - . . J / ( S ) Ä x . . . Ä „

 

 

 

 

и

 

 

 

 

 

 

я

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P ( a < X < 6 ) =

а,

ап

 

 

... Д„,

 

 

(3-4)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

а,

Ь,

X

и

.| — n-векторы;

R — замкнутая

область

в n-мерном евклидовом пространстве.

 

 

 

 

 

 

Возвращаясь к двумерному случаю, рассмотрим со­

бытие {Ä'isgrxi, Х2<с;оо}. Назовем

 

функцию

 

 

 

 

 

 

 

 

F{xi, o o ) = P ( X i < x b

Х 2 < о о )

 

 

 

 

маргинальной

функцией

распределения

вероятностей

Х\.

Так как

2 ^оо} — достоверное

 

событие,

ясно,

что

 

 

Следовательно, F(xi,

<x>)=FXi

 

(Xi),

т. е. является

про­

сто

функцией

распределения

вероятностей

Х ь

Аналогич­

но,

Р\оо,

Xz)

FXt(x2).

 

 

 

 

 

 

 

 

 

то

Если существует

плотность

распределения

 

f(xi,

х 2 ),

очевидно,

что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X,

со

 

 

 

 

 

 

 

 

 

 

 

 

 

 

—ОО —00

 

 

 

 

 

и отсюда

ясно, что

плотность распределения

 

 

 

 

 

 

 

 

 

 

со

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

—со

 

 

 

 

 

 

 

называемая

маргинальной

 

плотностью

распределения

вероятностей

Xt,

является просто

плотностью

распреде-

86

ления случайной величины Х\. С другой стороны,

—00

Аналогичный результат можно получить, заменив Хі

на Х2.

Понятия маргинальных функции распределения и плотности распределения вероятностей легко распрост-

 

 

 

 

 

fix,)

 

 

 

 

 

 

 

 

"| b-a,x,

Рис. 3-2. Равномерная

Рис. 3-3. Равномер­

ная

плотность

рас­

функция распределения

пределения

вероятно­

вероятностей

случайной

стей

случайной

вели­

величины.

 

 

чины.

 

 

 

ранить на «-мерный случаи,

например,

 

 

F(x„ х2, со,

ОО) =

Р ( Х 1 < А : 1

, Х 2 < Х 2 ,

Х 3 < О О , ..

и

Xn<oo)

=

F

(xlt

х2)

 

 

00

00

 

 

 

 

 

 

 

 

 

 

 

—00 —00

Пример 3-1. Случайная зеличина ХІ называется равномерно рас­

пределенной на интервале [ait bi], at<bi, если ее функция распреде­ ления имеет вид рис. 3-2. Здесь

 

 

0.

 

 

если

X] < а, ;

 

 

Xt —ах

 

 

 

 

 

 

F(x1)

= l Ьі__йі

 

если

 

 

a^x^bù

 

 

 

1,

 

 

если

bi <

х3.

Плотность

распределения

X,,

очевидно,

имеет вид:

 

i

0,

 

если

Xi < а ,

или хх >

/ (*і) = I

1

•»

если

в, <

Хі <

,

 

l

Ь1 я,

изображенный

на рис. 3-3.

 

 

 

 

 

 

 

87

Для n-мерного случая имеем:

 

 

 

0.

если

xt

<

at

хотя

бы для

одного

/;

F (*)

=

п

— « і

где ç t =

x t ,

если

at <,xt<bt и Ç 1 = 6 1 ,

 

 

 

 

 

і=1

 

если

xt

>

ftt;

 

 

 

 

 

 

 

если

xt

<

a t

хотя

бы для

одного

i;

f(*)

= п

— at

если a t ^ x t ^ b t ;

для всех

г;

 

 

 

1=1

 

 

 

 

 

 

 

 

 

 

 

 

0,

если

xt

>

&І для всех Л

 

 

 

 

 

 

 

 

Из двух последних выражений легко получить маргинальные функции распределения и плотности распределения вероятностей ком­ понент вектора X.

Пусть X— случайный я-вектор, х — произвольный /г-вектор, Y — случайный m-вектор, а у— произвольный m-вектор. Согласно уравнению (3-2), выражение

F(x,

 

у)=Р(Х^хи

.... Хп^хп,

Y i < j f i ; . . .

 

 

 

 

 

Ym^ym)=P(X^x,

 

Y^y)

 

 

определяет

совместную функцию

распределения

веро­

ятностей X

и Y.

 

 

 

 

 

 

 

Совместная

плотность

распределения

вероятностей

имеет вид:

 

 

 

 

 

 

 

 

 

если она

существует.

 

 

 

 

 

( 3 ' 5 )

 

 

 

 

 

 

Легко

установить следующие

свойства

совместного

распределения

вероятностей:

 

 

 

 

 

 

 

 

 

'

г о

 

 

 

 

 

 

 

—oo

—oo oo со

 

 

 

 

 

 

 

J . . . ] f(5,CVÄt ...dWC1 ...rfC«

=

l ;

 

 

—00

—00

 

 

 

 

 

 

 

 

P(X<x;

a<Y<b)=

j

. . . j

j . . .

 

 

 

 

 

 

 

—00

—oo o,

 

 

 

 

. . .

J

f (6.QÄ,

... a\dZ,...

rfC,,

 

(3-6)

88

где g— вектор;

 

£ — m-вектор;

а

и

Ъ — произвольные

т-векторы.

 

 

 

 

 

 

 

 

 

Маргинальные функцию распределения и плотность

распределения

также

легко получить:

 

 

Р{Х'<х)

=

Р(Х<х,

Y<oo)

=

F{x,

 

oo)àFx(x).

Предполагая,

что функция

F

дифференцируема по

всем ХІ, і = 1 , ...,

п, имеем:

 

 

 

 

 

f / у ч _

à»F(x.co)

д»

 

Г

X,

хп

00

 

 

С

С

Іх\л>—

дх,

... дхп

— дхх ...

дхп

)

••• J

J

 

 

 

 

 

 

—ОО

—00 —00

 

 

00

 

 

 

 

 

 

 

. .. j" / ( e , Q Ä 1 . . . r f 6 „ Ä 1 . . . Ä „ =

—ОО

 

 

ОО

00

 

 

 

 

 

 

 

 

=

j

. .

.

j "

Я(-ж. OrfC, ...

rfCm.

(3-

 

 

—00

—со

 

 

 

 

 

 

 

Точно таким

же

образом.

 

 

 

 

 

fr{y)=

 

J ...

J

f(Ü,

y)Л, . . . Ä n .

 

(3-8)

 

 

 

 

—00

—00

 

 

 

 

 

Условное

распределение

вероятностей

и

 

 

условная

плотность

 

распределения

 

 

 

В последующих главах данной книги большое зна- *

 

чение имеет понятие условной вероятности, отражающее

 

то обстоятельство,

что в

общем

случае

распределение

 

вероятностей события может зависеть от

того,

произо­

 

шло или не произошло некоторое

другое

событие.

 

Для определения этого понятия рассмотрим два со­ бытия А и В из выборочного пространства Й. Вероят­

ность того,

что произойдут

оба

события А и В,

равна

Р(А Ç) В),

а

вероятность

того,

что

произойдет

одно

событие В,

равна Р(В).

Обозначим

условную вероят­

ность А при условии, что В

произошло, через Р(А\В) и

определим

ее

соотношением

 

 

 

 

 

 

Р(А\В)=

 

Р < р £ } В )

 

(3-9)

в предположении, что

Р(В)ФО.

 

 

 

Соседние файлы в папке книги из ГПНТБ