Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Glava1-TV.pdf
Скачиваний:
129
Добавлен:
02.04.2015
Размер:
1.29 Mб
Скачать

89

1.5Моделирование случайных величин и векторов и вычисление их выборочных характеристик.

Вприкладных задачах, связанных со статистическими методами обработки информации, весьма важным является с одной стороны умение получать (моделировать) реализации с.в., распределенных по тому или иному закону, а с другой - умение определять свойства с.в. по их реализациям. Этим вопросам и посвящен настоящий раздел. Здесь обсуждается проблема получения реализаций с.в. и векторов с помощью датчиков случайных чисел, излагаются основные положения метода Монте-Карло (метода статистических испытаний), широко используемого как вычислительная процедура в теории оценивания, рассматривается задача определения с помощью метода Монте-Карло выборочных характеристик при наличии данных

ввиде независимых реализаций с.в. с одинаковой ф.п.р.в, а также правило построения гистограмм. Приводится описание m – функций Matlab, обеспечивающих получение реализаций случайных величин с заданными свойствами и процедуры определения выборочных характеристик и построения гистограмм.

1.5.1.Псевдослучайные последовательности, датчики случайных чисел

Для получения с.в. используются различные алгоритмы, которые, как правило, имеют рекуррентную форму. Так, например, для формирования равномерно распределенных с.в. в соответствии с алгоритмом Д.Лемера, который называется также методом вычетов [1.6], привлекается следующее соотношение

γi+1 = D(gγi ) , i = 0.1.2... , γ0 = l / B ,

где g - большое число, D - функция выделения дробной части, а значения B и l

представляют собой взаимно простые целые числа.

Понятно, что, фиксируя начальные условия, каждый раз будет формироваться одна и та же последовательность. Это и объясняет термин, используемый для таких последовательностей - псевдослучайная последовательность. Компьютерные программы, обеспечивающие формирование псевдослучайных последовательностей, обычно называют датчиками случайных чисел. Эти датчики вырабатывают реализации независимых между собой одинаково распределенных с.в. с заданными ф.п.р.в.

Для получения с.в. с той или иной ф.п.р.в. обычно получают сначала с.в. с достаточно простой ф.п.р.в., например, равномерной, а затем подвергают ее такому преобразованию, которое обеспечивает получение заданной ф.п.р.в. В частности, в подразделе 1.3.1 (пример 1.3.2) было показано, как с.в. с экспоненциальным законом распределения может быть получена из равномерной распределенной с.в. Обычно моделировать приходится гауссовские с.в. Как правило, датчик генерирует стандартизованные гауссовские с.в., т.е. центрированные

90

с.в. с единичной дисперсией. Для получения с.в. с заданной дисперсией выходное значение датчика умножают на величину СКО.

1.5.2 Метод Монте-Карло.

При решении прикладных задач оценивания нередко приходится вычислять многократные интегралы, представляющие собой математическое ожидание некоторых функции g(x) [1.6].

Для этих целей широкое применение получила вычислительная процедура, основанная на

методе Монте-Карло, который нередко называется также методом статистических испытаний. Рассмотрим основные положения этого метода. Итак, предположим, что требуется найти интеграл

 

 

 

 

 

 

 

 

 

g =

g(x) f (x)dx = M x {g(x)},

 

 

 

 

 

 

 

 

 

(1.5.1)

где

f x (x)

- плотность распределения вектора x .

 

В

соответствии

с этим методом

вычисленное значение интеграла записывается в виде

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

1

L

 

 

( j)

) ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(1.5.2)

 

 

 

 

 

 

 

 

 

g =

 

 

g(x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

x ( j) - реализации случайных векторов,

распределенных в соответствии с плотностью

f x (x)

и

полученных с помощью

датчика случайных

чисел. Существенно,

что x ( j)

моделируются как независимые случайные векторы. Поскольку

 

x ( j)

случаен, то случайна и

оценка

ˆ

причем

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

g ,

M x {g} = g . Точность вычислений в методе Монте-Карло характеризуется

дисперсией оценки, определяемой как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

1 L

( j)

 

 

 

 

2

 

 

 

1 L

( j)

2

 

1

L

( j)

 

2

 

 

ˆ

g )

 

= M x

 

 

g(x ) g

 

= M x

 

 

(g(x )

 

= M x

 

 

 

 

 

 

 

D ˆ = M x (g

 

 

 

 

 

 

g )

 

2

 

(g(x ) g ) .

g

 

 

 

 

 

L j=1

 

 

 

 

 

 

 

 

L j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L

j=1

 

 

 

Поскольку x ( j)

при разных

j независимы, то и одинаково распределенные центрированные

случайные величины (g(x( j) ) g) также между собой независимы, и таким образом

 

 

 

 

 

 

 

 

 

 

 

 

D ˆ

=

1

M x {[g

(x)

g ]2 } =

1

σ2g ,

 

 

 

 

 

 

 

 

(1.5.3)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

g

 

 

L

 

 

 

 

 

 

 

 

 

L

 

 

 

 

 

 

 

 

 

 

 

где

σ2g

= M x{[g(x) g]2} -

дисперсия случайной величины g(x) .

Из этого соотношения

следует, что метод Монте-Карло при увеличении L может обеспечить любую задаваемую

точность. Как правило, значение σ2g

заранее неизвестно и для определения величины

Dg

целесообразно использовать следующее приближенное соотношение:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L

 

 

 

 

 

 

 

 

 

 

L

 

 

 

 

ˆ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

D ˆ

1

 

(g(x( j) )

ζˆ

)2 =

1

g

2 (x( j) )

g

 

,

 

(1.5.4)

 

 

 

 

 

 

 

 

 

L2

 

L2

L2

 

 

 

 

 

 

 

 

 

 

g

 

 

 

j=1

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

 

 

 

91

которое легко получается при замене M x {[g(x) g]2 в (1.5.3) на его значение, вычисленное согласно методу Монте-Карло.

Из представленных соотношений следует, что точность метода Монте-Карло может быть определена в ходе вычислений, что является одним из очень важных достоинств метода МонетКарло. Количество реализаций L, обеспечивающее необходимую точность, в значительной степени зависит от изменчивости функции g(x) в области, где f x (x) существенно отлична от нуля.

1.5.3 Выборочные статистические характеристики

При проверке свойств с.в. по их реализациям наиболее часто вычисляют так называемые

выборочные математическое ожидание и дисперсию. Очевидно, что для их вычисления удобно использовать метод Монте-Карло. Так, для вычисления выборочного математического ожидания с.в. x может быть использовано выражение

ˆ

1 L

( j)

x ,

(1.5.5)

x =

 

 

x

 

 

 

 

L j=1

 

 

 

где x ( j) независимые между собой

реализации с.в. с одинаковой ф.п.р.в.

f x (x) . Это

выражение есть частный случай (1.5.1), в условиях, когда g(x) = x .

 

Пусть задана дисперсия σ2x с.в.

x , тогда погрешность приближения (1.5.5) может быть

 

 

 

 

 

ˆ

x , для которой с учетом (1.5.3) имеем

 

оценена с помощью дисперсии ошибки ε = x

 

D ˆ

=

1

σ2x .

 

(1.5.6)

 

 

x

 

 

L

 

 

 

Аналогичная (1.5.5) формула для оценки дисперсии случайной величины с известным

математическим ожиданием x будет иметь вид

 

σˆ 2x =

1

 

L (x( j) x)2 .

(1.5.7)

 

 

 

L j=1

 

 

Убеждаемся, что и в этом случае

 

 

 

 

 

 

M x σˆ

2x

=

1

M x L (x( j) x)2 = σ2x ,

(1.5.8)

L

 

 

 

 

j=1

 

т.е. математическое ожидание для оценки дисперсии совпадает с ее действительным значением. Если математическое ожидание неизвестно, то для обеспечения условия (1.5.8) необходимо использовать следующее соотношение

 

2

 

1

L

( j)

ˆ

2

 

σˆ

x

=

 

(x

 

x) .

(1.5.9)

 

 

 

 

 

L 1 j=1

 

 

 

 

92

Действительно, подставляя сюда (1.5.5), в силу независимости реализаций x j , j =1.L ,

можем записать следующую цепочку равенств

 

 

 

 

 

1

 

 

 

 

L

 

 

 

 

 

 

1

 

 

L

 

 

 

 

2

 

1

 

 

 

 

 

L

 

 

 

 

 

 

1 L

 

 

 

2

 

2

 

 

 

 

 

 

 

( j)

 

 

 

 

 

 

( j)

 

 

 

 

 

 

 

( j)

 

 

 

 

 

 

 

M x σˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( j)

 

x

=

 

 

 

 

M x x

 

 

 

 

 

 

x

 

 

 

 

=

 

 

 

M x

x

 

 

x

+ x

 

 

x

 

 

 

=

 

L 1

 

 

 

 

 

 

 

 

 

L 1

 

 

 

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

 

L j=1

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

 

L j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

L

 

 

( j)

 

 

 

 

 

 

2

 

 

2

 

 

 

 

( j)

 

 

L

 

( j)

 

 

 

 

 

1

 

L

( j)

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

M x (x

 

 

x)

 

 

 

(x

 

x) (x

 

 

x) +

 

 

(x

 

 

x)

 

 

=

 

 

 

L 1

 

 

 

L

 

 

 

 

L2

 

 

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

L

 

 

 

2

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

1

 

 

L

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

σ2

 

 

σ2

+

 

 

 

 

σ2

 

2

 

 

 

 

1

 

 

 

2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

L

 

x

 

 

 

L

 

 

x

 

 

x

 

 

 

 

 

 

 

L

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L 1 j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L 1 j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выборочные характеристики для случайных векторов вычисляются по формулам,

аналогичным (1.5.5), (1.5.9), т.е.

 

ˆ

 

1

 

L

( j)

,

 

x

 

x

 

 

 

 

 

 

 

L j=1

 

 

 

1

L

 

( j)

ˆ

2

Величину σˆ x =

 

(x

 

x )

 

 

 

L 1 j=1

 

 

 

 

выборочной матрицей ковариаций.

1.5.4 Гистограмма

ˆ x

 

1

L

( j)

ˆ

( j)

ˆ т

 

P

 

(x

 

x)(x

 

x) .

(1.5.10)

 

 

 

 

 

L n j=1

 

 

 

 

 

ˆx

иматрицу P называют выборочным СКО и

Располагая набором x(1) , x(2) ,..x( j) ...x(L) независимых между собой реализаций, можно не

только вычислить выборочные характеристики, но оценить саму ф.п.р.в., которая в наиболее полном объеме характеризует свойства с.в. В качестве такой оценки выступает так называемая гистограмма. Поясним ее смысл.

Пусть последовательность псевдослучайных величин расположена в порядке возрастания

x(1) , x(2) ......x(M ) . Тогда x (1) и

x(M )

определят минимальное

и максимальное значения.

Разобьем интервал x(M ) x(1)

на r

подынтервалов длиной

=

x(M ) x(1)

. Определим

r

 

 

 

 

 

выборочную вероятность попадания в i -ый интервал ( i =1.r ) как отношение числа попавших в него величин M i к их общему числу, Pi = MMi . Если построить функцию таким образом, что в

 

 

 

 

93

 

 

 

пределах от x (1) + (i 1) , x (1) + i

 

она принимает постоянное значение, равное

M i

(так,

M

 

 

 

 

 

 

 

 

чтобы площадь прямоугольника равнялась

P

=

M i

), то в результате и получаем гистограмму.

 

 

 

 

i

 

M

 

 

 

 

 

 

 

 

 

Эта функция при увеличении числа интервалов может стремиться к некоторой функции

fx (x) ,

удовлетворяющей свойствам ф.п.р.в. Тогда можно записать следующее приближенное равенство

Pr

 

(1)

+ (i 1)

x < x

(1)

+ i

 

 

(1)

+ (i 1)

 

. (1.5.11)

x

 

 

 

f x x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, если формируемой псевдослучайной величине соответствует гистограмма

 

M i

Pr

 

(1)

 

x < x

(1)

 

 

,

(1.5.12)

 

 

x

 

+ (i 1)

 

+ i

 

 

M

 

 

 

 

 

 

 

 

 

 

 

 

 

то можно полагать, что моделируется с.в. с ф.п.р.в.

f x (x) .

 

 

 

 

Для проверки гипотез о законе распределения с.в. применяют теорему К. Пирсона, которая в сущности устанавливает статистические свойства для гистограммы [1.6, с.31]. На основе теоремы Пирсона вводится так называемый критерий согласия χ2 , который используется при проверке гипотезы о законе распределения той или иной с.в.

Для построения гистограмм в Matlab предусмотрена m функция hist(y,n), позволяющая строить ее для заданного числа интервалов n.

Ниже в качестве иллюстрации в таблице 1.5.1 приведены гистограммы, построенные с использованием 20000 реализаций случайных величин A, ϕ, распределенных по закону Рэлея и равномерно в пределах от [−π, π] и промоделированных с помощью процедуры random. Здесь же приведены гистограммы для случайных величин, полученных путем преобразования исходных величин с помощью соотношений sin ϕ и Asin ϕ .

Из рисунка, представленного в таблице 1.5.1, видно, что гистограмма для реализаций с.в. Asin ϕ соответствует гауссовскому закону распределения, что вполне согласуется с результатами раздела 1.3.2.

Весьма полезной в Matlab является m-функция histtool, аналогичная disttool. С помощью этой функции удобно строить различные гистограммы. Функция histtool вызывает специальное окно со своим меню. В нем предусмотрена возможность выбора интересующих ф.п.р.в. или ф.р.в. прямо из вызываемого здесь же списка ф.п.р.в., для которых моделируется указываемое в меню количество моделируемых с.в. и возможные параметры распределений.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]