Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Бакаев Методы статистических испытаний 2007

.pdf
Скачиваний:
60
Добавлен:
16.08.2013
Размер:
2.2 Mб
Скачать

F 1

 

ln(2 y),

y

1

,

 

 

( y) =

 

2

 

 

 

ln(2(1y)),

y >

1

.

 

2

откуда получается искомая формула для моделирования X:

 

ln(2 Γ),

Γ

1

,

2

X =

 

 

 

1

 

ln(2(1Γ)),

Γ >

.

2

F(x

1

0

х

Рис. 4.1. Смешанное дискретно-непрерывное распределение

Замечание 4.1. Мы продемонстрировали метод обратных функций для чисто дискретных и чисто непрерывных случайных величин. Если же случайная величина имеет закон распределения более общего вида, который представляет собой некоторую смесь дискретного и непрерывного распределений, то нужно комбинировать уже изложенные выше идеи. Читателю предлагается самостоятельно рассмотреть вопрос о применении метода обратных функций, когда случайная величина имеет функцию распределения, например, вида указанного на рис. 4.1.

61

4.2 Моделирование нормального распределения

Часто применение метода обратных функций приводит к дополнительным математическим трудностям. Например, генерация нормального закона распределения – с параметрами (0, 1), приводит к необходимости решения уравнения

Xe

t2

2 dt = 2π Γ.

В зарубежной литературе для генерации нормального распределения часто используют формулу интерполяции П. Акклама4 для функции, обратной по отношению к функции нормального распределения. Существует еще интерполяционная формула Б. Моро.5

Опишем также часто практикуемый простой прием моделирования нормально распределенной случайной величины. Для пояснения этого приема напомним вначале один важный результат из теории вероятностей.

Теорема 4.1 ( Центральная предельная теорема)

Пусть имеется n независимых случайных величин X1, X2,…,Xn соответственно с математическими ожиданиями

a1, a2,…, an и дисперсиями σ12 , σ22 , , σn2 . Обозначим :

Λn := X1 + X 2 +…+ X n , An := a1 + a2 +…+ an ,

2n := σ12 +σ22 +…+σn2 .

4См. P. J. Acklam, An algorithm for computing the inverse normal cumulative distribution function, Univ. of Oslo, Statistics Division, June 2000.

http://www.math.uio.no/rovjacklam/notes/inform.

5 См. B. Moro, The Full Monte, Risk Magazine, 8(2)(1995), p. 57-58.

62

Тогда случайная величина (Λn An) / ∑n при n → ∞ будет иметь функцию распределения, приближающуюся к функции распределения нормальной случайной величины с параметрами

(0, 1).

Чтобы воспользоваться данной теоремой для наших целей, положим Xi := Гi , i = 1 ,2,…, n, где Гi – независимые

случайные числа.Тогда в нашем частном случае

Λn = Γ1 + Γ2 +…+ Γn , An = n2 ,

n = 12n .

Применяя центральную предельную теорему, приходим к выводу, что случайная величина

in=1

Γi

n

 

 

 

n

2

(4.4)

 

 

 

 

 

 

 

 

 

 

12

 

 

при достаточно больших n имеет функцию распределения, близкую к функции

 

2

 

1

xet2 dt,

(4.5)

2π

 

 

которая как раз и является функцией распределения нормальной случайной величины с параметрами (0, 1). На практике считают, что число 12 достаточно велико. Полагая, таким образом, n = 12 в (4.4), приходим к выводу, что случайная величина

12

(4.6)

Γi 6

i =1

имеет приближенно закон распределения (4.5). Формула (4.6) и есть искомая практическая формула для генерации нормальной

63

случайной величины с параметрами (0, 1). Для реализации этой формулы генерируются 12 независимых случайных чисел, вычисляется их сумма и из полученной суммы вычитается 6.

4.3 Моделирование многомерных случайных величин

Обратимся теперь к проблеме моделирования многомерных случайных величин, их часто называют также случайными точками. Ниже рассматриваются по отдельности некоторые наиболее важные для практики ситуации

Моделирование случайных точек с независимыми координатами

Пусть требуется смоделировать многомерную случайную величину X = (X1; X2; ;Xn), координаты которой X1, X2,…,Xn – независимые одномерные случайные величины с заданными функциями распределения, соответственно F1(x1), F2(x2),…, Fn(xn). Ввиду независимости случайных величин X1, X2,…, Xn, совместная функция распределения F(x1, x2,…, xn) представляется в виде произведения соответствующих одномерных функций распределения, то есть

F(x1 ,x2 , ,xn ) = P ({X1 < x1 } {X 2 < x2 } {X n < xn })=

n

n

= ∏P({Xi < xi })= ∏ Fi (xi ) .

i =1

i=1

Поэтому в данном случае достаточно смоделировать независимо каждую из одномерных случайных величин X1, X2,…,Xn при помощи соотношений

 

Fi (Xi ) = Γi , i =1, 2, , n,

где

Г1 2 ,n – независимые случайные числа.

Окончательно многомерная случайная величина X определяется своими смоделированными координатами.

64

Пример 4.2. Пусть, например, требуется смоделировать n- мерную случайную точку X = (X1; X2;;Xn), равномерно распределенную в открытом гиперпараллепипеде

(a1;b1 )×(a2 ;b2 )×…×(an ;bn ).

Одномерные функции распределения Fi(xi) в данном случае имеют вид6

F

(x ) =

xi ai

, x (a ;b ).

 

i

i

 

i

i i

 

 

bi ai

 

Таким образом, так как обратные функции для Fi(xi) легко вычисляются, получаем формулы для моделирования координат X1, X2,…,Xn случайной точки X:

Xi = ai + (bi ai ) Γi , i =1, 2, , n,

где Г1 2 ,n независимые случайные числа.

Моделирование случайных точек с зависимыми координатами

При моделировании многомерных случайных точек с зависимыми координатами уже недостаточно ограничиться независимым моделированием каждой из координат и приходится применять более сложные конструкции. Будем предполагать, что для многомерной случайной величины X = (X1; X2;…,Xn) задана совместная плотность распределения p(x1, x2,…,xn).

6Очевидно, для моделирования достаточно знать поведение Fi(xi) лишь на интервале (ai; bi), i=1, 2, …, n.

65

Для решения поставленной задачи моделирования введем новые условия плотности вероятности:

p1 (x )= p ( x1 , x2 ,, xn ) d x2 d x3 d xn ,

p2 ( x2 x1 ) = p ( x1 , x2 ,, xn ) d x3 d x4 d xn × × ( p1 (x1 )) 1 ,

p3 ( x3 x1 , x2 ) = p ( x1 , x2 ,, xn ) d x4 d x5 d xn ×

× ( p1 ( x1 ) p2 ( x2 x1 )) 1 ,

……………………………………

pn 1 ( xn 1 x1 , x2 , , xn 2 ) = p ( x1 , x2 ,, xn ) d xn ×

 

 

 

× (p1(x1 ) p 2(x 2

 

x1 )

p n 2(x n 2

x1 , x2 , , xn 3 )) 1 ,

 

 

 

p n(x n

 

 

x1 , x2 ,, xn 1 ) = p(x 1 , x2 ,, xn ) ×

 

 

 

 

 

 

 

 

 

× (p1(x1 ) p 2(x 2

 

x1 )

p n 1(x n 1

 

x1 , x2 ,, xn 2 )) 1.

 

 

 

 

 

В частности, из последнего соотношения имеем

 

p(x1 ,x2 ,,xn ) = p1(x1) p2 (x2

 

x1)

pn (xn

 

x1 ,x2 ,,xn1). (4.7)

 

 

Введем также условные функции распределения

 

Fi (xi

 

x1 ,x2 ,,xi1 ):= xi

pi (t

 

x1 ,x2 ,,xi1) d t, i =1, 2,,n .

 

 

 

 

Пусть

теперь

Г1 2 ,n

независимые

случайные

числа. Определим

одномерные

 

 

 

случайные

величины

X1, X2,…, Xn

как

решения

последовательных уравнений в

следующей серии:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

66

 

 

 

F1(X1) = Γ1 ,

 

 

 

F2

(X 2

 

X1 ) = Γ2 ,

 

 

 

 

 

 

 

(4.8)

 

 

 

 

 

…=…,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Fn (X n

 

X1 , X 2 ,,Xn1 ) = Γn .

 

 

 

Тогда случайная точка X = (X1; X2;; Xn) будет распределена с совместной плотностью вероятности p(x1, x2,…,xn).

Чтобы убедиться в справедливости данного факта заметим, что, ввиду (4.8), при любом фиксированном i = 2, 3,…,n и при X1 = x1, X2 = x2, …, Xi-1 = xi-1 величина Xi определится из соотношения

Fi (Xi x1 , x2 ,, xi1 ) = Γi ,

откуда, согласно методу обратных функций, имеем

P ({xi < Xi < xi + dxi X 1 = x1, X 2 = x2,, Xi1 = xi1 })=

=pi (xi x1, x2,, xi1 )dxi , i = 2,3,, n.

Используя язык условных вероятностей и последовательно применяя последние равенства, получим

P ({x1 < X1 < x1 + d x1 } {x2 < X 2 < x2 + d x2 } {xn < X n < xn + d xn }) =

= P ({x1 < X1 < x1 + d x1 })P ({x2 < X 2 < x2 + d x2 X1 = x1} )× × P ({xn < X n < xn + d xn X1 = x1 , X 2 = x2 ,, X n 1 = xn 1 })=

= p1 (x1 ) d x1 p2 (x2 x1 )d x2 pn (xn x1 , x2 ,,xn 1 )d xn ,

откуда с учетом (4.7) следует

P ({x1 < X1 < x1 +d x1} {x2 < X 2 < x2 +d x2 }

{xn < X n < xn +d xn }) = p(x1 , x2 ,,xn )d x1 d x2 d xn ,

а это и означает, что случайная точка X имеет нужное распределение.

67

Пример 4.3. Пусть требуется смоделировать двумерную случайную величину (X; Y), принимающую значения в

треугольнике

x + 4y < 5 с

плотностью

вероятности

p(x, y) = cy.

 

 

 

Прежде всего из условия нормировки плотности

распределения

найдем значение

константы

c. А именно,

выбирая в качестве внешней переменной интегрирования переменную y, имеем

1

= ∫04

05 4 y cy d x d y = c 0

4

y (5 4 y)d y = 125 c

,

 

5

 

 

5

 

 

 

 

 

 

 

 

 

 

96

 

откуда c =

 

96

.

Далее, поскольку указанная выше

общая

125

 

 

 

 

 

 

 

методика моделирования случайных точек с зависимыми координатами очевидным образом зависит от принятого порядка координат, в зависимости от этого порядка будут получаться различные формулы моделирования. В случае двух координат имеются всего две различные возможности установить порядок координат (обе эти возможности будут рассмотрены ниже).

а). Вначале будем считать x первой, а y – второй координатой. Тогда

p

(x)= ∫ (5x )/4

p(x, y)d y =

 

96

 

(5x )/4

y d y =

125

 

1

 

 

 

0

 

 

 

 

 

 

 

 

 

0

 

 

=

 

96 (5 x)2

=

3

 

(5 x)2 , 0 < x < 5

 

 

 

 

 

 

 

 

 

 

125

 

32

 

 

 

 

 

 

 

 

125

 

 

 

 

 

 

и

 

 

 

 

 

p(x, y)

 

 

 

 

 

 

 

 

 

 

p2

(y

 

x)=

=

 

32 y

, 0

< y <

5 x .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p1(x)

(5 x)2

 

 

 

 

4

Соответствующие этим плотностям функции распределения имеют вид

68

 

F1(x)= 0x p1 (t)d t =1

 

1

 

(5 x)3

, 0 < x < 5,

 

125

 

 

 

 

 

 

 

 

 

 

и

F2 (y

 

x)= ∫ y p2 (t

 

x)dt

=

16 y 2

,

0 < y <

5 x .

 

 

 

 

(5 x)2

 

 

 

0

 

 

 

 

 

 

 

4

 

Таким образом, получаем последовательные уравнения для

моделирования X и Y:

 

 

 

 

 

 

 

 

 

 

 

 

 

X )

 

=125(1 Γ1 ),

 

 

 

 

(5

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

Γ2 (5 X )2 ,

 

 

 

 

Y 2 =

 

 

 

 

16

 

 

 

 

 

 

 

 

 

 

 

 

 

где,

как обычно,

Г1 иГ2 – независимые

случайные числа.

Заметим, что для целей моделирования можно заменить в первой из этих формул 1Г1 на Г1 , так как обе последние

величины одинаково распределены.

б). Применим теперь общую методику моделирования, изменив порядок координат: первой теперь будет y, а второй – x. Тогда выражения для плотностей будут иметь вид

p2 (y)=

54 y p(x, y)d x =

96

 

54 y y d x =

 

 

 

 

 

 

0

 

 

 

125 0

 

 

 

=

96

y (5 4 y),

0 < y <

5

,

 

 

125

 

 

 

и

 

 

 

 

 

 

 

 

4

 

 

 

p(x,y)

 

 

 

1

 

 

 

 

 

 

 

 

p1(x

 

y)=

=

 

, 0 < x < 5 4 y .

 

 

 

 

 

 

 

 

 

 

 

 

p2 (y)

 

5

4 y

 

 

 

 

 

 

 

 

Вычислив соответствующие функции распределения

 

 

F2 (y)= ∫0y p2 (t)dt =

48 y 2

128 y 3

,

 

0 < y <

5

,

 

 

 

 

 

 

25

125

 

 

 

 

4

 

 

 

 

 

 

 

 

69

 

 

 

 

 

 

 

 

и

F1

(x

 

y)= ∫0x p1

(t

 

y)dt =

 

x

, 0 < x < 5 4 y ,

 

 

 

 

 

5

4 y

 

 

 

 

 

 

 

 

получим формулы для моделирования

 

48

2

128

3

= Γ1

,

 

25 Y

 

125 Y

 

 

 

 

 

X = Γ2 (5 4Y ) ,

 

 

 

 

 

 

 

 

которые очевидно существенно отличаются от полученных. Заметим, что новая пара формул выглядит менее предпочтительно, чем предыдущая, так как для их реализации требуется решать кубическое уравнение, в то время как моделирование по первой паре формул требует для своей реализации (помимо стандартных арифметических операций) всего лишь вычисления кубического и квадратного корней.

Если множество значений многомерной случайной величины ограничено криволинейной поверхностью (гиперповерхностью), то ее моделирование может столкнуться с существенными вычислительными трудностями, даже если выражение для соответствующей плотности распределения имеет простой вид. В некоторых частных случаях удается, однако, избежать указанных трудностей, применяя некоторые искусственные приемы.

Пример 4.4. Пусть требуется смоделировать трехмерную случайную точку (X; Y; Z), равномерно распределенную в шаре x2 + y2 + z2 < 1. Читатель может без труда убедиться, что хотя совместная плотность такого распределения и является

константой внутри указанного шара, а именно, p(x,y,z)= 43π ,

применение указанной выше общей методики приводит к достаточно громоздким выражениям для условных плоскостей распределения и в итоге существенно затрудняет моделирование.

70