Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
metods / Методы моделирования стохастических систем.pdf
Скачиваний:
255
Добавлен:
26.03.2015
Размер:
2.27 Mб
Скачать
F*(x)

го и ряда других важных для практических приложений законов распределения в литературе [1, 7, 17, 23, 28, 36, 41, 44, 46] предлагается большой выбор различающихся по точности и трудоемкости специальных способов.

3.6. Методы восстановления закона распределения по результатам статистического моделирования

Закон распределения реализаций случайной величины x 1 ,x2 ,…,x n , составляющих выборку некоторой длины n, называется выборочным, или статистическим. Получение выборочной ФРВ или ПРВ

f x dF x dx является одной из основных задач обработки результатов

статистического моделирования. Возможны два варианта постановки такой задачи:

1.Вид закона распределения (чаще всего - аналитическое выражение для ПРВ) известен и требуется определить только его параметры. При такой постановке задачи применяются параметрические методы восстановления закона распределения.

2.Вид закона распределения неизвестен. В таком случае для его получения применяются непараметрические методы.

3.6.1. Параметрические методы восстановления закона распределения

Если известно или считается известным аналитическое выражение для ПРВ, она рассматривается как функция f (x ,A), где A=(a1,a2,…,am) - вектор неизвестных параметров.

В соответствии с методом наибольшего правдоподобия вводится функция правдоподобия

n

L x1, x2 ,...,xn , А f xi , А ,

i 1

где xi - реализации случайной величины x, составляющие выборку.

В качестве оценок параметров aj выбираются значения, доставляющие локальный максимум функции правдоподобия. Для этого в соответствии с необходимым условием достижения локального экстремума составляются m уравнений:

79

 

ln L x1, x2 ,...,xn , А

0 , j=1,2,...,m.

 

a j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение полученной системы m уравнений с m неизвестными дает век-

тор оценок искомых параметров A*=(a1*,a2*,…,am*).

Пример:

f (x)=f (x , )= e- x,

 

x 0 , A=( ), m=1,

 

 

 

 

 

 

 

 

n

 

 

 

L x1, x2 ,...,xn , e xi ,

 

 

 

 

 

 

 

 

i 1

 

 

 

 

n

 

 

 

 

 

 

 

n

ln L x1, x2 ,...,xn , А ln e xi n ln xi ,

 

 

i 1

 

 

 

 

 

 

 

i 1

 

ln L x1, x2 ,...,xn

,

 

 

 

n

 

 

n

 

 

 

xi 0 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

1

n

 

 

1

 

 

 

 

 

 

x

.

 

 

 

 

 

 

 

 

i

 

 

 

 

 

n i 1

 

 

 

 

 

В соответствии с методом моментов уравнения для оценок неизвестных параметров образуются приравниванием выборо чных начальных моментов распределения

_ l

 

1

n

m

 

xil

 

 

 

n i 1

аналогичным моментам распределения генеральной совокупности

M l a1 , a2 ,...,am xl f x, A dx .

Количество составляемых уравнений соответствует количеству неизвестных параметров:

 

 

_ l

l a , a ,...,a

 

 

,

 

 

 

 

 

 

 

 

 

 

 

m

= M

m

l=1,2,...,m.

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример:

 

f (x)=f (x , )= e- x,

x 0 , A=( ),

 

m=1,

 

 

 

 

 

_ 1

 

1

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

xi ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

x

 

 

 

 

 

x

 

e x

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

x e

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M

 

 

dx

xe

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

0

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

80

1

n

 

1

 

 

 

1

n

1

 

i

 

 

,

 

 

 

i

 

x

 

 

 

 

x .

n i 1

 

 

 

n i 1

 

3.6.2. Непараметрические методы восстановления закона распределения

Классические непараметрические методы восстановления закона распределения по случайной выборке x1 ,x 2 ,…,xn позволяют получить аппроксимации ПРВ или ФРВ кусочно-постоянными функциями.

Для аппроксимации ПРВ обычно используются статистические р яды или гистограммы.

При построении статистического ряда выборка разбивается на разря-

ды:

[xj ,xj + 1 ], x1 =xmi n , x j + 1 =xj + x , j =1,2,...,m; xm+ 1 =xma x.

Количество разрядов m обычно выбирается в соответствии с условиями:

m

n

 

 

при n 500 , m 30 при n > 500.

 

 

 

15

20

Длина разряда постоянна: x

xmax xmin

. Разность xmax-xmin называ-

m

 

 

 

 

 

 

ется размахом выборки. Все попавшие в j-й разряд значения x далее считаются одинаковыми и равными среднему значению для данного разр яда vj.

Статистический ряд составляется в форме табл. 8.

 

 

 

 

 

Таблица 8

 

Статистический ряд

 

 

 

 

 

 

 

 

Номер

Границы разря-

Среднее зна-

 

Число на-

Частота

разряда

да

чение

 

блюдений

разряда

 

 

 

 

в разряде

 

1

x1 x2

v1

 

n1

p *

 

 

 

 

 

1

2

x2 x3

v2

 

n1

p *

 

 

 

 

 

2

 

j

xj xj+1

vj

 

nj

p *

 

 

 

 

 

j

 

m

xm xm+1

vm

 

nm

p *

 

 

 

 

 

m

 

 

 

 

 

81

Средние значения для разрядов определяются как средние арифметиче-

ские границ: v j x j x j 1 2 . Частоты разрядов - как отношения количест-

ва элементов выборки, попавших в данный разряд к общему объему выбор-

ки: p j n j n .

По статистическому ряду могут быть найдены оценки математич еского ожидания и дисперсии случайной величины x:

 

 

 

1

m

m

 

 

 

 

mx

n j v j

p j v j ,

 

 

 

 

n

 

 

 

 

 

j 1

j 1

 

 

 

1

m

v j mx 2

m

v j mx

2 .

Dx

n j

p j

 

 

n j 1

 

 

 

j 1

 

 

Гистограмма представляет собой графическую интерпретацию статистического ряда (рис. 28). На основе гистограммы могут быть получены аппроксимации ФРВ (рис.

29) или ПРВ (рис. 30). Ординаты F* (x) и f * (x )

определяются по формулам:

j

Fj pk ,

k 1

f p j .

j

x

 

82

Более точной аппроксимацией выборочной ФРВ является статистическая функция распределения Fx*(x), определяемая как частота наблюдения

реализаций xi, не превышающих x: Fx x nx n , где nx - количество значе-

ний xi x .

Для ее построения вся выборка сортируется в порядке во зрастания x: x1 x2 x j xn . Теперь отношения порядковых номеров j к объ-

ему выборки n дают значение Fx*(x) для интервалов [xj ,x j + 1 ] (рис. 31):

Fx x x j x x j 1 Fj nj .

Менее наглядна, но более удобна для алгоритмической реализации иная форма вычисления статистической функции распределения, не тр ебующая предварительной сортировки выборки:

 

1

n

0

при

u 0,

Fx x

ui , u i =x -x i , ui

 

i

 

 

ui 0.

 

n i 1

1

при

Получаемые на основе рассмотренных методов оценки ПРВ и ФРВ наглядны и просты в реализации, но не обладают свойством достаточности.

83

В последнее время разработаны более эффективные оценки ПРВ, являющиеся обобщениями "окошечной" оценки Розенблатта. Оценка Розенблатта имеет вид:

 

1

n

x xi

 

0,5

при

 

u

 

 

 

1,

 

 

 

 

 

fn x

K ui , ui

, K ui

 

 

 

 

i

 

 

 

 

 

 

ui

 

 

 

1.

 

nh i 1

h

0

при

 

 

 

 

 

 

 

 

 

 

 

Величина 2h называется шириной окна. В общем случае она выбирается

в зависимости от объема выборки: h =h (n )>0, причем lim h n

0 .

 

 

 

 

 

 

n

 

 

 

 

 

 

Принцип построения "окошечной" оценки состоит в том, что с каждым выборочным значением xi совмещается окно шириной 2h (рис. 32). Значение оценки ПРВ для любой точки пропорционально количеству окон, накрывающих эту точку.

Более общими и обладающими свойством достаточности являются ядерные оценки ПРВ вида

 

1

n

1

 

x

xi

 

fn x

Kn x, xi , Kn x, xi

K ui , ui

.

 

 

 

 

 

n i 1

h

h

Функция Kn (x ,xi ) называется функцией ядра, h =h (n )>0 - коэффици-

ентом вклада. В отличие от оценки Розенблатта, здесь K(u )

отличается от

нуля при любом u. Она имеет максимум при u=0 (x=x i ), является четной относительно u и монотонно убывает при удалении u от нуля. Благодаря такому выбору функции ядра, для любой точки x обеспечивается определение оценки ПРВ с учетом степени удаленности от x каждого значения xi, содержащегося в выборке.

Требования к K(u ) и h (n ):

max K u ,

u

 

lim uK u 0

 

lim h n 0

 

K u du 1 ,

,

,

 

u

 

n

 

 

 

 

 

lim nh n .

 

 

 

n

 

 

 

 

84

Для конкретной задачи функция ядра и коэффициент вклада выбираются с учетом статистических характеристик обрабатываемой выборки [46].

Примеры функций ядра и коэффициентов вклада:

K u

 

1

 

e u2 2 , K u

1

 

1

, K u

1

e

 

u

 

, h n n 15

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

1 u2

 

2

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

где x* - оценка среднеквадратического отклонения.

3.7. Критерии согласия теоретического и выборочного законов распределения

Восстановленный одним из рассмотренных способов выборочный закон распределения нестабилен. После проведения дополнительной серии опытов или повторения всего эксперимента в аналогичных условиях будет получена другая случайная выборка, и все оценки могут измениться. Кроме того, табличная или графическая форма закона распределения неудобны для дальнейшего использования.

Поэтому обычно подбирают некоторый теоретический закон распределения вероятностей (аналитическое выражение для ПРВ или ФРВ), достаточно близкий к выборочному, чтобы можно было рассматривать его как а п- проксимацию истинного закона распределения исследуемой случа йной величины. Затем проверяют соответствие теоретического закона истинному на основе критерия согласия теоретического и выборочного законов ра спределения (проверка статистической гипотезы).

В соответствии с основными теоретическими положениями метода статистического моделирования по выборке конечного объема невозможно оценить статистические характеристики случайной величины или процесса с полной достоверностью. Поэтому вывод о согласии или несогласии теор етического и выборочного законов можно сделать только с некоторой вер оятностью. При этом следует учитывать две возможные причины обнар уженного несогласия:

-неверный подбор теоретического закона;

-недостаточный объем выборки.

Процедура проверки статистической гипотезы с помощью критерия с о- гласия состоит в следующем:

- вычисляется значение некоторой меры расхождения подобранного теоретического и выборочного законов распределения;

85