Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
metods / Методы моделирования стохастических систем.pdf
Скачиваний:
295
Добавлен:
26.03.2015
Размер:
2.27 Mб
Скачать

при n→∞, сходится по вероятности к стандартизованной нормальной случайной величине.

Одна из предельных теорем теории вероятностей гласит, что последовательность относительных частот в схеме Бернулли hn имеет асимптотически

нормальное распределение с математическим ожиданием

mh

pА и дис-

 

 

 

 

 

 

n

персией

 

 

 

pА 1 pА

 

 

 

D

 

2

 

.

 

(3.6)

 

 

 

h

h

 

 

 

 

 

 

n

n

 

n

 

 

 

 

 

 

 

 

В соответствии с центральной предельной теоремой последовательность случайных величин, определяемых по (3.2), имеет асимптотичеcки нормальное распределение с математическим ожиданием, равным матем атическому

ожиданию исходной последовательности независимых случайных вели-

чин, m_

mx и дисперсией:

xn

n

 

 

2

 

2x

 

 

 

D_

n

,

 

(3.7)

n

 

xn

xn

 

 

 

 

если только математическое ожидание

mx

и дисперсия 2x

 

существуют.

 

n

 

 

 

n

 

Эти две теоремы являются основой для оценки погрешностей статистического моделирования. При этом следует иметь в виду, что понятия предела по вероятности, асимптотически нормального распределения и все пр едельные теоремы в строгом смысле справедливы только для бесконечного числа опытов n. При любом реализованном на практике конечном n любое из приведенных выше соотношений может не подтвердиться с вероятностью, отличной от нуля.

3.2. Понятие оценки. Свойства оценок

Совокупность значений случайной величины x 1 ,x2 ,…,xn полученных при n независимых опытах в однородных условиях, называется случайной выборкой. Закон распределения такой ограниченной по объему совокупности значений исследуемой случайной величины x называется выборочным законом распределения.

Выборка бесконечного объема, распределение которой совпадает с истинным законом распределения исследуемой случайной величины x, называ-

ется генеральной совокупностью.

57

Таким образом, если будут выполнены различные серии опытов с регистрацией случайных значений, или реализаций, величины x, будут получены несколько случайных выборок, выступающих как часть одной и той же генеральной совокупности. Каждой из этих выборок будет соответствовать свой выборочный закон распределения, являющийся некоторым приближением истинного закона.

Можно выделить два основных вида задач обработки случайных выбо-

рок:

-получение выборочного закона распределения;

-определение некоторых оценок, то есть приближений моментов или параметров истинного закона распределения.

Статистикой называется некоторая функция, определенная на выбор-

ке, yn =y(x1 ,x 2 ,…,xn ), значение которой может быть предсказано с существенно более высокой точностью, чем значение случайной величины, обр а- зующей выборку [20].

Поясним суть такого свойства, называемого статистической устойчивостью, на примере.

Пусть получена выборка значений случайной величины x объемом n = 10: 1,2; 1,8; 2,2; 2,5; 2,1; 1,9; 1,8; 1,5; 1,3; 2,4.

_

Найдем: среднее арифметическое x10 1,87 и вероятность того, что на-

блюдаемое значение x оказывается большим 2, p А=P(x>2)=0,4.

Если на основе имеющейся выборки попытаться предсказать знач ения,

_

которые примут случайные величины x, x и pА после проведения дополни-

тельного 11-го

опыта, то

можно сделать следующие предположения:

 

_

 

1,2≤x ≤2,5; 1,81≤ x ≤1,93;

0,36≤p А≤0,45.

 

 

_

Очевидно,

при больших n прогнозируемые диапазоны для x и pА ока-

жутся значительно более узкими, в отличие от x. Таким образом, они действительно обладают статистической устойчивостью и могут использоваться как статистики.

Выбор той или иной статистики в качестве оценки искомой велич ины в конкретной задаче не всегда однозначен. Помимо статистической устойч ивости, к оценке предъявляются следующие требования:

1. Состоятельность – оценка должна сходиться по вероятности к оцениваемой величине. Для этого достаточно, чтобы предел дисперсии оце н- ки был равен нулю при n→∞.

58

2.Эффективность – оценка должна иметь минимальную дисперсию среди всех статистик, которые можно построить для определения искомой величины.

3.Несмещенность – математическое ожидание оценки должно совпадать

систинным математическим ожиданием оцениваемой величины.

4.Достаточность – оценка должна использовать всю информацию, содержащуюся в выборке.

Последними двумя требованиями иногда пренебрегают в пользу статистической устойчивости и эффективности или для простоты вычислений.

Примеры оценок:

1.Оценка вероятности случайного события – относительная частота (3.1)

отвечает всем указанным требованиям: pA* = hn.

2.Оценка математического ожидания – выборочное среднее (3.2) – является состоятельной, несмещенной, достаточной и при условии конечности

_

дисперсии оцениваемой величины эффективной: mx xn .

3. Для нахождения дисперсии случайной величины x может быть построена статистика, непосредственно соответствующая определению дисперсии и называемая выборочным стандартным отклонением:

 

1

n

 

_

 

2

 

s2

 

xi xn

,

(3.8)

 

 

n i 1

 

 

 

 

 

_

где xi - значения реализаций x, образующих выборку; xn - выборочное среднее. Однако такая статистика, удовлетворяя остальным требованиям, для конечной выборки оказывается смещенной.

Несмещенная оценка дисперсии выглядит следующим образом:

 

 

1

n

_ 2

 

Dx

 

xi xn .

(3.9)

 

 

n 1 i 1

 

 

Нетрудно убедиться, что при n > 50 смещение статистики (3.8) оказывается незначительным и ее также можно использовать для оценки дисперсии.

4. Оценка корреляционного момента связи двух случайных величин x и y, удовлетворяющая всем указанным выше требованиям:

 

 

1

n

 

_

 

_

 

 

Kxy

 

 

xi xn yi yn .

(3.10)

 

 

 

n 1 i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

59

P(А)=p

5. Оценки математического ожидания m и корреляционной функции K ( ) стационарного эргодического случайного процесса ( ) могут быть получены по случайной выборке, образованной n последовательными измерениями одной реализации процесса i n с шагом t:

 

 

 

 

1

n

 

 

 

m

i ,

(3.11)

 

 

 

K

 

 

 

n i 1

(3.12)

 

 

i

m i j m ,

 

1

 

n j

 

 

 

 

 

 

 

 

 

 

n 1

j i 0

 

 

 

где i (i t), j t.

Оценка (3.11) удовлетворяет всем указанным выше требованиям, а оценка (3.12), не будучи несмещенной, традиционно используется при до статочно больших n в силу простоты алгоритмической реализации.

3.3. Точность оценок и определение необходимого количества опытов

Рассмотрим задачу определения вероятности А случайного события А на основе схемы Бернулли. В соответствии с законом больших чисел и предельными теоремами можно принять (с достоверностью, близкой к 1), что при достаточно больших n оценка этой вероятности p*А является непрерывной случайной величиной, распределенной по норм альному закону со

следующими математическим ожиданием и среднеквадратическим о тклонением:

m

M pА pА ,

 

 

pА

 

 

 

 

 

 

 

 

 

 

D pА

pА 1 pА

.

(3.13)

 

 

pА

 

 

 

 

n

 

С учетом (3.13) найдем вероятность того, что при определенном n оценка будет отличаться от истинной вероятности не более, чем на :

P(|p*А – pA| < ) = P(pA – ∆ < p*А < pA + ∆) = F(pA + ∆) – F(pA – ∆), (3.14)

где F(x) - функция распределения вероятностей (ФРВ) случайной величины p*А. Графически вероятность (3.14) соответствует заштрихованной площади под кривой ПРВ случайной величины p*А (рис. 18).

60

Соотношение (3.14) обычно представляют в следующей форме:

 

 

 

 

 

 

 

 

 

 

 

 

pА pА

 

P

 

 

 

 

 

 

 

 

 

 

 

pА

 

 

 

 

 

 

 

 

 

 

 

 

P

 

 

 

д Pд ,

 

 

 

 

u

 

(3.15)

 

 

 

 

 

 

 

 

 

 

pА

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

u

p p

А

 

 

А

- стандартизованная

pА

 

 

 

 

 

нормальная

 

случайная

величина;

pА определяется по

(3.13); Pд -

доверительная вероятность;

д pА .

Доверительная вероятность может быть определена через ФРВ u стандартизованного нормального закона:

 

 

 

 

1

 

д

 

u2

du = Фu д Фu д д ,

 

 

 

Pд =

 

 

e

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

д

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где Ф

 

= Ф

 

 

 

0,5

1

 

 

 

д

 

 

u2

 

 

д

u

д

 

 

 

 

e

2 du - интеграл вероятностей.

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

В соответствии с (3.15) модуль

 

абсолютной погрешности p А-p*А

оценки вероятности не превосходит д

 

с вероятностью Pд.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

pА

 

Таким образом, при достаточно большом n можно с доверительной ве-

роятностью Pд оценить погрешность p*А:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

д

 

 

 

pА 1 pА

 

(3.16)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или определить количество опытов, необходимое для обеспечения погре шно-

сти, не превышающей допустимую доп.:

 

1 p

 

 

 

 

 

 

2 p

А

А

 

n

 

 

д

 

 

.

(3.17)

треб.

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доп.

 

 

 

 

 

 

 

 

 

 

 

 

 

61

С учетом сказанного очевидно, что после проведения nтреб. опытов нельзя утверждать, что искомая вероятность равна p*А. Корректная трактовка результата будет выглядеть следующим образом: с доверительной вер оятно-

стью

Pд вероятность события

А находится

в пределах

интервала от

pА д

до pА

д . Такой интервал называется доверительным.

 

pА

 

 

pА

 

 

 

 

 

 

 

Некоторые значения Pд и д (Pд ) представлены в табл. 7.

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а 7

 

Доверительные вероятности и доверительные интервалы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Pд

0,7

0,75

0,8

0,85

0,9

0,95

0,98

0,99

0,995

0,997

 

 

 

 

 

 

 

 

 

 

 

 

 

д

1,04

1,15

1,28

1,44

1,65

1,96

2,33

2,58

2,81

3,0

 

 

 

 

 

 

 

 

 

 

 

 

 

В большинстве случаев Pд выбирают в соответствии с правилом "трех сигм": д =3, Pд =0,997≈1. Однако если трудоемкость моделирования имеет существенное значение, она может быть уменьшена за счет снижения доверительной вероятности. Так например, при Pд =0,8 д =1,28, и для обеспече-

ния той же доп. потребуется в 32 1,282 5,5 раз меньше опытов, чем при

Pд =0,997.

Для оценки математического ожидания (3.2) путем усреднения результатов n опытов в соответствии с законом больших чисел и центральной пр е- дельной теоремой аналогично (3.16), (3.17) можно получить:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

x

 

 

 

 

 

 

 

 

 

 

P

 

m

 

m

 

 

 

 

 

P

,

 

 

 

 

 

 

 

 

x

x

 

д

n

 

 

д

 

 

 

 

 

 

 

 

 

 

 

 

где mx - математическое ожидание оценки, совпадающее с истинным матема-

тическим ожиданием исследуемой случайной величины x;

Dx

- средне-

n

 

 

квадратическое отклонение оценки; Dx – дисперсия случайной величины x. При достаточно большом n погрешность mx-m*x удовлетворяет нера-

венству:

62

 

 

 

 

д

Dx

,

(3.18)

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

а количество опытов, необходимых для обеспечения допустимой погрешности доп., равно:

 

 

 

2 D

x

 

 

n

 

 

д

.

(3.19)

треб.

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доп.

 

Отметим следующие особенности полученных результатов:

1. Из соотношений (3.16)-(3.19) хорошо видна "цена" точности статистического моделирования. Повышение точности в m раз требует увеличения количества опытов в m2 раз.

2. Определяемое по (3.17), (3.19) количество опытов не гарантирует тр е- буемую точность | доп.. В строгом смысле никакое конечное количество опытов не может обеспечить такой гарантии, так как, с одной стор оны, соотношения (3.16)-(3.19) соответствуют определенной доверительной вероятности Pд <1, и с другой стороны, все полученные результаты основаны на теоретических соотношениях, справедливых для конечных n только с некоторой вероятностью.

3. В формулах (3.16)-(3.17) употребляется значение истинной вероятности pА, которое в рассматриваемой задаче заведомо неизвестно. В фо рмулах (3.18), (3.19) применяется значение дисперсии Dx, которое также естественно предположить неизвестным. Следовательно, прямое использование соо тношений (3.16)-(3.19) невозможно.

На практике эта проблема решается двумя способами.

Наиболее простой состоит в подстановке в (3.17) и (3.19) некоторых возможных значений pА и Dx, которые позволяют получить точность не хуже требуемой.

Для

задачи

оценки

ятности

при фиксированной

доп. зависимость

n треб.(p А)

имеет максимум при p А=0,5 (рис. 19). Следовательно, при выборе априорного значения p А=0,5 и в соответствии с (3.17) будет проведено

0,25 2

nтреб. 2доп. д опытов.

В задаче оценки математического ожидания для Dx априорно принимается некоторая экспертная оценка, соответствующая наибольшему ее во з- можному значению в рассматриваемой задаче.

При таком способе использования (3.17) и (3.19) для любого окончательного результата будет обеспечена точность не хуже заданной. Недостаток этого способа состоит в том, что трудоемкость эксперимента оказывае тся завышенной. Так например, если истинное значение p А=0,9, nтреб. окажется

завышенным в 0,250,09 2,8 раза.

Если трудоемкость эксперимента имеет существенное значение, прим е- няются итерационные алгоритмы получения оценок. Идея итерацио нных алгоритмов состоит в том, что определение точности и требуемого количес т- ва опытов проводится в ходе эксперимента на основе получаемых оценок искомых параметров.

Укрупненная блок-схема простейшего итерационного алгоритма пр иведена на рис. 20. Для задачи оценки вероятности алгоритм предусматривает:

1. Проведение начальной серии опытов объемом n и регистрацию коли-

чества случаев появления события A nА. 2. Вычисление оценки вероятности:

p

h

nА

.

 

 

 

 

 

А

 

n

n

 

 

 

 

 

 

 

3. Получение

оценки

требуемого

количества опытов:

2 p 1 p

n

 

 

д

А

А

.

 

 

 

 

треб.

 

 

2

 

 

 

 

 

 

 

 

 

 

доп.

 

 

4. Проведение дополнительной се-

рии опытов объемом

n '=n*трееб – n и

регистрацию количества случаев появления события A n'А.

5. Уточнение оценки вероятности:

p

 

nА n'А

.

 

А

 

n + n'

 

 

64

6. Оформление окончательных результатов.

Для задачи оценки математического ожидания случайной величины x предусматривается:

1. Проведение начальной серии опытов объемом n и накопление сумм:

n

 

n

 

Sx xi ,

S

2 xi2

,

i 1

x

i 1

 

 

 

где xi - реализации случайной величины x в отдельных опытах.

2. Вычисление оценок математического ожидания m*x и дисперсии D*x:

 

 

m

Sx

 

,

D

 

 

Sx2

 

 

m 2

.

(3.20)

 

 

x

 

 

n

 

 

 

x

 

n 1

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. Получение оценки требуемого количества опытов:

 

 

 

 

 

n

 

 

2 D

 

 

 

 

 

 

 

 

 

 

 

 

д

x

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

треб.

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доп.

 

 

 

 

 

 

 

4. Проведение дополнительной серии опытов объемом n'=n*трееб – n и

накопление сумм:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sx'

 

 

nтреб.

 

 

' 2

 

 

 

 

 

 

 

nтреб.

 

 

Sx xi ,

S

S

2

 

 

xi2 .

 

 

 

 

i n 1

 

 

x

 

 

x

 

 

 

 

i n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5. Уточнение оценок математического ожидания m*x

и дисперсии D*x:

mx

 

Sx'

 

, Dx

 

 

Sx' 2

 

 

mx 2 .

 

 

 

n

n' 1

 

 

 

n n'

 

 

 

 

 

 

 

 

6. Оформление окончательных результатов.

Отметим, что использование для оценки дисперсии соотношения (3.20), эквивалентного (3.9), исключает необходимость хранения всей получаемой в ходе эксперимента выборки значений x 1 ,x 2 ,…,xn ,… и снижает требования к объему памяти применяемых вычислительных средств.

Рассмотренный способ получения оценок на основе итерационных а л- горитмов обеспечивает некоторое снижение трудоемкости статистического моделирования, но также не свободен от недостатков.

Основная проблема здесь связана с тем, что результаты проводимых серий опытов складываются случайным образом и при конечных n возможны следующие эффекты:

1. Выборочный закон распределения может существенно отличаться от нормального.

65