Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математическое и имитационное моделирование экономических процессов..pdf
Скачиваний:
65
Добавлен:
05.02.2023
Размер:
5.16 Mб
Скачать

133

Тема 9. Метод Монте-Карло и проверка статистических гипотез

Определение: Методом Монте-Карло называется численные методы решения математических задач при помощи моделирования случайных величин.

Название “Монте-Карло” произошло от города “Монте-Карло”, известного своими казино, т.к. простейшим прибором для генерирования случайных чисел служит игральная рулетка.

Статистические испытания по методу Монте-Карло представляют собой простейшее имитационное моделирование при полном отсутствии каких-либо правил поведения. Получение выборок по методу Монте-Карло - основной принцип компьютерного моделирования систем, содержащих стохастические или вероятностные элементы. Зарождение метода связано с работой фон Неймана и Улана в конце 1940-х гг., когда они ввели для него название «Монте-Карло» и применили его к решению некоторых задач экранирования ядерных излучений. Этот математический метод был известен и ранее, но свое второе рождение нашел в Лос-Аламосе в закрытых работах по ядерной технике, которые велись под кодовым обозначением «Монте-Карло». Применение метода оказалось настолько успешным, что он получил распространение и в других областях, в частности в экономике.

Поэтому многим специалистам термин «метод Монте-Карло» иногда представляется синонимом термина «имитационное моделирование», что в общем случае неверно. Имитационное моделирование - это более широкое понятие, и метод Монте-Карло является важным, но далеко не единственным методическим компонентом имитационного моделирования.

Согласно методу Монте-Карло проектировщик может моделировать работу тысячи сложных систем, управляющих тысячами разновидностей подобных процессов, и исследовать поведение всей группы, обрабатывая статистические данные. Другой способ применения этого метода заключается в том, чтобы моделировать поведение системы управления на очень большом промежутке модельного времени (несколько лет), причем астрономическое время выполнения моделирующей программы на компьютере может составить доли секунды. Рассмотрим метод Монте-Карло подробнее.

В различных задачах, встречающихся при создании сложных систем, могут использоваться величины, значения которых определяются случайным образом. Примерами таких величин являются:

случайные моменты времени, в которые поступают заказы на фирму;

загрузка производственных участков или служб объекта экономики;

внешние воздействия (требования или изменения законов, платежи по штрафам и

др.);

оплата банковских кредитов;

поступление средств от заказчиков;

В качестве соответствующих им переменных могут использоваться число, совокупность чисел, вектор или функция. Одной из разновидностей метода МонтеКарло при численном решении задач, включающих случайные переменные, является метод статистических испытаний, который заключается в моделировании случайных событий.

Метод Монте-Карло основан на статистических испытаниях и по природе своей является экстремальным, может применяться для решения полностью детерминированных задач, таких, как обращение матриц, решение дифференциальных уравнений в частных производных, отыскание экстремумов и численное интегрирование.

134

При вычислениях методом Монте-Карло статистические результаты получаются путем повторяющихся испытаний. Вероятность того, что эти результаты отличаются от истинных не более чем на заданную величину, есть функция количества испытаний.

В основе вычислений по методу Монте-Карло лежит случайный выбор чисел из заданного вероятностного распределения. При практических вычислениях эти числа берут из таблиц или получают путем некоторых операций, результатами которых являются псевдослучайные числа с теми же свойствами, что и числа, получаемые путем случайной выборки. Имеется большое число вычислительных алгоритмов, которые позволяют получить длинные последовательности псевдослучайных чисел.

Применение метода Монте-Карло может дать существенный эффект при моделировании развития процессов, натурное наблюдение которых нежелательно или невозможно, а другие математические методы применительно к этим процессам либо не разработаны, либо неприемлемы из-за многочисленных оговорок и допущений, которые могут привести к серьезным погрешностям или неправильным выводам. В связи с этим необходимо не только наблюдать развитие процесса в нежелательных направлениях, но и оценивать гипотезы о параметрах нежелательных ситуаций, к которым приведет такое развитие, в том числе и параметрах рисков.

Существуют различные методы проверки статистических гипотез. Наиболее широко используются на практике критерии:

• согласия

 

2

((хи-квадрат);

 

Крамера-фон Мизеса;

Колмогорова-Смирнова.

Критерий

2

предпочтителен, если объемы выборок

N , в отношении которых

 

проводится анализ, велики. Это мощное средство, если

N

> 100 значений. Однако при

анализе экономических ситуаций иногда бывает довольно трудно (или невозможно) найти 100 одинаковых процессов, развивающихся с различными исходными данными. Сложность заключается не только в том, что не бывает одинаковых объектов экономики: даже если такие объекты имеются, то к исходным данным относятся не только исходные вероятностные данные и особенности структуры объекта, но и сценарий развития процессов в этом объекте и в тех объектах внешней среды, с которыми он взаимодействует (процессы рынка, указы правительства, принятие новых законов, требования налоговых органов, платежи в бюджеты различных уровней). При относительно малых объемах выборок этот критерий вообще неприменим.

Критерий Крамера-фон Мизеса дает хорошие результаты при малых объемах выборок (при N < 10). Однако следует отметить два обстоятельства:

1)при N < 10, каким бы методом ни пользоваться, вопрос о доверительной вероятности при проверке статистической гипотезы решается плохо (эта вероятность мала при значительных размерах доверительных интервалов);

2)метод Монте-Карло используется как раз для того, чтобы недостающие данные собрать с помощью специального вычислительного статистического инструментария и компьютера.

Поэтому будем полагать, что реальные объемы выборок, которые можно получить,

находятся в пределах 10 N < 100. Как указывают многие исследователи, для указанных пределов хорошие результаты дает критерий Колмогорова-Смирнова. Он применяется в тех случаях, когда проверяемое распределение непрерывно и известны среднее значение и дисперсия проверяемой совокупности. Рассмотрим подробнее методику использования этого критерия на конкретном примере.

Пример 9.1. Предположим, что нужно проверить данные, полученные (или наблюдаемые) при использовании метода Монте-Карло и приведенные в табл. 9.1, на их соответствие распределению Пуассона.

135

Эти данные имеют следующий смысл. На отрезке времени наблюдаем случайные события, число которых равно x . Если это распределение Пуассона, то вероят

ность P{x n} того, что x n , где n - заданное число, равна

где

e

 

 

n

e

 

 

P{x n}

 

 

,

 

n!

 

 

 

=2,71828;

положительная константа, которая одновременно является и математическим ожиданием, и дисперсией.

Таблица 9.1 Данные для проверки гипотезы по критерию Колмогорова—Смирнова

 

Число

 

Наблю-

 

Наблю-

 

Теоре-

 

Наблю-

 

Теорети-

 

Абсо-

 

 

 

 

даемая

 

тическая

 

даемое

 

ческое

 

 

 

собы-

 

даемая

 

 

 

 

 

лютная

 

 

 

 

вероят-

 

вероят-

 

распреде-

 

распреде-

 

 

 

тий

 

частота

 

 

 

 

 

разность

 

 

 

 

 

 

ность

 

 

ность

 

ление

 

ление

 

 

 

 

 

1

2

 

 

3

4

5

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

315

0,619

 

 

0,571

0,619

0,571

0,048

 

1

142

0,279

 

 

0,319

0,898

0,890

0,008

 

2

40

0,078

 

 

0,089

0,976

0,979

0,003

 

3

9

0,018

 

 

0,017

0,994

0,996

0,002

 

 

4

 

2

 

0,004

 

 

0,003

 

0,998

 

0,999

 

0,001

 

 

5

 

1

 

0,002

 

 

0,001

 

1,000

 

1,000

 

0,000

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Предположим, что

 

= 0,55711. Сформулируем гипотезу в следующем виде: Не

имеется существенных различий между наблюдаемыми данными во время эксперимента и теми данными, которые должны получаться из распределения Пуассона расчетным путем

со средним значением 0,5577 и

N = 509.

 

Рассмотрим подробнее табл. 11.1. В ней строки с номерами 0,..., 5 соответствуют числу

n

наблюдаемых событий, n =0, ... , 5; столбец 1 содержит наблюдаемую частоту появления

n

событий, а столбец 2 – наблюдаемую вероятность появления n событий. В столбце 3

представлены рассчитанные по формуле значения вероятности появления n событий. Прежде всего нужно получить два интегральных распределения (фактически

приближения функций распределения). Сначала сделаем это для наблюдаемых данных: с помощью столбца 2 получим столбец 4. Затем - для теоретических данных: с помощью столбца 3 получим столбец 5.

После этих вычислений найдем абсолютные разности для всех групп значений случайной величины и с помощью столбцов 4 и 5 получим столбец 6. В последнем столбце наибольшая абсолютная разность 0,048 получается в группе, соответствующей нулевому числу событий.

Далее необходимо найти так называемое критическое значение Dextr для проверки

принятой гипотезы. Таблица критических чисел многократно переиздавалась. Критические числа в виде, удобном для выполняемой проверки, приведены в табл. 1.2. Абсолютную разность 0,048 необходимо сравнить с критическим значением, найденным

по табл. 9.2.

 

 

 

 

 

 

 

 

 

При N =509 и значении индекса критического числа D

= 0,05 получается

критическое значение

 

 

 

 

 

 

 

 

 

D

 

1,

36

 

 

1,36

= 0,0603.

 

 

 

 

 

 

extr

 

 

N

509

 

 

 

 

 

 

 

 

 

 

 

 

 

 

136

 

 

 

 

 

 

 

 

Поскольку наибольшая разность 0,048

Dextr

, то не отказываемся от гипотезы о том,

что экспериментальное распределение - пуассоновское. Проверка статистических гипотез

о соответствии «событий явлению» и «явлений поведению» дает математический

инструмент для оценки «рискованного поведения» исследуемого процесса.

 

 

 

 

 

Таблица 9.2

 

 

 

 

 

 

 

Критические числа Колмогорова-Смирнова

 

 

 

 

 

Степень

Проверка единичной

 

Проверка двух выборок **

 

 

 

свободы

выборки*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

D

D

D

 

 

 

D

 

 

 

D

 

 

 

 

0.10

0.05

0.01

 

 

0.05

 

 

 

 

0.01

 

 

1

0,950

0,975

0,995

 

 

 

 

 

 

 

 

 

2

0,776

0,842

0,929

 

 

 

 

 

 

 

 

 

3

0,642

0,708

0,828

 

 

 

 

 

 

 

 

 

4

0,564

0,624

0,733

 

 

1,000

 

 

 

 

1,000

 

 

5

0,510

0,565

0,669

 

 

1,000

 

 

 

 

1,000

 

 

6

0,470

0,521

0,618

 

 

0,833

 

 

 

 

1,000

 

 

7

0,438

0,486

0,577

 

 

0,857

 

 

 

 

0,857

 

 

8

0,411

0,457

0,543

 

 

0,750

 

 

 

 

0,875

 

 

9

0,388

0,432

0,514

 

 

0,668

 

 

 

 

0,778

 

 

10

0,368

0,410

0,490

 

 

0,700

 

 

 

 

0,800

 

 

11

0,352

0,391

0,468

 

 

0,636

 

 

 

 

0,727

 

 

12

0,338

0,375

0,450

 

 

0,583

 

 

 

 

0,667

 

 

13

0,325

0,361

0,433

 

 

0,538

 

 

 

 

0,692

 

 

14

0,314

0,349

0,418

 

 

0,571

 

 

 

 

0,643

 

 

15

0,304

0,338

0,404

 

 

 

0,533

 

 

 

 

0,600

 

 

16

0,295

0,328

0,392

 

 

 

0,500

 

 

 

 

0,625

 

 

17

0,286

0,318

0,381

 

 

 

0,471

 

 

 

 

0,588

 

 

18

0,278

0,309

0,371

 

 

 

0,500

 

 

 

 

0,556

 

 

19

0,272

0,301

0,363

 

 

 

0,474

 

 

 

 

0,526

 

 

20

0,264

0,294

0,356

 

 

 

0,450

 

 

 

 

0,550

 

 

25

0,240

0,270

0,320

 

 

 

0,400

 

 

 

 

0,480

 

 

30

0,220

0,240

0,290

 

 

 

0,370

 

 

 

 

0,430

 

 

35

0,210

0,230

0,270

 

 

 

0,340

 

 

 

 

0,390

 

 

Более 35

1, 22

1, 36

1,63

 

 

N N

2

 

 

N

N

2

 

 

 

 

1, 36

1

 

1, 63

1

 

 

 

N

N

N

N N

 

 

N N

 

 

 

 

 

 

2

 

 

 

2

 

 

 

 

 

 

 

 

1

 

 

 

 

1

 

* Применяется для оценки степени близости выборочных значений к теоретическому

 

 

 

распределению. Здесь N – объем выборки.

 

 

 

 

 

 

 

 

 

 

 

** Применяется для определения принадлежности двух выборок объемами

N1 и

N 2

одному

и тому же распределению.

 

 

 

 

 

 

 

 

 

 

 

 

 

При малых размерах выборки N N

N

2

.

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]