Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Оптимізаційны методи та моделі.doc
Скачиваний:
5
Добавлен:
01.07.2025
Размер:
5.7 Mб
Скачать

7.5. Оцінка точності характеристик, отриманих методом статистичних випробувань. Необхідна кількість реалізацій

Метод статистичних випробовувань (метод Монте-Карло), як і будь-який чисельний метод, є методом наближеним. Отримані результати при цьому носять випадковий характер. Оцінки цих результатів обчислюються як середні значення по великій кількості іспитів.

Метод статистичних випробувань оснований на граничних теоремах теорії їмовірностей, які стверджують, що при великій кількості іспитів N частота дії наближається до її імовірності, а середнє арифметичне значення випадкової величини, що спостерігається, наближається до її математичного сподівання. Згідно з теоремою Чебишова:

,

де mx математичне сподівання випадкової величини Х;

xi значення випадкової величини в і-й реалізації;

N — загальна кількість реалізацій (іспитів);

 і  — довільні малі додатні числа.

Користуючись методом статистичних випробувань і провівши велику кількість іспитів (реалізацій), наближено заміняємо імовірність події її частотою, а математичне сподівання — середнім арифметичним. При цьому виникають питання:

  1. Наскільки великою буде помилка, що виникає від такої наближеної зміни?

2. Скільки іспитів (реалізацій) необхідно провести, щоб помилка не перебільшувала допустимої(заданої)? Іншими словами, виникає питання про оцінку точності характеристик випадкового явища, отриманого методом Монте-Карло.

Припустимо, що після моделювання досліджуваного випадкового процесу замість математичного сподівання ми прийняли середнє арифметичне Х з N іспитів:

Нас цікавить, з якою імовірністю можна стверджувати, що допущена помилка не перебільшить деякої величини , де  — точність обчислень. Позначимо цю імовірність через :

.

З цього запису видно, що з імовірністю  дійсне, невідоме нам значення mx буде міститися в межах Х-, Х+.

В теорії ймовірностей  називають довірчою імовірністю, межі Х-, Х+ — довірчими межами, а інтервал Х — довірчим інтервалом.

Слід зауважити, що довірчий інтервал характеризує точність результату, а довірча імовірність — надійність або вірогідність.

При оцінці точності характеристик випадкового явища, отриманого методом Монте-Карло, будемо базуватися на центральній граничній теоремі теорії ймовірностей. Згідно з цією теореми при великій кількості іспитів N їх середній результат (частота р* подія А або середнє арифметичне m спостерігаємих значень випадкової величини Х) розподіляється наближено за нормальним законом. Наведемо відповідні формули.

ЗАКОН РОЗПОДІЛУ ЧАСТОТИ ПОДІЇ ПРИ ВЕЛИКІЙ КІЛЬКОСТІ ВИРПРОБУВАНЬ

Якщо проводиться велика кількість N незалежних іспитів, в кожному з яких подія А з’являється з імовірністю р, то частота події А

,

де L — число появ подій А в N іспитах розподіляється наближено за нормальним законом з математичним сподіванням

,

і середнім квадратичним відхиленням

.

Доведемо це положення.

Позначимо через хі величину, яка дорівнює одиниці, якщо на і-му іспиті відбулася подія А; і дорівнює нулю, якщо подія А не відбулася. Загальна кількість іспитів L, при яких подія А відбулася, дорівнює

Подія А з’являється з імовірністю р, тобто

Математичне сподівання частоти дорівнює:

Дисперсія частоти

.

Звідси

Тут ми використали той факт, що для кожної величини хі її математичне сподівання дорівнює:

,

а дисперсія

.

ЗАКОН РОЗПОДІЛУ СЕРЕДНЬОГО АРИФМЕТИЧНОГО ПРИ ВЕЛИКІЙ КІЛЬКОСТІ ВИРПРОБУВАНЬ

Якщо проводиться велика кількість N незалежних випрбувань, в яких випадково величина Х приймає значення х1, х2,…,хN, то середнє арифметичне цих значень

розподіляються наближено за нормальним законом з математичним сподіванням

,

і середнім квадратичним відхиленням

де mx, бх математичне сподівання і середнє квадратичне відхилення випадкової величини Х.

Користуючись цими результатами можна поставити і розв’язати кілька задач, що відносяться до точності методу Монте-Карло.

ЗАДАЧА 1. Проведемо N незалежних випрбувань (реалізацій), в кожному з яких подія А з’являється з імовірність р. В результаті цих випрбувань отримана частота події А. Знайти імовірність того, що частота відрізняється від імовірності р не більше, ніж на задану величину

Розв’язок. Вважаємо число N досить великим для того, щоб припустити, що частота розподілена за нормальим законом з характеристиками

.

На основі граничних теорем теорії імовірностей маємо:

де Ф(Х) — функція Лапласа.

ПРИКЛАД 1. Проведено N=1000 незалежних випрбувань, в кожному з яких подія А з’явилась з імовірністю р=0,3. Знайти імовірність того, що отримана при цьому частота р* події А відрізняється від імовірності менше, ніж на .

Розв’язок. р = 0,3; N = 1000; .

За вище наведеною формулою маємо:

Якщо імовірність р події А нам відома, ми можемо оцінити точність визначення цієї імовірності за частотою р* і залежність цієї точності від кількості випрбувань N. Однак на практиці імовірність p нам не відома, та й самі іспити ми проводимо для її визначення.

Для оцінки точності метода Монте-Карло можна замість p підставити частоту р* події А в серії випробувань.

Поставимо тепер обернену задачу: скільки випрбувань N необхідно провести для того, щоб з впевненістю очікувати, що частота відхилиться від імовірності не більше, ніж на задану величину.

ЗАДАЧА 2. Проводиться ряд незалежних випрбувань, в кожному з яких подія А з’являється з імовірністю р. Якою повинна бути кількість реалізацій для того, щоб з заданою, досить високою імовірністю можна було очікувати, що частота р* події А відхилиться від її імовірності р менше ніж на .

Розв’язок. Задамо досить близьке до одиниці значення імовірності — довірчу імовірність. Прирівняємо до цього значення праву частину рівності

Розв’яжемо це рівняння відносно N:

де (х) — функція, обернена до функції Лапласа. Звідси отримуємо формулу для визначення кількості випрбувань N:

Для обчислення N зручно мати в розпорядженні таблицю значень функції (табл. 7.1)

Таблиця 7.1

0,80

0,85

0,90

0,95

0,96

0,97

0,98

0,99

0,995

0,999

1,64

2,08

2,71

3,84

4,21

4,49

5,43

6,61

7,90

10,9

ПРИКЛАД 2. Проводиться ряд незалежних випрбувань (реалізацій), в кожному з яких реєструється поява або не поява події А, імовірність якої р = 0,2. Скільки випрбувань необхідно зробити для того, щоб частота р* події А з імовірністю = 0,95 відрізнялась від p не більше, ніж на =0,01?

Розв’язок. За таблицею 6. 1 для =0,95 знаходимо

Тепер

,

тобто для надійного (з довірчою імовірністю 0,95) визначення р = 0,2 за частотою з похибкою не більше 0,01 (тобто в межах 0,19–0,21) необхідно зробити більше 6000 реалізацій.

ЗАДАЧА 3. проводиться N незалежних випрбувань, в кожному з яких спостерігається значення випадкової величини Х, що має математичне сподівання і середнє квадратичне відхилення . Обчислюється середнє арифметичне спостерігаємих значень випадкової величини Х:

,

Знайти імовірність того, що середнє арифметичне відхилиться від математичного сподівання менше, ніж на задану величину :

.

Розв’язок. На основі центральної граничної теореми, вважаючи кількість реализацій великою, можна стверджувати, що випадкова величина Х розподілена нормально з характеристиками

і

Звідси

,

.

ПРИКЛАД 3. Проводиться N = 1600 незалежних випрбувань, в яких спостерігається значення випадкової величини Х з характеристиками = 2; = 1. Знайти імовірність того, що середнє арифметичне спостерігаємих значень випадкової величини Х буде відрізнятись від її математичного сподівання менше ніж на 0,05, тобто буде обмежене інтервалом 1,95–2,05.

Розв’язок. Користуючись виведеними раніше формулами і таблицею функції Лапласа, знаходимо:

.

Відмітимо, що для оцінки точності визначення математичного сподівання методом Монте-Карло не потрібно наперед знати саме математичне сподівання випадкової величини, однак повинно бути відоме її середнє квадратичне відхилення, яке входить в праву частину формули.

Звичайно на практиці, приступаючи до моделювання випадкового явища методом Монте-Карло, ми не знаємо ні математичного сподівання, ні середнього квадратичного відхилення випадкової величини, яка нас цікавить. Однак для наближеної оцінки точності моделювання можна в першому наближенні замість скористатись її статистичною оцінкою, стриманою в серії з N реалізацій:

,

де — середнє арифметичне.

Якщо точність виявиться недостатньою, слід продовжити іспити, вносячи до середнього квадратичного відповідні поправки по мірі зростання кількості реалізацій.

ЗАДАЧА 4. Проводиться ряд незалежних випрбувань над випадковою величиною Х. Скільки потрібно зробити реалізацій, щоб з заданою довірчою імовірністю очікувати, що середнє арифметичне спостерігаємих значень випадкової величини відхилиться від її математичного сподівання не більше, ніж на ?

Розв’язок. Скористаємося формулою

.

Праву частину прирівнюємо до заданого :Ф

.

Розв’яжемо рівняння відносно N:

Тут — обернена функція Лапласа

ПРИКЛАД 4. Проводяться випрбування над випадковою величиною з метою наближеного визначення її математичного сподівання . Середнє квадратичне відхилення випадкової величини Х, оцінене попередньо (за першою серією досліджень), наближено дорівнює .

Яка кількість іспитів N необхідна для того, щоб середнє арифметичне Х спостережених значень випадкової величини з довірчою імовірністю відрізнялось від її математичного сподівання не більше ніж на ?

Розв’язок. Користуючись таблицею значень оберненої функції для знаходимо:

Для зручності користування і з методичних міркувань всі формули зведемо до табл. 7.2.

Таблиця 7.2

Оцінка отриманих результатів статистичного моделювання

Оцінка частоти р*

Задані:

Визначити

Оцінка МО

Задані:

Визначити

Визначення необхідної кількості випрбувань (реалізацій на ЕОМ)

Визначення N при оцінці частоти р*

Задані:

Визначити N

Визначення N при оцінці МО

Задані:

Визначити N

ЗАГАЛЬНА СХЕМА ФІКСАЦІЇ РЕЗУЛЬТАТІВ МОДЕЛЮВАННЯ

Розглянемо модель, призначену для дослідження поведінки системи на інтервалі часу . В загальному випадку критерієм інтерпретації результатів моделювання є нестаціонарний n-вимірний випадковий процес.

.

Припускаємо, що стан моделюємої системи перевіряється через кожні сек. При цьому проводиться обчислення значень , (j=0, 1, 2….,k) критерія . Таким чином, про властивості випадкового процесу судять за властивостями випадкової послідовності або інакше кажучи, за властивостями R-вимірного вектора

Робота системи на інтервалі моделюється N — кратно з використанням незалежних реалізацій зовнішніх випадкових впливів. При цьому отримують N незалежних реалізацій уі, (і=1, 2,…, N) вектора .

Фіксація і статистична обробка данних моделювання визначають схему програмної побудови моделі. В загальному випадку програма містить три цикла (рис. 7.11).

1 Підготовка до моделювання чергового варіанту системи

Рис. 7.11

Внутрішній цикл (символи 5–8) дозволяє отримати послідовність значень критерія в момент часу

Роботу моделі на інтервалі часу будемо надалі називати прогоном моделі (реалізацією на ЕМО).

В наступному циклі, який вміщує крім попереднього символи 3,4,9,10 організується N-кратний повтор прогона, що дозволяє після відповідної статистичної обробки результатів (символ 11) робити висновок про усереднені характеристики моделюємого варіанту системи.

На різних прогонах використовують незалежні реалізації базових і зовнішніх впливів. При цьому виявляються незалежними реалізації yi (t) i yj (t), i  j критерія інтерпретації. Закінчення варіанта може визначатись не тільки заданою кількістю прогонів (реалізацій), але й заданою точністю результатів (послідовний аналіз).

Зовнішній цикл охоплює обидва попередніх і включає додатково символи 1, 2, 11, 12, які керують послідовністю моделювання варіантів системи.

Дана схема дозволяє вести статистичну обробку в найбільш загальному випадку при нестаціонарному критерії n (t).

ОСОБЛИВОСТІ СТАТИСТИЧНИХ МЕТОДІВ, ЯКІ ВИКОРИСТОВУЮТЬСЯ ПРИ МОДЕЛЮВАННІ

Методи обробки результатів моделювання, які застосовуються на практиці, складають невелику частину арсеналу математичної статистики. При виборі методів відіграють роль три основних особливості машинного експерименту, який виконується при моделюванні:

1. Машинний експеримент звичайно швидший і дешевший натурного. Доступні при моделюванні великі виборки дозволяють дати кількісну оцінку показників системи, але перетворюють в проблему зберігання необроблених результатів моделювання. Цю проблему обходять, використовуючи рекурентні алгоритми і обчислюючи оцінки по ходу моделювання (великий об’єм виборки дає можливість користуватись при цьому простим асимптотичними формулами).

2. Друга особливість моделювання пов’язана з «непередбаченістю» обробляємих результатів. Досліджуємі системи настільки складні і можуть вивчатись в таких незвичайних режимах, що апріорне судження про тип оцінюваного розподілу часто неможливе: необхідна інформація отримується саме в ході моделювання. Тому при моделюванні широко використовуються непараметричні оцінки і оцінки числових характеристик (моментів), а параметризація оцінок розподілу носить характер формальної апроксимації.

3. Третя особливість пов’язана з блочним моделюванням. Роздільне дослідження блоків (часткове моделювання) пов’язане з програмною імітацією вихідних впливів для однієї моделі по оцінкам критеріїв, отриманих на іншій частковій моделі.

Якщо ЕОМ не дозволяє скористатися для цього записаними у зовнішньому накопичувачі реалізаціями критеріїв, слід представляти оцінювані характеристики в формі, яка зручна для побудови алгоритма імітації, або безпосередньо оцінювати параметри цього алгоритма.