Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Украинская инженерно-педагогическая академия

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Книга_5.doc

Скачиваний:

Добавлен:

05.05.2019

Размер:

178.18 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 33

5.4. Метод послідовних наближень у просторі функцій

(метод ітерацій за критерієм)

Головна ідея у попередньому методі була пов’язана із знаходженням оптимальної стаціонарної стратегії N для нескінченого планового періоду за допомогою аналіз у ряду зростаючих значень n. Навпаки, ідея методу, що описується нижче, полягає у послідовному наближенні до значення функції f в екстремальному рівнянні. Відповідно процес має назву методу ітерацій за критерієм.

Пускай – початкове обране значення f. Метод полягає у побудові послідовності наближень на основі рекурентного співвідношення:

(5.18)

де – пробне значення f на ітерації n. [Якщо метою оптимізації в екстремальному рівнянні є досягнення максимуму, то у вираз (5.18) вносяться відповідні зміни]. Далі приводиться приклад рішення задачі за допомогою цього методу.

Хоча алгоритм (5.18) чітко сформульований, виникають три питання відповідно його застосовності:

1) Чи завжди значення прагне до того f, що задовольняє екстремальне рівняння?

2) Якщо завжди, то чи існує таке кінцеве n, для якого дорівнює f ?

3) Якщо у відповідності до (5.18) на двох ітераціях підряд обране одне й те саме k, то чи є воно оптимальним?

Для того, щоб відповісти на всі ці питання, припустимо, , що всі . Якщо прийняти , то можна довести, що , отже сукупність уявить собою монотонно зростаючу послідовність наближень. Тоді, при достатньо великому n, стане дуже близьким до оптимального значення f. Більш того, деяка альтернатива може бути обрана у якості значення правої частини (5.18), на двох послідовних ітераціях, але вона не обов’язково є оптимальною для нескінченого планового періоду. [Якщо рішення для моделі відновлення знаходиться методом наближення у просторі функцій, то ми ніколи не повертаємося до раніше відкинутої стратегії].

5.5. Метод послідовних наближень у просторі стратегій (метод ітерацій за стратегіями)

Припустимо, що при обчисленні значення правої частини рекурентного співвідношення (5.18) попереднього розділу виявляється стратегія, значно краща, ніж та, котра відповідає . Це означає, що вибір знайденої стратегії у випадку безпосередньо прийнятого рішення є поліпшенням у порівнянні з вибором стратегії що була розглянута раніше. Тоді досить ймовірно – і це дійсно виявляється правильним, – що використання нової стратегії протягом усього нескінченного планового періоду дасть навіть кращі результати, ніж вибір цієї стратегії тільки у випадку безпосередньо прийнятого рішення. Отже, можна обчислити як інтегральні дисконтовані витрати при багаторазовому повторному виборі нової стратегії.

Цей процес відомий за назвою наближення у просторі стратегій або методу ітерацій за стратегіями, оскільки на кожній ітерації розглядається нова стаціонарна стратегія, що перевіряється, для нескінченного планового періоду.

Виникаюча послідовність є такою, що монотонно убуває, з п на кожній ітерації відбувається визначене поліпшення; отже, ми ніколи не повертаємося до одного разу відкинутої стратегії. Оскільки є кінцеве число N різних стаціонарних стратегій, розрахунки при даному підході повинні завершуватися за кінцеве число ітерацій. Як тільки якась стратегія залишається оптимальною протягом двох ітерацій підряд, обчислення можна припинити, причому дорівнює оптимальному , що задовольняє екстремальному рівнянню. Як побачить читач, за отримання кінцевого алгоритму приходиться платити збільшенням обсягу розрахунків по визначенню для нової стратегії на кожній ітерації.

Алгоритм має такий вигляд:

Крок 1. Виберемо довільну вихідну стратегію і приймемо п = 0.

Крок 2. Для заданої спробної стратегії k обчислимо інтегральні дисконтовані витрати протягом нескінченного планового періоду:

(5.19)

Крок 3. Перевіримо можливість подальших поліпшень, обчисливши

(5.20)

тобто вибравши .

Крок 4. Припинимо розрахунки, якщо

У супротивному випадку змінимо стратегію на . Перейдемо від ітерації п до ітерації (п + 1) і звернемося до виконання кроку 2 на основі нової стратегії, що перевіряється.

Відзначимо, що якщо гарні спробні значення виходять безпосередньо в процесі апроксимації у просторі функцій, то при описуваному методі ці значення повинні обчислюватися додатково, по формулі (5.19). Відзначимо також, що умова припинення розрахунків на кроці 4 виконується у тому випадку, коли – той же варіант, що розглядався на кроці 2. Іншими словами, розрахунки припиняються, якщо не змінюється протягом двох ітерацій підряд. [Як потрібно перетворити (5.20), якщо метою оптимізації на основі екстремального рівняння є максимізація?].

Запитання для самоконтролю

Що таке нескінченний плановий період ?
В чому полягає модель з нескінченним плановим періодом?
Сформулюйте теорему про довжину планового періоду для моделі відновлення
.В чому полягає ідея у послідовному наближенні до значення функції f в екстремальному рівнянні ?
Що таке вибір стратегії ?

<<< < Предыдущая 1 23 / 33

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
05.05.2019221.18 Кб9Книга_13.doc
#
05.05.2019536.06 Кб10Книга_14.doc
#
05.05.2019733.18 Кб15Книга_16.doc
#
05.05.2019278.02 Кб13Книга_3.doc
#
05.05.2019622.59 Кб11Книга_4.doc
#
05.05.2019178.18 Кб9Книга_5.doc
#
05.05.2019596.48 Кб18Книга_6.doc
#
05.05.2019910.85 Кб18Книга_7.doc
#
05.05.2019655.36 Кб12Книга_8.doc
#
05.05.2019807.94 Кб14Книга_9.doc
#
03.09.2019445.84 Кб11ковалев записка.docx