Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Книга_5.doc
Скачиваний:
3
Добавлен:
05.05.2019
Размер:
178.18 Кб
Скачать

5.4. Метод послідовних наближень у просторі функцій

(метод ітерацій за критерієм)

Головна ідея у попередньому методі була пов’язана із знаходженням оптимальної стаціонарної стратегії N для нескінченого планового періоду за допомогою аналіз у ряду зростаючих значень n. Навпаки, ідея методу, що описується нижче, полягає у послідовному наближенні до значення функції f в екстремальному рівнянні. Відповідно процес має назву методу ітерацій за критерієм.

Пускай – початкове обране значення f. Метод полягає у побудові послідовності наближень на основі рекурентного співвідношення:

(5.18)

де – пробне значення f на ітерації n. [Якщо метою оптимізації в екстремальному рівнянні є досягнення максимуму, то у вираз (5.18) вносяться відповідні зміни]. Далі приводиться приклад рішення задачі за допомогою цього методу.

Хоча алгоритм (5.18) чітко сформульований, виникають три питання відповідно його застосовності:

1) Чи завжди значення прагне до того f, що задовольняє екстремальне рівняння?

2) Якщо завжди, то чи існує таке кінцеве n, для якого дорівнює f ?

3) Якщо у відповідності до (5.18) на двох ітераціях підряд обране одне й те саме k, то чи є воно оптимальним?

Для того, щоб відповісти на всі ці питання, припустимо, , що всі . Якщо прийняти , то можна довести, що , отже сукупність уявить собою монотонно зростаючу послідовність наближень. Тоді, при достатньо великому n, стане дуже близьким до оптимального значення f. Більш того, деяка альтернатива може бути обрана у якості значення правої частини (5.18), на двох послідовних ітераціях, але вона не обов’язково є оптимальною для нескінченого планового періоду. [Якщо рішення для моделі відновлення знаходиться методом наближення у просторі функцій, то ми ніколи не повертаємося до раніше відкинутої стратегії].

5.5. Метод послідовних наближень у просторі стратегій (метод ітерацій за стратегіями)

Припустимо, що при обчисленні значення правої частини рекурентного співвідношення (5.18) попереднього розділу виявляється стратегія, значно краща, ніж та, котра відповідає . Це означає, що вибір знайденої стратегії у випадку безпосередньо прийнятого рішення є поліпшенням у порівнянні з вибором стратегії що була розглянута раніше. Тоді досить ймовірно – і це дійсно виявляється правильним, – що використання нової стратегії протягом усього нескінченного планового періоду дасть навіть кращі результати, ніж вибір цієї стратегії тільки у випадку безпосередньо прийнятого рішення. Отже, можна обчислити як інтегральні дисконтовані витрати при багаторазовому повторному виборі нової стратегії.

Цей процес відомий за назвою наближення у просторі стратегій або методу ітерацій за стратегіями, оскільки на кожній ітерації розглядається нова стаціонарна стратегія, що перевіряється, для нескінченного планового періоду.

Виникаюча послідовність є такою, що монотонно убуває, з п на кожній ітерації відбувається визначене поліпшення; отже, ми ніколи не повертаємося до одного разу відкинутої стратегії. Оскільки є кінцеве число N різних стаціонарних стратегій, розрахунки при даному підході повинні завершуватися за кінцеве число ітерацій. Як тільки якась стратегія залишається оптимальною протягом двох ітерацій підряд, обчислення можна припинити, причому дорівнює оптимальному , що задовольняє екстремальному рівнянню. Як побачить читач, за отримання кінцевого алгоритму приходиться платити збільшенням обсягу розрахунків по визначенню для нової стратегії на кожній ітерації.

Алгоритм має такий вигляд:

Крок 1. Виберемо довільну вихідну стратегію і приймемо п = 0.

Крок 2. Для заданої спробної стратегії k обчислимо інтегральні дисконтовані витрати протягом нескінченного планового періоду:

(5.19)

Крок 3. Перевіримо можливість подальших поліпшень, обчисливши

(5.20)

тобто вибравши .

Крок 4. Припинимо розрахунки, якщо

У супротивному випадку змінимо стратегію на . Перейдемо від ітерації п до ітерації (п + 1) і звернемося до виконання кроку 2 на основі нової стратегії, що перевіряється.

Відзначимо, що якщо гарні спробні значення виходять безпосередньо в процесі апроксимації у просторі функцій, то при описуваному методі ці значення повинні обчислюватися додатково, по формулі (5.19). Відзначимо також, що умова припинення розрахунків на кроці 4 виконується у тому випадку, коли – той же варіант, що розглядався на кроці 2. Іншими словами, розрахунки припиняються, якщо не змінюється протягом двох ітерацій підряд. [Як потрібно перетворити (5.20), якщо метою оптимізації на основі екстремального рівняння є максимізація?].

  • Запитання для самоконтролю

  1. Що таке нескінченний плановий період ?

  2. В чому полягає модель з нескінченним плановим періодом?

  3. Сформулюйте теорему про довжину планового періоду для моделі відновлення

  4. .В чому полягає ідея у послідовному наближенні до значення функції f в екстремальному рівнянні ?

  5. Що таке вибір стратегії ?

76

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]