
- •Базайкин в.И. Никитина т.А. Математическое моделирование экономических систем
- •Содержание
- •Введение
- •1. Оптимизация выпуска продукции предприятия при постоянстве эластичностей рыночной цены и себестоимости по объёму выпуска
- •1.1. Постановка задачи
- •1.2. Построение модели доходов и издержек
- •1.3. Определение оптимального объёма выпуска продукции
- •2. Модель Эджворта замкнутой системы двух предприятий
- •2.1. Постановка задачи
- •2.2. Некоторые линии в прямоугольнике Эджворта
- •2.3. Некоторые задачи для модели Эджворта
- •3. Задачи, продолжающие тему линейного программирования
- •3.1. Задача об оптимальных назначениях
- •3.2. Модель грузоперевозок региональной транспортной компании
- •4. Элементы динамического программирования
- •4.1. Постановка задачи
- •4.2. Принцип и уравнение Беллмана
- •4.3. Решение примера
- •5. Классическая модель макроэкономического равновесия
- •5.1. Основные предпосылки
- •5.2. Равновесие на рынках
- •5.3. Модель в целом
- •6. Модель Дж. Кейнса макроэкономического равновесия
- •6.1. Основные предпосылки
- •6.2. Описание рынков
- •6.3. Модель Кейнса в целом и разрешение задачи для неё
- •7. Аксессуары модели Кейнса
- •7.1. Эффективный спрос и равновесная цена на долгосрочный период
- •7.2. Мультипликатор доходов
- •7.3. Акселератор доходов
- •8. Модель управления экономикой через основные производственные фонды
- •8.1. Постановка задачи
- •8.2. Решение задачи
- •8.3. Доля потребления конечного продукта; пример
- •9. Римский клуб и его доклады
- •9.1. Обзор основных докладов Римскому клубу
- •9.2. Аурелио Печчеи: элементы биографии
- •Список литературы
4. Элементы динамического программирования
4.1. Постановка задачи
Существует класс задач, в которых требуется найти максимум или минимум некоторой величины при заданных ограничениях, решение которых естественно разделяется на ряд однородных этапов. В отличие от задач линейного программирования здесь необходим какой-то принцип, согласовывающий оптимальное решение на каждом этапе с оптимальным решением задачи в целом. Для содержательных задач такого рода формулируются модели, для моделей ставятся задачи, методы решения которых составляют тему динамического программирования.
Рассмотрим пример. Самолёт авиатранспортной компании загружается промышленным оборудованием 3 типов. Каждый предмет оборудования i-го типа (таблица 1) имеет вес wi (в тоннах) и стоимость vi (в тыс. рублей). Максимальная грузоподъёмность самолёта равна 5 тоннам. Какова наибольшая стоимость груза, которую может перевезти самолёт за один рейс?
Таблица1
I |
wi |
vi |
1 |
2 |
65 |
2 |
3 |
80 |
3 |
1 |
30 |
Это простой пример, он решается перебором вариантов. Ясно, что наиболее выгодно перевезти 2 предмета 1-го типа и 1 предмет 3-го типа общей стоимостью 160 тыс. рублей. При увеличении типов предметов задача станет не такой простой, процедура перебора окажется громоздкой.
Однако с этим примером удобно связывать описание задачи для общей модели динамического программирования. Определение количества предметов каждого из трёх типов надо рассматривать как поэтапное решение, всего три этапа. В общей постановке разделение на этапы удобно интерпретировать как чередование во времени.
Имеется экономическая
система, текущее состояние которой
описывается вектором состояния
,
-
i-ый
показатель состояния системы. Состояние
системы может изменяться под действием
вектора управления
,
- мера управляющего воздействия j-го
типа. Тогда
модель управления системой.
Пусть управление
системой не непрерывно во времени t,
а происходит дискретно, в конце каждого
из промежутков времени (t0
, t1],
(t1
, t2],
…, (tn-1
, tn].
В моменты
времени t1,
t2,
…, tn
принимаются управляющие решения
. Поэтому в период (tk-1
, tk)
сохраняется состояние
,
наступившее после принятия решения
в момент времени tk-1.
Упрощающие предположения.
а)
Состояние
системы в момент tk
зависит только от состояния на предыдущем
шаге и принятого в момент tk
решения:
б)
Состояние системы в период (tk-1,
tk)
характеризуется числом – эффективностью
;
эффективность аддитивна по шагам:
,
в)
Система не должна иметь обратной связи,
то есть принятие решения
не влияет на состояния
.
г)
Состояние
задано.
Требуется:
построить
такой набор решений
(будем называть их оптимальными),
который обеспечивает
.
4.2. Принцип и уравнение Беллмана
Правило (принцип оптимальности по Беллману).
На любом k-ом
шаге решение
надо выбрать таким, чтобы было возможно
выбрать последующие решения
,
для которых были бы максимальны как
,
так и
.
Осуществление принципа Беллмана производится пошагово, «впопятную». Именно, вначале оценивается решение в момент времени tn-1 (последнее решение):
.
В пространстве
решений
перебираем решения
.
Для каждого состояния
обозначим:
,
эффективность
достигается выбором решения
,
которое называется условно
оптимальным
(при условии, что система находится в
состоянии
);
.
Допустим, что состояние
соответствует состоянию
и решению
.
Отступая назад на один шаг, находим:
;
значение
зависит только от
,
так как
,
по модели управления системой.
Повторяем процедуру
вплоть до вовлечения в выбор решения
:
– это
и есть уравнение
Беллмана,
воплощение принципа Беллмана. Таким
образом находится набор оптимальных
решений
как функций аргументов
соответственно, определяемых в обратном
порядке (от
к
).
Зная значение
и функцию
,
находится значение
вектора решения; по модели управления
определяется следующее состояние
системы
,
по нему находится значение
и так далее.
Уравнение Беллмана можно переписать в виде:
,
демонстрирующим аддитивные свойства
оптимальной эффективности.