Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Семестровая 1 (Методы оптимальных решений) / Методы оптимальных решений учебное пособие

.pdf
Скачиваний:
1245
Добавлен:
19.04.2015
Размер:
6.01 Mб
Скачать

и товаром Гиффина, если при увеличении цены этого товара спрос на него растет:

xi > 0 . pi

Спрос на ценный товар обязательно падает при увеличении его цены: в правой части уравнения Слуцкого (6.4.2), записанного при j = i ,

x

x

 

x

x < 0

i

=

 

i

 

i

 

 

p

I

p

 

i

i

 

i комп.

 

 

 

уменьшаемое отрицательно согласно (6.4.3), а вычитаемое неотрицательно,

так как x / ∂I > 0 согласно (6.4.4), а спрос x не может быть отрицатель-

 

i

i

ным. Таким образом, ценные товары не могут быть товарами Гиффина.

 

Резюмируя, замечаем, что

все товары делятся на три категории

(табл. 6.4.1):

 

н о р м а л ь н ы е ц е н н ы е

т о в а р ы, примером такого товара яв-

 

ляется мясо: если цена мяса увеличится, то потребитель приобретет

 

его меньше, а если увеличится богатство потребителя, то он увели-

чит потребление мяса;

 

н о р м а л ь н ы е м а л о ц е н н ы е т о в а р ы, примером такого то-

вара служит маргарин: потребитель приобретет меньше маргарина и в том случае, когда увеличится цена маргарина, и в том случае, когда увеличится богатство потребителя;

т о в а р ы Ги ф ф и н а, в качестве примера такого товара традиционно приводят картофель в Ирландии XIX в.: в то время бó льшая часть потребительских расходов населения тратилась на приобретение картофеля, но по мере увеличения богатства потребители предпочитали покупать больше мяса и меньше картофеля; при увеличении цены картофеля реальный доход потребителя уменьшался настолько, что он уже не могли покупать столько же мяса, как и прежде, и потому был вынужден увеличивать потребление картофеля.

Та бли ц а 6.4.1

Влияние изменения

ценные товары:

малоценные товары:

дохода

 

 

 

xi > 0

xi < 0

Влияние

I

I

изменения цены товара

 

 

 

 

x

 

 

 

нормальные товары:

 

 

i < 0

пример: мясо

пример: маргарин

 

 

p

 

 

 

 

 

i

 

 

 

x

 

 

 

пример: картофель

товары Гиффина:

 

в середине XIX в.

 

i > 0

 

p

 

 

в Ирландии

 

 

i

 

 

 

 

 

 

 

201

Два товара с номерами i и j называются взаимозаменяемыми, если увеличение цены j-го товара при сопутствующем компенсирующем изменении богатства приводит к увеличению спроса на i-й товар:

 

 

 

 

xi

 

> 0 ;

 

 

p j комп.

 

товары называются взаимодополняющими, если увеличение цены j-го товара при сопутствующем компенсирующем изменении богатства ведет к уменьшению спроса на i-й товар:

 

 

 

 

xi

 

< 0 .

 

 

p j комп.

 

Эти определения корректны, поскольку можно показать, что матрица

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D = dij

=

xi

 

 

n×n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p j комп.

 

является с и м м е т р и ч н о й, т. е.

 

 

 

 

 

x

 

x j

 

 

 

 

 

 

 

i

 

=

 

 

,

i = 1, 2, , n, j = 1, 2, , n .

 

 

 

p j комп.

 

pi

комп.

 

 

 

 

 

Примерами пар взаимозаменяемых товаров являются яблоки и груши, чай и кофе, сыр и колбаса и т. п.; примерами пар взаимодополняющих товаров являются компьютеры и компьютерные принтеры, автомобили и бензин, брюки и ремни и т. д.

Можно показать, что для любого товара обязательно найдется другой товар, составляющий с первым взаимозаменяемую пару. В частности, если рассматривать рынок двух товаров, то эти два товара обязательно должны быть взаимозаменяемыми.

ПРИМЕР 6.4.2. В условиях примера 6.4.1 определить, какие товары являются ценными и малоценными; нормальными товарами и товарами Гиффина; какие товары взаимозаменяемы, а какие являются взаимодополняющими.

Решение. Поскольку

x

1

 

x

 

1

 

x

1

 

1 =

 

> 0,

2

=

 

> 0,

3 =

 

> 0 ,

 

I

 

 

I

3 p1

 

 

3 p2

 

I

3 p3

 

все три товара ценные (так как ценные товары не могут быть товарами Гиффина, все три товара являются нормальными). Первый и второй товары являются взаимозаменяемыми, так как

 

 

 

 

I

 

 

x2

 

=

> 0 .

p1

9 p1 p2

 

комп.

 

 

202

Точно так же можно показать, что первый и третий, а также второй и третий товары образуют взаимозаменяемые пары, а взаимодополняющие товары для данного потребителя отсутствуют.

§ 6.5. МОДЕЛЬРЫНОЧНОГО РАВНОВЕСИЯ

Рассмотрим рынок n товаров с k участниками. Пусть вектор

x j

 

1

 

x j

x j =

2

 

 

 

 

 

 

 

x j

 

n

 

определяет

н а ч а л ь н ы е

з а п а с ы

т о в а р о в у j-го участника, а

u j (x) = u j (x , x ,, x ) —

ф у н к ц и я

п о л е з н о с т и j-го участника

 

1 2

n

 

 

(j = 1, 2, …,

k).

 

 

 

Предположим, что участники рынка согласны обмениваться това-

рами. Для этого они должны ввести некоторую д е н е ж н у ю е д и н и ц у и определить в е к т о р р ы н о ч н ы х ц е н p = ( p1 p2 pn ) .

Если на рынке будут установлены некоторые цены товаров: p1, p2, …, pn, то начальное богатство каждого участника (до обмена) в денежном выражении определяется как

n

I j = px j = pl xlj , j =1, 2, , k .

l =1

При этом суммарное предложение i-го товара на рынке будет равно суммарным запасам этого товара у всех участников:

k

QiS = xij , i =1, 2, , n .

j=1

Теперь можно для каждого участника поставить з а д а ч у п о - т р е б и т е л я и определить ф у н к ц и и с п р о с а участников рынка:

 

 

 

 

 

 

 

xɶj ( p , p , p , I

j

) =

 

 

 

 

 

 

 

 

 

 

1

2

3

 

j

 

 

 

 

 

 

 

j

 

 

 

n

 

 

 

 

 

 

 

xɶ1 p1, p2 , , pn , pl xl

 

 

 

 

j

( p1, p2 , , pn , I j )

 

 

 

 

 

l =1

 

 

 

xɶ1

 

 

 

 

 

n

 

 

 

 

ɶj

 

 

 

 

ɶj

, p2

 

 

j

 

 

 

 

 

 

 

 

 

 

x2

( p1, p2 , , pn , I j )

x2 p1

, , pn , pl xl

=

 

 

 

 

 

 

=

 

 

 

 

l =1

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( p , p , , p , I

 

 

 

 

 

 

 

 

 

xɶj

 

)

 

 

 

 

 

 

 

 

n

1 2

n

j

 

 

j

, p2

 

 

n

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xɶn p1

, , pn , pl xl

 

 

 

 

 

 

 

 

 

 

 

 

l =1

 

 

(6.5.1)

j =1, 2, , k.

203

Таким образом, суммарный спрос всех участников на i-й товар будет равен

D

k

j

, p2

, , pn

n

j

, n .

Qi

= xɶi p1

, pl xl , i =1, 2,

 

j=1

 

 

 

l =1

 

 

Согласно закону Вальраса р ы н о ч н о е р а в н о в е с и е определяется равенством суммарного спроса и суммарного предложения по каждому товару:

 

 

 

QD = QS ,

i =1, 2, , n

 

 

 

 

 

i

i

 

 

 

 

 

 

или

 

 

 

 

 

 

 

 

 

 

k

j

, p2

, , pn

n

j

k

j

, i =1, 2,

, n.

(6.5.2)

xɶi p1

, pl xl

= xi

 

j=1

 

 

 

l =1

 

j=1

 

 

 

 

Можно показать, что одно из уравнений данной системы обязательно является следствием остальных, поэтому цены определяются из этой системы с точностью до коэффициента пропорциональности. Это очевидно: ведь цены зависят от выбора денежной единицы.

Таким образом, можно определить равновесное конечное распределение товаров между участниками рынка, подставив в функции спроса (6.5.1) равновесные цены, определенные из системы (6.5.2).

ПРИМЕР 6.5.1. Рассматривается рынок трех товаров. Требуется определить равновесное распределение товаров между четырьмя участниками рынка, если эти участники обладают одинаковыми функциями по-

лезности u(x1, x2 , x3 ) = x1x2 x3 , а начальные запасы товаров у участников рынка составляют

 

x1

 

1

 

 

 

x

2

 

2

 

 

 

x3

 

3

 

 

 

x

4

 

1

1

11

 

=

 

 

 

 

 

2

12

 

=

 

 

 

 

 

3

13

 

=

 

 

 

 

 

4

14

 

=

 

 

 

x

= x2

 

 

2

 

,

x

 

= x2

 

 

2

 

,

x

 

= x2

 

 

4

 

,

x

 

= x2

 

 

1

.

 

x1

 

 

 

3

 

 

 

 

x

2

 

 

 

2

 

 

 

 

x3

 

 

 

5

 

 

 

 

x

4

 

 

 

6

 

 

3

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

Решение. Пусть цены товаров на рынке определяются вектором

p = ( p1

p2

p3 ) , тогда начальное богатство первого участника составит

 

 

 

 

 

I = px1

= p x1

+ p x1

+ p x1

= p + 2 p +3 p .

 

 

 

 

 

 

1

 

1

1

2

2

3

3

1

2

 

3

 

 

 

 

Аналогично определяется начальное богатство второго, третьего и

четвертого участников рынка:

 

 

 

 

 

 

 

 

 

 

I

2

= px2

= 2 p + 2 p + 2 p , I

3

= px3 = 3 p + 4 p + 5 p , I

4

= px4 = p + p + 6 p .

 

 

1

2

3

 

 

 

 

1

 

2

3

1

2

3

Функции спроса участников одинаковы, так как функция полезности у них одна и та же. Для данной функции полезности функция спроса (6.3.15):

204

 

 

I j

/ (3 p1 )

 

 

 

xɶ j ( p , p , p , I

j

) = I

j

/ (3 p )

 

,

j = 1, 2, 3, 4,

1 2 3

 

 

2

 

 

 

 

 

 

I

j

/ (3 p )

 

 

 

 

 

 

 

3

 

 

 

была определена в примере 6.2.1.

Суммарный спрос на первый товар составляет

QD =

I1

+

I2

+

I3

+

I4

=

 

 

 

 

1

3 p1

 

3 p1 3 p1 3 p1

 

 

= ( p1 + 2 p2 + 3 p3 ) + (2 p1 + 2 p2 + 2 p3 ) + (3 p1 + 4 p2 + 5 p3 ) + ( p1 + p2 + 6 p3 ) =

3p1

=7 p1 + 9 p2 + 16 p3 , 3 p1

аналогично определяется суммарный спрос на второй и третий товары:

Q D =

7 p1 + 9 p2 + 16 p3

,

Q D =

7 p1 + 9 p2 + 16 p3

.

 

 

2

3 p2

 

3

3 p3

 

 

 

Суммарное предложение первого товара равно

Q1S = x11 + x12 + x13 + x14 = 1 + 2 + 3 + 1 = 7,

Q2S = x12 + x22 + x23 + x24 = 2 + 2 + 4 + 1 = 9,

Q3S = x31 + x32 + x33 + x34 = 3 + 2 + 5 + 6 = 16.

Запишем условие равенства суммарного спроса и суммарного предложения каждого товара:

 

 

 

 

 

 

 

 

 

7 p

+ 9 p

+ 16 p

 

= 7,

 

 

 

 

 

 

 

 

 

1

2

3

 

 

 

 

 

 

 

 

 

 

 

3 p1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

S

,

 

 

 

 

 

 

 

 

 

 

 

Q1

= Q1

 

 

 

+ 9 p

+ 16 p

 

 

 

 

 

 

 

D

S

 

 

 

 

7 p

 

 

 

 

 

 

Q2

= Q2

,

 

1

2

3

 

 

= 9,

 

 

 

 

 

3 p2

 

 

 

 

QD

= QS

 

 

 

 

 

 

 

 

 

 

7 p

+ 9 p

+ 16 p

 

 

 

 

 

 

 

3

3

 

 

= 16

 

 

 

 

 

 

 

 

1

2

3

 

 

 

 

 

 

 

 

 

 

3 p3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7 p1 + 9 p2 + 16 p3 = 21p1,

−14 p1 + 9 p2 + 16 p3 = 0,

 

 

+ 9 p2

 

 

 

 

 

 

 

7 p1 −18 p2 + 16 p3 = 0,

7 p1

+ 16 p3 = 27 p2 ,

7 p

+ 9 p

+ 16 p

= 48 p

 

7 p

+ 9 p

− 32 p = 0.

 

1

 

2

 

3

 

3

 

1

2

3

Решение данной системы уравнений с помощью метода Жордана — Гаусса иллюстрируется табл. 6.5.1.

205

Т а бли ц а 6.5.1

–14

9

16

0

7

–18

16

0

7

9

–32

0

0

–27

48

0

1

–18/7

16/7

0

0

27

–48

0

0

1

–16/9

0

1

0

–16/7

0

0

0

0

0

Таким образом, общее решение системы для определения равновесных цен таково:

p =

16

a,

p =

16

a,

p = a ,

 

 

1

7

 

2

9

 

3

 

 

 

 

 

где, очевидно, цена третьего товара α > 0 . Ясно, что цены определяются относительно, поэтому для удобства положим p3 = α = 63 ден. ед., тогда

p =

16

×63 =144 ден. ед.,

p =

16

× 63 =112 ден. ед.

 

 

1

7

 

2

9

 

 

 

 

 

При таких ценах начальные запасы участников рынка определяют их богатство:

I1 =

p1

+ 2 p2 + 3 p3 =

144 + 2 ×112 + 3 × 63 = 557,

I2

= 2 p1

+ 2 p2 + 2 p3 = 2 ×144 + 2 ×112 + 2

× 63

= 638,

I3

= 3 p1

+ 4 p2 + 5 p3 = 3 ×144 + 4 ×112 + 5 × 63 =1195,

I4

=

p1

+ p2 + 6 p3 =

144 + 112 + 6

× 63

= 634.

Теперь можно определить равновесное распределение товаров:

 

 

 

 

 

 

 

 

I1

 

 

 

 

 

 

557

 

 

 

 

 

 

557

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 p1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3×

144

 

 

 

432

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ɶ1

 

 

 

 

 

I1 ) =

 

I1

 

 

 

=

 

557

 

 

 

 

=

 

557

 

x ( p1

, p2 , p3

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

3 p

 

 

 

3×

112

 

 

 

336

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

557

 

 

 

 

 

 

557

 

 

 

 

 

 

 

 

 

 

I1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 p3

 

 

 

 

 

3 × 63

 

189

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I2

 

 

 

 

 

 

638

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

432

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 p1

 

 

 

 

 

 

 

 

ɶ

2

( p1

,

p2 , p3 , I2 ) =

 

 

I2

 

 

 

 

=

 

638

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

3 p

 

 

 

 

 

336

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

638

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

189

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 p3

 

 

 

 

 

 

 

 

 

 

 

 

 

206

 

 

 

 

 

 

 

 

 

 

 

I3

 

 

 

 

 

1195

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

432

 

 

 

 

 

 

 

 

 

 

 

3 p1

 

 

xɶ

3 ( p , p

, p , I

3

) =

I3

 

 

 

 

=

1195

,

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

3

 

 

3 p

 

 

 

 

 

336

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

1195

 

 

 

 

 

 

 

 

 

 

 

 

I3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

189

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 p3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I4

 

 

 

 

634

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 p1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

432

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xɶ

4 ( p ,

p

2

,

p

, I

4

) =

 

I4

 

 

=

634

 

.

 

 

 

 

 

 

 

1

 

 

3

 

 

 

3 p

 

 

 

 

336

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

634

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

189

 

 

 

 

 

 

 

 

 

 

 

 

3 p3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

КОНТРОЛЬНЫЕ ВОПРОСЫ И ЗАДАНИЯ

1.Во сколько раз возрастет объем бюджетного множества при увеличении дохода в два раза?

2.Постройте несколько кривых равноценности для мультипликатив-

ной функции полезности двух товаров u(x1, x2 ) = x1α x2β (α, β > 0, α + β < 1) . Найдите предельные нормы замены и эластичности замены одного товара другим для этой функции.

3.Постройте несколько кривых равноценности для пропорциональной функции полезности двух товаров u(x1, x2 ) = min{x1, 2x2}. Найдите предельные нормы замены и эластичности замены одного товара другим для этой функции.

4.Найдите функцию спроса потребителя, обладающего линейной функцией полезности u ( x1, x2 ) = a1x1 + a2 x2.

5.Найдите функцию спроса потребителя, обладающего пропорциональной функцией полезности u(x1, x2 ) = min{x1, 2x2}.

6.Найдите функцию спроса потребителя, обладающего мультиплика-

тивной функцией полезности u(x1, x2 ) = 3 x1x2 .

7.Какой смысл имеет множитель Лагранжа λ в задаче определения потребительского спроса?

8.Убедитесь, что уравнение Слуцкого действительно выполняется для функции полезности u(x1, x2 ) = 3 x1x2 .

9.Составьте уравнение Слуцкого для пропорциональной функции полезности двух товаров u(x1, x2 ) = min{x1, 2x2} .

207

10.Найдите состояние равновесия на рынке, если функция спроса

D( p) = a bp , а функция предложения S( p) = −c + dp (p — цена товара, a, b, c, d > 0 — константы).

11.Каков содержательный смысл конкурентного равновесия в модели Вальраса?

12.Проверьте выполнение закона Вальраса на рынке с тремя участниками, имеющими одинаковые функции полезности u(x1, x2 , x3 ) =

 

=

x1x2 x3

, если вектор цен p = (1 2

3),

а начальное имущество

 

участников описывается векторами (1

2

3), (2 3

4) и (3 4 5).

13.

На рынке продаются n товаров по ценам p1, p1, …,

pn. В качестве

(n + 1)-го товара выступают деньги, т. е. pn+1 = 1. Функция полезности набора товаров совпадает с его стоимостью. Найдите предельные полезности первых n товаров и предельные нормы замещения первых n товаров деньгами.

14.Убедитесь, что уравнение Слуцкого действительно выполняется для функции полезности u(x1, x2 ) = 3 x1x2 .

208

ГЛАВА 7. ЗАДАЧИДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ ВЭКОНОМИКЕ

§ 7.1. ПОСТАНОВКА ЗАДАЧИ ДИНАМИЧЕСКОГОПРОГРАММИРОВАНИЯ

Динамическое программирование представляет собой математиче-

ский аппарат, разработанный для решения некоторого класса задач математического программирования путем их разложения на относительно небольшие и, следовательно, менее сложные задачи. Специфика метода динамического программирования состоит в том, что для отыскания оптимального управления планируемая операция разделяется на ряд последовательных ш а г о в или э т а п о в. Соответственно и сам процесс планирования операции становится м н о г о ш а г о в ы м и развивается последовательно, от этапа к этапу, причем каждый раз оптимизируется управление только на одном шаге.

Некоторые операции естественно распадаются на этапы, в других это деление приходится вводить искусственно. Примером «естественно многоэтапной» операции может служить планирование работы предприятия на некоторый период времени, состоящий из нескольких хозяйственных лет или кварталов.

Состояние системы на каждом шаге i = 1, 2, …, n характеризуется некоторой переменной — параметром состояния xi , который зависит от свое-

го значения на предыдущем шаге xi−1

и от выбранного на данном шаге

управления ui :

 

xi = fi (xi−1, ui ),

i =1, 2,, n.

Наилучший эффект на данном этапе вместе с уже рассмотренными шагами характеризуется функцией состояния. Решение конкретной задачи методом динамического программирования сводится к выбору параметра состояния (что требует определенного навыка), составлению функции состояния и рекуррентных соотношений, связывающих функции состояния для двух соседних последовательных этапов, и их применению для выбора оптимального управления.

209

Принцип динамического программирования предполагает, что управление на каждом шаге должно выбираться с учетом всех его последствий в будущем. Однако из этого правила есть исключение. Среди всех шагов существует один, который может планироваться «без оглядки на будущее» — это последний шаг. Спланировав оптимальным образом этот последний шаг, можно к нему «пристраивать» предпоследний, затем предыдущий и т. д.

Поэтому процесс динамического программирования разворачивается от конца к началу. Сначала делаются различные предположения о том, чем кончился предпоследний шаг, и для каждого из них выбирается управление на последнем. Затем делаются различные предположения о том, чем кончился предпредпоследний шаг, т. е. рассматриваются различные состояния системы на третьем от конца шаге и выбирается управление на втором от концы шаге так, чтобы оно вместе в уже выбранным управлением на последнем шаге обеспечивало наилучший эффект на двух последних шагах, и так далее, вплоть до первого от начала шага, с которого начинался процесс.

В начале процесса состояние системы нам известно, и делать какие-то предположения не нужно. Поэтому, имея в виду, что все последующие шаги спланированы для различных состояний системы, остается выбрать управление на первом шаге так, чтобы оно было оптимальным с учетом всех управлений, уже принятых наилучшим образом на всех последующих шагах.

Принцип, положенный в основу построения такого решения (искать всегда оптимальное продолжение процесса относительно того состояния, которое достигнуто в данный момент), принято называть принципом оп-

тимальности.

§ 7.1. ЗАДАЧА ОПТИМАЛЬНОГО РАСПРЕДЕЛЕНИЯИНВЕСТИЦИЙ

Знакомство с методом динамического программирования проще всего начать с рассмотрения нелинейной задачи распределения ресурсов между предприятиями одного производственного объединения или отрасли. Для определенности можно считать, что речь идет о распределении капитальных вложений.

Предположим, что производственный холдинг состоит из n предприятий, и на их развитие выделены инвестиции в размере b ден. ед. Обозначим через zi (x) прирост мощности или прибыли на i-м предприятии, если оно получит инвестиции в размере x ден. ед. В динамической задаче распределе-

ния инвестиций требуется найти такое распределение

u1 u = u2un

210