Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Семестровая 1 (Методы оптимальных решений) / Методы оптимальных решений учебное пособие

.pdf
Скачиваний:
1246
Добавлен:
19.04.2015
Размер:
6.01 Mб
Скачать

а спрос на персональные компьютеры на базе процессоров Intel с операционной системой Linux

 

 

 

p

I

 

 

 

p

I

+ p

 

 

p

 

qL

= qmax 1

 

 

qmax 1

 

W

 

= qmax

W

.

(11.4.8)

 

 

 

 

αI

 

 

 

 

αI

 

 

 

 

 

 

αI

 

Это означает, что пользователь приобретет композитный продукт (персональный компьютер с одной из операционных систем) тогда и только тогда, когда потребительская ценность продукта для данного пользователя превысит его цену (рис. 11.4.1).

p

αI + W

αI

pI + pW

pI

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

qmax q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Спрос на ПК

 

 

Спрос на ПК

на базе Intel

 

 

на базе Intel

с ОС Windows

 

 

с ОС Linux

Рис. 11.4.1. Функции спроса на компьютеры на базе процессоров Intel с операционными системами Windows и Linux

331

Суммарный спрос на аппаратное обеспечение будет равен

 

 

 

p

I

+ p

 

 

p

 

 

p

I

 

 

qI

= qmax 1

 

W

 

 

+ qmax

W

= qmax 1

 

.

(11.4.9)

 

 

αI

αI

 

 

 

 

 

 

 

 

 

 

 

αI

 

Выражения (11.4.7)—(11.4.9)

 

позволяют сформулировать следую-

щую теорему.

ТЕОРЕМА. Реализованный спрос на компьютеры с некоммерческой операционной системой зависит только от цены коммерческого конкурента (но не от цены аппаратного обеспечения); спрос на аппаратное обеспечение зависит только от его цены (но не от цены коммерческой операционной си- стемы); спрос на коммерческую операционную систему зависит и от цены лицензии на этот продукт, и от цены аппаратного обеспечения.

Задача, которая стоит перед производителем аппаратного обеспече-

ния, состоит в установлении такой его цены pI, которая обеспечит мак-

симум прибыли

 

 

 

πI

= qI ( pI

 

vI

)fI

 

=

(11.4.10)

 

= q

1 −

pI

 

(p

 

v

 

)f

 

→ max .

 

 

 

I

I

I

 

max

 

αI

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Аналогично, разработчик коммерческой операционной системы

также стремится максимизировать свою прибыль

 

 

 

πW = qW (pW vW )fW =

(11.4.11)

= q

1 −

pI

+ pW

 

(p v )f

→ max .

 

 

 

 

 

 

max

 

 

αI

 

 

 

 

W

 

W

 

W

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

путем выбора оптимальной цены лицензии pW.

ТЕОРЕМА. Оптимальная цена аппаратного обеспечения, равная

pI = αI + vI

(11.4.12)

2

 

обеспечивает его производителю максимальную прибыль

 

(α

I

v

I

)2

 

 

= qmax

 

fI

;

(11.4.13)

πI

I

 

 

 

 

 

 

 

оптимальная цена лицензии на операционную систему

p

= αI + 2vW vI

(11.4.14)

W

4

 

 

 

обеспечивает ее разработчику максимальную прибыль

π

= q

(α

 

− 2v

v

 

)2

 

;

(11.4.15)

max

I

W

 

I

f

W

W

 

 

16αI

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

при этом

332

dp

1

 

 

W

= −

 

,

(11.4.16)

 

2

dp

I

 

 

 

 

 

 

а прибыль производителя аппаратного обеспечения превышает прибыль разработчика операционной системы тогда и только тогда, когда

qmax (I − 3vI − 2vW )(α I vI + 2vW ) > 16αI ( fI fW ).

(11.4.17)

Доказательство. Условие максимума первого порядка в задаче (11.4.10) дает оптимальное значение цены аппаратного обеспечения

d πI

= 0 q

max

αI − 2 pI + vI = 0 p = αI + vI .

 

dpI

αI

I

2

 

 

При этом (в соответствии с доказанной теоремой) производитель аппаратного обеспечения устанавливает цену без оглядки на разработчика коммерческой операционной системы.

После того, как производитель аппаратного обеспечения установил цену на свой продукт, разработчик коммерческой операционной системы может принять решение о цене лицензии. Записав условие максимума первого порядка в задаче (11.4.11), получим функцию реакции

∂π

 

 

 

α

I

+ v p − 2 p

 

 

 

 

W

 

 

 

= 0 qmax

 

W

I

W

 

= 0

pW

 

 

 

 

 

αI

 

 

pI = pI =const

 

 

 

 

 

 

 

 

 

 

 

 

 

p

=

α

 

+ v

p

(11.4.18)

 

I

W

I .

W

 

 

 

2

 

 

 

 

 

 

 

 

Подставляя в функцию реакции уже известную цену аппаратного обеспечения pI , получаем формулу (11.4.12)

Выражения для прибыли (11.4.13), (11.4.15) получаются простой подстановкой оптимальных цен в функции прибыли участников рынка.

Дифференцируя в формуле (11.4.18) pW по pI , получаем формулу

(11.4.16).

Далее,

π > π q

 

(α − v )2

f > q

(α − 2v v )2

f

 

 

 

I

 

I

 

I

 

W

I

 

 

 

 

 

 

 

 

 

 

 

W

max

 

I

 

 

I

 

max

 

16αI

 

W

 

 

 

 

 

 

 

 

 

 

 

 

qmax

 

4(α

I

v

)2 (α

I

− 2v v

)2

> fI

fW

 

 

 

 

I

 

 

 

W I

 

 

 

 

 

 

 

16αI

 

 

 

 

qmax (I − 3vI − 2vW )(αI

vI + 2vW ) > 16αI ( fI

fW ).

Теорема полностью доказана. Заметим, что согласно формуле (11.4.16) увеличение оптимальной

цены аппаратного обеспечения на 1 ден. ед. сопровождается уменьшением

333

оптимальной цены программного обеспечения только на 0,5 ден. ед., а условие (11.4.17) на практике не выполняется ввиду существенно бó льших постоянных издержек производителя аппаратного обеспечения по сравнению с разработчиком коммерческого программного обеспечения.

КОНТРОЛЬНЫЕ ВОПРОСЫИ ЗАДАНИЯ

1.Две фирмы производят один и тот же продукт. Первая фирма тратит на производство единицы продукта 10 единиц труда и 10 единиц капитала, вторая — 10 единиц труда и 20 единиц капитала. Цена единицы труда равна w, а цена единицы капитала равна r. Рыночная цена продукта зависит от суммарного выпуска: p(x1 + x2) = 100 – ( x1 + x2). Найдите объемы выпусков и значения прибыли, соответствующие равновесию Курно, прокомментируйте тот факт, что объем выпуска и прибыль первой фирмы не зависит от цена капитала (в отличие от второй фирмы).

2.Три фирмы производят один и тот же интеллектуальный товар, так что

предельные издержки фирм близки к нулю. Рыночная цена продукта зависит от суммарного предложения: p(x1 + x2) = 120 – ( x1 + x2). Найдите объемы выпусков и значения прибыли, соответствующие равновесию Курно.

3.Найдите равновесие в модели Бертрана, в которой каждая из двух

фирм i =1, 2, производящих один товар, назначает свою цену pi, а покупатели покупают весь товар у той фирмы, которая назначит меньшую цену, и совсем не покупают у другой фирмы, назначившей более высокую цену (если обе цены совпадут, то спрос распределяется между фирмами поровну). Себестоимость товара у обеих фирм одинакова и равна c руб. Образуют ли найденные стратегии фирм равновесие Нэша?

4.Докажите, что точка равновесия Штакельберга (в случае, когда лидером является первая фирма) соответствует точке касания одной из изопрофит первой фирмы и линии реакции второй фирмы.

5.Докажите, что картельные соглашения двух фирм при любом распределении объемов выпуска не являются равновесиями Нэша

6.Докажите, что точка равновесия Курно на рынке N фирм определя-

ется формулами (11.3.1)—(11.3.4).

334

ГЛАВА 12. ТЕОРИЯОПТИМАЛЬНОГО УПРАВЛЕНИЯ ИЕЕЭКОНОМИЧЕСКИЕПРИЛОЖЕНИЯ

§12.1. ПОСТАНОВКА ЗАДАЧИОПТИМАЛЬНОГОУПРАВЛЕНИЯ

Втеории оптимального управления рассматривается поведение некоторой системы на промежутке времени от t0 до t1. Состояние системы в каждый момент времени характеризуется вектором фазовых переменных

x1 (t)

 

 

x (t)

 

,

x(t) =

2

 

 

 

 

 

 

 

 

 

xn (t)

 

причем каждая из фазовых переменных представляет собой некоторую непрерывную функцию времени.

Начальное и конечное состояния системы считаются известными:

x (t

0

) = x0

, x

(t

) = x1.

 

 

 

1

 

 

Поведение системы зависит от вектора управляющих переменных

или управлений

 

 

 

 

 

 

 

 

 

u1

(t)

 

 

 

 

 

 

 

 

 

u(t) =

u2

(t)

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

uk

(t)

 

на который накладывается ограничение кусочной непрерывности и непрерывности слева в точках разрыва.

Кроме того, на управления может также накладываться ограничение принадлежности некоторому фиксированному множеству U.

Поведение системы под управляющим воздействием описывается системой дифференциальных уравнений — уравнений движения

335

dxi

(t)

(t, x(t), u(t)), i = 1, 2,, n.

 

 

= ϕi

 

 

dt

 

Задача оптимального управления в общей постановке формули-

руется следующим образом. Требуется найти управляющий вектор u(t) U, доставляющий максимум целевому функционалу

 

t1

(t, x(t),u(t))dt + F (t1, x1 ) → max

 

 

f

(12.1.1)

 

t0

 

 

 

 

 

 

 

при наличии ограничений

 

 

 

 

 

 

dxi (t)

 

 

 

 

 

 

 

 

= ϕi (t, x(t), u(t)),

i = 1, 2,, n,

(12.1.2)

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

x (t

0

) = x0 ,

x (t

) = x1.

(12.1.3)

 

 

 

 

 

1

 

 

Функции f (t, x,u), ϕi (t, x,u) и F (t, x) предполагаются непрерывными и дифференцируемыми по каждому аргументу.

§ 12.2. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА

Решение задач нелинейного программирования, в которых требуется найти точку в пространстве n , доставляющую максимум (или минимум) некоторой целевой функции при наличии нелинейных ограничений, основывается на поиске седловой точкаи функции Лагранжа, которая равна сумме целевой функции и скалярного произведения вектора множителей Лагранжа на вектор разностей между правыми и левыми частями ограничений.

Аналогичный подход применяется и для решения задач оптимального управления, только в этих задачах роль неизвестных выполняют управления u1 (t), u2 (t), , uk (t) , т. е. ищется точка не в

пространстве n , а в пространстве функций. Максимизируется в задачах оптимального управления не функция (как в нелинейном программировании), а интегральный функционал, ограничения представлены дифференциальными уравнениями движения.

С к а л я р н о е п р о и з в е д е н и е в п р о с т р а н с т в е ф у н к - ц и й определяется как интеграл:

t1

a(t), b(t) = a(t)b(t)dt .

t0

Если каждому из уравнений движения (12.2.2) поставлена в соот-

ветствие сопряженная переменная — функция yi(t), то функция Лагранжа для задачи оптимального управления (12.1.1)—(12.1.3) определяется как

336

 

L (u(t), y(t)) =

 

 

(12.2.1)

t1

 

t1

 

 

dx

 

1

 

 

= f (t, x(t),u(t))dt + F (t1, x ) + y(t) φ(t, x(t),u(t))

 

 

 

dt =

 

 

 

t0

 

t0

 

 

dt

t1

1

t1 n

 

 

 

dx

f (t, x(t),u(t))dt +

F (t1, x ) +

∫∑ yi

(t) ϕi (t, x(t),u(t))

 

i

dt.

 

 

t0

 

t0 i=1

 

 

 

dt

 

 

 

 

 

 

 

Здесь

 

 

 

 

 

 

 

 

y(t) = ( y1 (t) y2 (t) yn (t))

 

 

 

 

 

вектор сопряженных переменных.

 

 

 

 

 

 

 

Седловой точкой

функции

Лагранжа называется

 

такая точка

(u (t), y (t)) пространства функций, что

 

 

 

 

 

 

L(u(t), y (t)) L (u (t), y (t)) L(u (t), y(t))

 

 

(12.2.2)

для всех функций y(t) и всех кусочно-непрерывных функций u(t).

ТЕОРЕМА. Седловая точка функции Лагранжа (12.2.3) определяет решение распределенной задачи оптимального управления (12.1.1)— (12.1.3).

Доказательство. Траекторию, соответствующую управлению u(t) ,

будем обозначать x(t) , а траекторию, соответствующую управлению u (t),

x (t) .

Из второго неравенства в (12.2.2) следует, что

L(u (t), y (t)) L(u (t), y(t)) 0

или

t1

 

t1

 

 

 

 

 

 

 

dx

 

f (t, x (t),u (t))dt + F (t1

, x1 ) + y

(t)

φ(t, x (t),u (t))

 

 

 

 

dt

 

dt

t0

 

t0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t1

 

t1

 

 

 

 

 

dx

 

f (t, x (t),u (t))dt F (t1, x1 ) y(t)

φ(t, x (t),u (t))

 

 

 

dt 0,

 

 

 

t0

 

t0

 

 

 

 

 

 

dt

 

откуда

 

 

 

 

 

 

 

 

 

 

 

 

 

t1

(y (t) − y(t))

φ(t, x (t),u (t))

dx

dt 0,

 

 

 

 

 

(12.2.4)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t0

 

 

 

 

 

dt

 

 

 

 

 

 

для всех функций y(t). Предположим, что

337

dx ¹ φ(t, x (t),u (t)). dt

В этом случае можно найти такую функцию y(t), чтобы интеграл в левой части (12.2.3) был положителен, что противоречит неравенству

(12.2.3). Поэтому если (u (t), y (t)) — седловая точка функции Лагранжа, то

dx

= φi (t, x (t),u (t)) ,

(12.2.5)

dt

 

 

т. е. траектория x (t) , соответствующая управлению u (t) , удовлетворяет уравнениям (12.1.2).

Первое из неравенств в (12.2.2) означает, что

0 L (u (t), y (t)) L (u(t), y (t)) =

t1

 

 

 

t1

 

 

 

 

dx

 

 

= f (t, x (t),u (t))dt + F (t1

, x1 ) + y (t)

φ(t, x (t),u (t))

 

 

 

 

dt

dt

t0

 

 

 

t0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t1

 

 

 

t1

 

 

 

dx

 

 

f (t, x(t),u(t))dt F (t1, x1 ) y (t)

φ(t, x(t),u(t))

 

 

 

 

dt =

 

 

 

t0

 

 

 

t0

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t1

 

 

 

t1

 

 

 

 

 

 

 

 

 

= f (t, x (t),u (t))dt + F (t1, x1 ) f (t, x(t),u(t))dt F (t1, x1 ) +

t0

 

 

 

t0

 

 

 

 

 

 

 

 

 

+t1 y (t) φ(t, x (t),u (t))

dx

dt t1

y (t) φ(t, x(t),u(t))

dx

dt.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t0

 

dt

t0

 

 

 

 

 

 

dt

Отсюда

 

 

 

 

 

 

 

 

 

 

 

 

t1

(t, x (t),u (t))dt + F (t1, x1 )

t1

(t, x(t),u(t))dt + F

(t1, x1 ) − (12.2.6)

f

f

t0

t1 y (t) φ(

t0

t0

 

(t))

dx

t1

 

φ(t,

t, x (t),u

 

dt + y

(t)

dt

 

 

 

t0

 

 

 

 

 

 

 

 

x(t),u(t))

dx

 

dt.

 

 

dt

Первый из интегралов в правой части (12.2.6) равен нулю в силу (12.2.4). Второй интеграл в правой части (12.2.6) равен нулю для любой траектории x(t) , удовлетворяющей уравнениям (12.1.2).

Итак, для любой траектории x(t) , удовлетворяющей уравнениям

(12.1.2),

t1

t1

f (t, x (t),u (t))dt + F (t1, x1 ) f (t, x(t),u(t))dt + F (t1, x1 ),

t0

t0

338

т. е. управление u (t) является оптимальным, что полностью доказывает теорему.

Функцией Гамильтона или гамильтонианом задачи оптимального управления (12.1.1)—(12.1.3) называется функция

H (t, x(t),u(t), y(t)) = f (t, x(t),u(t)) + y(t)φ(t, x(t),u(t)). (12.2.7)

ТЕОРЕМА. В седловой точке функции Лагранжа выполняются следу- ющие необходимые условия:

H (t, x (t),u (t), y (t)) = max H (t, x(t),u(t), y(t)), t

0

< t < t , (12.2.8)

 

 

 

 

 

 

 

 

u (t ) U

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dx

=

H

 

,

t

< t < t ,

x (t )= x0 ,

 

(12.2.9)

 

 

 

 

y

 

 

 

 

dt

 

 

 

0

1

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dy

= −

H

,

t

 

< t < t ,

y (t )=

F

.

 

(12.2.10)

 

 

x

 

 

 

 

dt

 

 

 

0

1

1

x1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доказательство. Как было продемонстрировано при доказательстве

предыдущей теоремы, если (u (t), y (t))

седловая точка функции Ла-

гранжа, то траектория x (t) , соответствующая управлению u (t) , удовлетворяет уравнениям (12.1.2):

 

 

dxi

= ϕ

(t, x (t),u (t)),

i =1, 2, , n.

 

 

(12.2.11)

 

 

 

 

 

 

 

dt

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычислим производную гамильтониана по переменной y

 

в седло-

 

 

 

 

 

 

 

 

 

i

 

вой точке функции Лагранжа:

 

 

 

 

 

 

 

 

 

H (t, x (t),u (t), y (t))

=

 

 

 

(12.2.12)

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

f (t, x (t),u (t))+

n

 

 

 

 

 

 

 

yi (ti (t, x (t),u (t))

(t, x (t),u (t)).

=

 

 

i=1

 

 

= ϕi

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

Сравнивая правые части в (12.2.11) и (12.2.12), приходим к справедливости (12.2.9).

Теперь проинтегрируем по частям вычитаемое в функции Лагранжа:

L (u(t), y(t)) =

 

(12.2.13)

t1

 

t1

 

 

dx

 

1

 

 

= f (t, x(t),u(t))dt + F (t1

, x )+ y(t)

φ(t, x(t),u(t))

 

dt =

 

t0

 

t0

 

 

dt

 

 

 

 

 

339

 

t1

 

 

 

 

t1

dx

 

 

 

= ( f (t, x(t),u(t)) + y(t)φ(t, x(t),u(t)))dt + F (t1

, x1 ) y(t)

dt =

 

 

 

 

 

t0

 

 

 

 

t0

dt

 

 

 

= t1

H (t, x(t),u(t), y(t))dt + F (t , x1 ) + t1

dy

x(t)dt y (t )x(t ) + y (t )x(t ).

 

1

dt

1

1

 

0

0

 

 

 

 

 

t0

 

t0

 

 

 

 

 

 

 

 

В случае, когда на управление не наложены никакие ограничения, кроме кусочной непрерывности, переход от управления u(t) к управлению u(t) + u(t) приведет к переходу от траектории от x(t) к x(t) + x(t). При этом, как следует из (12.2.13), функция Лагранжа изменяется на

 

t1 x1

H

 

 

 

 

H

 

 

dy

 

 

 

F

 

 

1

 

L = ∫ ∫

 

 

 

 

 

u(t) +

 

 

 

+

 

x(t)

+

 

 

y (t1 )

x

,

u

 

 

x

 

1

 

t x

 

 

 

 

 

 

 

dt

 

 

 

 

x

 

 

 

 

 

0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H

H H

 

 

 

H

 

 

H

H H

 

H

u

=

u

 

 

 

 

 

 

 

,

 

x

=

x

 

x

x

.

 

u

2

u

k

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

n

 

Так как для существования максимума функции Лагранжа необходимо, чтобы приращение L обращалось в нуль, получаем отсюда, что

 

 

H

 

= θ,

t

 

 

< t < t ;

 

(12.2.14)

 

 

u

 

 

 

 

 

 

 

 

 

 

0

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dy

 

 

H

 

 

 

 

 

 

 

 

 

 

 

 

= −

x

,

 

 

t

 

< t < t ;

 

 

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

0

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y (t ) =

 

 

F

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

x1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В общем случае, когда на управление u(t) наложено ограничение

u(t) U , условие (12.2.14) заменяется на

 

 

 

 

 

H (t, x (t),u (t), y (t)) = max H (t, x(t),u(t), y(t)), t

0

< t < t .

 

 

 

 

u (t ) U

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

Теорема полностью доказана. Часто удобна покоординатная запись условий (12.2.9)—(12.2.10):

 

dxi

=

H ,

xi (t0 ) = xi0 ,

j = 1, 2, , n,

(12.2.9')

 

 

 

dt

yi

 

 

 

 

 

 

 

 

dyi

 

 

H

 

 

F

 

 

 

(12.2.10')

dt

= − x

,

yi (t0 ) = x1 ,

j = 1, 2,

, n.

 

 

 

 

 

 

i

 

 

i

 

 

 

 

Алгоритм применения принципа максимума к задаче оптималь-

ного управления состоит в том, что для каждого уравнения движения вво-

340