1smol_yakov_e_r_metody_resheniya_konfliktnykh_zadach-1
.pdfk-ое уравнение
|
L(u, v1, . . . , vk−1, v¯k1) = L(u, v1, . . . , vk−1, v¯k0), |
(4.31) |
|||||
|
|
|
|
|
|
|
|
|
(u, v1, . . . , vk−1) Pqr1...rk−1 , k = |
1, m, |
|
|
|||
выполняется для любой пары точек v¯k0, v¯k1 P rVk W (u, v1, . . . , vk−1), v¯k0 6= v¯k1 |
, |
||||||
rk-мера каждой из которых положительна, а k-ое уравнение |
|
|
|||||
∂L(u, v1, . . . , vk) |
= 0, (u, v1, . . . , vk−1) Pqr1...rk−1 |
(4.32) |
|||||
|
∂vk |
|
удовлетворяется в каждой внутренней точке v множества P rVk W (u, v1,
. . . , vk−1), r-мера которой положительна или, в частности, вся сосредоточена только в одной точке, а также на каждом интервале (ˆvk0, vˆk1) P rVk W (u, v1, . . . , vk−1), в каждой точке которого мера rk
плотность относительно меры Лебега.
Доказательство этой теоремы не имеет принципиальных отличий от доказательства теоремы 4.1 и поэтому не приводится.
Замечание 4.3. Если 1-й игрок, применяющий смешанную стратегию, не знает, какой информацией о его поведении располагает 2-й, то ему следует рассчитывать на худший случай, т.е. считать, что 2-й знает реализацию его случайных чисел. Как будет продемонстрировано в следующих двух задачах, наибольшую выгоду 1-й игрок получает, когда 2-й знает лишь его функцию распределения и сам он знает об этой информированности 2- го; меньшую выгоду когда 2-й знает реализацию его случайных чисел (или чистую стратегию), причем об этой информированности 2-го ему известно; и минимальную выгоду, когда он оптимизирует свою стратегию, полагая, что 2-й знает только его функцию распределения, в то время как
2-й в действительности знает и реализацию его случайных чисел.
Пример 4.2. Пусть 1-й игрок стремится получить минимум функции
f0(u, v) = (v − u)2,
а 2-й игрок максимум, причем область W имеет вид:
W = {u, v : 2v − u ≥ 0, 2 − 2v − u ≥ 0, u ≥ 0};
и пусть 1-й игрок определяет свое поведение первым, причем ему известно, что 2-й игрок знает только его функцию распределения, но не знает реа-
лизации случайных чисел u. Тогда он гарантирует себе значение платы f0,
231
равное ε > 0, если будет определять свое поведение, например, следующей ε-оптимальной функцией распределения
qε(u) = (1 |
0 |
4ε) |
ïðè |
1/2 |
|
u < 1, |
(4.33) |
|
− |
|
ïðè |
u < 1/2, |
|
||
|
ïðè |
≤ |
|
|
|||
|
1 |
|
qε(u) |
u |
|
1. |
|
У 2-го игрока, знающего |
|
|
|
≥ |
|
||
|
|
|
|
|
|
|
|
функцию |
|
, нет выбора: он должен выбирать |
только число v = 1/2 с вероятностью 1. 1-й игрок может выбором ε сделать плату J, записанную в смешанных стратегиях, сколь угодно малой:
min max J = ε > inf max J = 0.
qε |
r |
q |
r |
Из решения следующего примера видно, что указанное поведение 1-го игрока не будет ε-оптимальным, если 2-й игрок знает реализацию его случай-
ных чисел.
Пример 4.3. Рассмотрим предыдущий пример в предположении, что 2- му игроку, реализующему свою стратегию вторым, известна реализация слу- чайных чисел противника. Для нахождения оптимального поведения игроков можно применить теорему 4.2. Однако в данном случае проще найти решение без применения этой теоремы.
Найдем экстремальное поведение 2-го игрока при каждом фиксированном u P rU W = [0, 1]. Для задачи вида (4.14) экстремальное поведение r(v) может быть найдено в результате решения следующей задачи:
|
v1(u) |
|
− |
) |
|
= |
|
1−u/2 |
− |
|
|
|
r |
0Z |
( |
|
2dr |
r |
Z |
u)2dr, |
|
||||
J(u) = max |
|
v |
|
u |
|
max |
(v |
|
(4.34) |
|||
|
v (u) |
|
|
|
|
|
|
|
u/2 |
|
|
|
ãäå v0(u) = u/2, v1(u) = 1 − u/2 кривые, задающие множество W . Определим, при каких u экстремальной для 2-го игрока может быть чистая
стратегия. Эта чистая стратегия, как следует из (4.34), при каждом u должна удовлетворять условию
J(u) = |
|
max |
|
(v u)2, |
(4.35) |
|
v |
[u/2,1 |
− |
u/2] |
− |
|
|
|
|
|
из которого получаем, что при любом фиксированном u оптимальные значе- ния v(u) могут находиться только на прямых: v = 1 − u/2, v = u, v = u/2; оптимальным (при каждом u) среди этих трех значений является то, которое
232
соответствует наибольшему из значений следующих трех функций, получаемых из (4.35):
|
|
0 |
|
|
ïðè |
v = u |
|
(4.36) |
||
|
(9/4)u2 − 3u + 1 |
ïðè |
v = 1 |
− u/2, |
|
|||||
|
2 |
|
|
|
ïðè |
|
|
|
|
|
|
|
u |
/4 |
|
|
|
v = u/2. |
|
||
Отсюда следует, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
что оптимальными являются |
|
|
|
|||||||
( |
v1 |
v0(u) = u/2 |
ïðè |
u[1/2, 1], |
|
|
||||
|
(u) = 1 |
− u/2 |
ïðè |
u [0, 1/2], |
(4.37) |
|||||
и им соответствует функция (4.34) следующего вида |
|
|
||||||||
|
|
( |
|
u2/4 |
|
ïðè |
u ≤ |
1/2, |
|
|
J(u) = |
(9/4)u2 |
− 3u + 1 |
ïðè |
u |
1/2, |
(4.38) |
||||
|
|
|
|
|
|
|
|
≥ |
|
|
минимум которой достигается при |
u = 1/2, а следовательно, оптимальной |
для 1-го игрока является чистая стратегия u = 1/2, а для 2-го игрока любая чистая или смешанная стратегия, r-мера которой сосредоточена в точках v0(1/2) = 1/4 è v1(1/2) = 3/4. Нетрудно проверить, что эта пара стратегий удовлетворяет теореме 4.2 и приводит к цене игры J = 1/16.
Обращаясь к задаче 4.2, легко можем подсчитать, что если бы в этой задаче 2-й игрок знал реализацию случайных чисел 1-го, а 1-й не знал бы об
этом и определял свое поведение функцией (4.25), то применив (при u = 1/2)
стратегию |
|
0 |
ïðè |
v < 1/4, |
r(v) = |
p |
ïðè |
1/4 ≤ v < 3/4, 0 ≤ p ≤ 1, |
|
|
|
1 |
ïðè |
v 3/4, |
|
|
|
|
≥ |
|
|
|
|
|
à ïðè u = 1 стратегию
(
r(v) =
0 ïðè v < 1/2,
1 ïðè v ≥ 1/2,
2-й игрок обеспечил бы значение платы J, даже большее, чем 1/16, а имен-
íî
J = min max J = 1/16 + 3/4ε > 1/16 > ε > 0,
qε r
что вполне иллюстрирует Замечание 4.3.
233
СПИСОК ЛИТЕРАТУРЫ
1.Айзекс Р. Дифференциальные игры. М.: Мир, 1967.
2.Антипин А.С. Равновесное программирование: проксимальные методы
//Журнал вычислительной математики и математической физики. 1997. Т. 37. N 11. С. 1327 1339.
3.Бесконечные антагонистические игры. Под ред. Н.Н. Воробьева. Ì.:
Физматгиз, 1963.
4.Бобылев Н.А., Емельянов С.В., Коровин С.К. Геометрические методы
âвариационных задачах. М.: Изв-во Магистр, 1998.
5.Болтянский В.Г. Оптимальное управление дискретными системами. М.:
Наука, 1973.
6.Бурбаки Н. Общая топология: Основные структуры. М.: Наука, 1968.
7.Бурбаки Н. Интегрирование меры, интегрирование мер. М.: Наука, 1967.
8.Бурбаки Н. Интегрирование: Векторное интегрирование, мера Хаара,
свертка и представления. М.: Наука, 1970.
9. Вайсборд Э.М., Жуковский В.И. Введение в дифференциальные игры нескольких лиц и их приложения. М.: Советское радио, 1980.
10. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977.
11. Васильев Ф.П., Иваницкий А.Ю. Линейное программирование. М.: Факториал Пресс, 2003.
12.Вилкас Э.Й. Оптимальность в играх и решениях. М.: Наука, 1990.
13.Воробьев Н.Н. Основы теории игр. Бескоалиционные игры. М.: Наука,
1984.
14.Гермейер Ю.Б. Игры с непротивоположными интересами. М.: Наука,
1976.
15.Гильденбранд В. Ядро и равновесие в большой экономике. М.: Наука,
1986.
16.Горелик В.А., Кононенко А.Ф. Теоретико-игровые модели принятия решений в эколого-экономических системах. М.: Радио и связь, 1982.
17.Данфорд Н., Шварц Дж. Т. Линейные операторы: Общая теория. М.: Иностранная литература, 1962.
18.Демьянов В.Ф., Малоземов В.И. Введение в минимакс. М.: Наука, 1972.
19.Дюбин Г.Н., Суздаль В.Г. Введение в прикладную теорию игр. М.: Наука, 1981.
234
20. Евтушенко Ю.Г. Методы решения экстремальных задач и их применение в системах оптимизации. М.: Наука, 1982.
21. Евтушенко Ю.Г., Смольяков Э.Р. Новое понятие решения для задач принятия предложений и бескоалиционных игр // ДАН РФ. 1998. Т. 363. N
2.Ñ. 175 177.
22.Евтушенко Ю.Г., Смольяков Э.Р. Парето-оптимальные бескоалицион-
ные равновесия. ДАН РФ. 1999. Т. 367. N 3. С. 318 320.
23. Еремин И.И., Мазуров В.Д. Нестационарные процессы математического программирования. М.: Наука, 1979.
24. Ермольев Ю.М. Методы стохастического программирования. М.: Наука, 1976.
25. Жуковский В.И., Чикрий А.А. Линейно-квадратичные дифференциальные игры. Киев: Наукова Думка, 1994.
26.Карлин С. Математические методы в теории игр, программировании
èэкономике. М.: Мир, 1964.
27Красовский Н.Н., Субботин А.И. Позиционные дифференциальные иг-
ры. М.: Наука, 1974.
28.Красовский Н.Н. Управление динамической системой. М.: Наука, 1985.
29.Куржанский А.Б. Управление и наблюдение в условиях неопределен-
ности. М.: Наука, 1977.
30. Левченков В.С. Алгебраический подход в теории выбора. М.: Наука, 1990.
31.Льюс Р.Д. и Райфа Х. Игры и решения. М.: ИЛ, 1961.
32.Макаров В.Л., Рубинов А.М. Математическая теория экономической
динамики и равновесия. М.: Наука, 1973.
33 Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение.
Ì.Наука. 1970.
34.Петросян Л.А., Томский Г.В. Геометрия простого преследования. Но-
восибирск: Наука, 1983.
35. Подиновский В.В., Ногин В.Д. Парето-оптимальные решения многокритериальных задач. М.: Наука, 1982.
36. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф.
Математическая теория оптимальных процессов. М.: Наука, 1976.
37. Пшеничный Б.Н. Выпуклый анализ и экстремальные задачи. М.: Наука, 1980.
38.Поляк Б.Т. Введение в оптимизацию. М.: Наука, 1983.
39.Розенмюллер И. Кооперативные игры и рынки. М.: Мир, 1974.
235
40. Смольяков Э.Р. Дифференциальные игры в смешанных стратегиях // Доклады АН СССР. 1970. Т. 191, N 1. С. 39-41.
41. Смольяков Э.Р. Понятие решения коалиционной игры N лиц с трансферабельностью // Доклады АН РФ. 1973. Т. 210, N 6. С. 1290 1292.
42. Смольяков Э.Р. Необходимые условия оптимальности решения программных дифференциальных игр. Ч. 1 и 2 // Известия АН СССР, Техни- ческая кибернетика. 1976. N 3. C. 23-31; N 6. С. 31-41.
43. Смольяков Э.Р. "Активные"игровые равновесия в системах / Математические методы в теории систем. М.: ВНИИ системных исследований. 1980. N 6. С. 32-51.
44. Смольяков Э.Р. Экстремальность и равновесность относительно заданных функций и игровые модели. 1. Слабые равновесия; 2. Сильные равновесия // Автоматика и телемеханика. 1983. N 3. С. 101-107; N 4. С. 41-49.
45. Смольяков Э.Р. Теоремы существования и необходимые условия оптимальности равновесия в дифференциальных играх со многими участниками // Кибернетика. 1985. N 4. С. 87-92.
46. Смольяков Э.Р. Равновесные модели при несовпадающих интересах участников. М.: Наука, 1986.
47. Смольяков Э.Р. Полное равновесие в некооперативных программных дифференциальных играх. Дифференциальные уравнения. 1997. Т. 33. N 11.
Ñ.1523-1527.
48.Смольяков Э.Р. Абсолютное равновесие в дифференциальных играх.//
Доклады АН РФ. 1998. Т. 358. N 5. С. 603 606.
49. Смольяков Э.Р. Седловые точки на невыпуклых подмножествах топологических пространств // Доклады АН РФ. 1997. Т. 355, N 4. С. 453 454.
50. Смольяков Э.Р. Теоремы существования равновесия в бескоалиционных играх.// Доклады АН РФ. 1998. Т. 361. N 1. С. 28-30.
51. Смольяков Э.Р. Условия существования сильных равновесий в дифференциальных играх со многими участниками.// Дифференциальные уравнения. 1998. Т. 34. N 11. С. 1521 1526.
52.Смольяков Э.Р. Обобщенное понятие седловой точки и его применение
âдифференциальных играх.// Автоматика и телемеханика. 2000. N 3. С. 66 75.
53.Смольяков Э.Р. Расширение классического бескоалиционного равнове-
сия и программные дифференциальные игры.// Кибернетика и системный анализ. 2000, N 4. С. 105 115.
54. Смольяков Э.Р. Равновесия для некооперативных дифференциальных
236
игр. //Дифференциальные уравнения. 1999. Т. 35. N 5. С. 686 691.
55. Смольяков Э.Р. Теория антагонизмов и дифференциальные игры. М.: Эдиториал УРСС, 2000.
56. Смольяков Э.Р. Проблемы многозначности в некооперативных играх. Доклады АН РФ. 2000. Т. 372. N 1. С. 25-28.
57. Смольяков Э.Р. Существование бесконечной системы понятий некооперативного равновесия.// Доклады АН. 2000. Т. 374. N 2. С. 173 176.
58. Смольяков Э.Р. Построение счетной системы понятий бескоалиционного равновесия.// Журнал вычислительной математики и математической физики. 2001. N 4. С. 570 576.
59. Смольяков Э.Р. Базовая система равновесий для некооперативных игр.// Доклады АН. 2001. Т. 378. N 4. С. 459 462.
60. Смольяков Э.Р. Сильное равновесие для некооперативных игр // Доклады АН РФ. 2001. Т. 380. N 5. С. 603 606.
61. Смольяков Э.Р. Новые равновесия и методики их поиска в многознач- ных некооперативных играх // Журнал вычислительной математики и математической физики. 2002. Т. 42. N 6. С. 815 822.
62. Смольяков Э.Р. Наиболее предпочтительное равновесие в некооперативных дифференциальных играх // Дифференциальные уравнения. 2002. Т. 38. N 1. С. 44 51.
63. Смольяков Э.Р. Равновесия в играх со многими участниками // Доклады АН РФ. 2002. Т. 382. N 2. С. 165 169.
64. Смольяков Э.Р. Аксиоматика теории кооперативных игр // Доклады академии наук РФ. 2002. Т. 383. N 2. С. 179 183.
65. Смольяков Э.Р. Несимметричные равновесия для игровых задач // Доклады академии наук РФ. 2002. Т. 386. N 4. С. 464 467.
66.Смольяков Э.Р. Система равновесий для игр со многими участниками
//Дифференциальные уравнения. 2002. Т. 38. N 11. С. 1517 1524.
67.Смольяков Э.Р. Несимметричные равновесия и дифференциальные иг-
ры // Дифференциальные уравнения. 2002. Т. 38. N 12. С. 1611 1619.
68. Смольяков Э.Р. Неизвестные страницы истории оптимального управления. М.: Эдиториал УРСС. 2002.
69. Смольяков Э.Р. Теория кооперативных игр без использования характеристической функции // Доклады АН РФ.2003. Т. 389. N 3. С. 318 323.
70. Смольяков Э.Р. Конфликтные равновесия на множествах с непустым пересечением // Доклады АН РФ. 2003. Т. 391. N 2. С.172-176.
237
71. Смольяков Э.Р. Теория динамических конфликтных задач на пересекающихся множествах // Дифференциальные уравнения. 2003. Т. 39. N 12.
Ñ.1637-1644.
72.Смольяков Э.Р. Построение теории кооперативных игр без использова-
ния характеристической функции // Журнал вычислительной математики и математической физики. 2004. Т. 44. N 1. С. 93 103.
73. Смольяков Э.Р. Согласованные равновесия и методика решения дифференциальных игр // Дифференциальные уравнения. 2004. Т. 40. N 11. С. 1521 1531.
74. Смольяков Э.Р. Теория конфликтных равновесий. М.: Едиториал УРСС.
2005.
75. Смольяков Э.Р. Теория равновесий, учитывающая не связанные с конфликтом интересы. Доклады АН РФ. 2005. Т. 402. N 1. С. 29 33.
76. Смольяков Э.Р. Расширенная базовая система конфликтных равновесий // Доклады АН РФ. 2006. Т. 409. N 2. С. 163 166.
77. Смольяков Э.Р. Вспомогательные сильные равновесия для динамиче- ских конфликтных задач // Дифференциальные уравнения. 2007. Т. 43. N 11. С. 1497-1506.
78. Смольяков Э.Р. Единственный справедливый дележ в статических и динамических кооперативных играх // Дифференциальные уравнения. 2007.
Ò.43. N 12. Ñ. 1637-1648.
79.Смольяков Э.Р. Сильное равновесие для конфликтных задач // Диф-
ференциальные уравнения. 2008. Т. 44. N 11. С. 1566-1575.
80. Смольяков Э.Р. Понятие справедливого дележа в кооперативных играх и его поиск // Кибернетика и системный анализ. 2008. N 6. С. 131-141.
81. Смольяков Э.Р. Ещ¼ шаг к единственности решения игровых задач // Доклады АН РФ. 2008. Т. 423. N 6. С. 743-747.
82. Смольяков Э.Р. Подход к разрешению проблемы единственности решения игровых задач // Кибернетика и системный анализ. 2009. N 2. С. 116-127.
83. Смольяков Э.Р. Усложн¼нные равновесия для игровых задач // Дифференциальные уравнения. 2009. Т. 45. N 5. С. 752-760.
84. Смольяков Э.Р. Теоретическое обоснование межзв¼здных пол¼тов. М.: Едиториал УРСС. 2005.
85. Смольяков Э.Р. Интегралы движения в двойственном пространстве
//Доклады АН РФ. 2007. Т. 414. N 4. С. 459-463.
238
86. Смольяков Э.Р. Особые экстремали в анализе размерностей // Доклады АН РФ. 2008. Т. 421. N 5. С. 602-606.
87. Смольяков Э.Р. Методы поиска дифференциальных уравнений произвольных динамических процессов // Дифференциальные уравнения. 2009.
Ò.45. N 12. Ñ. 1704-1715.
88.Субботин А.И., Ченцов А.Е. Оптимизация гарантий в задачах управ-
ления. М.: Наука, 1981.
89. Тихомиров В.М. Принцип Лагранжа и задачи оптимального управления. М.: МГУ, 1982.
90. Хеннекен П.Л., Торта А. Теория вероятностей и некоторые ее приложения. М.: Наука, 1974.
91. Хоботов Е.Н. Моделирование в задачах реинжиниринга производственных систем // Автоматика и телемеханика. 2001. N 8.
92. Черноусько Ф.Л., Меликян А.А. Игровые задачи управления и поиска. М.: Наука, 1974.
93.Шварц Лоран. Анализ, т. 1. М.: Мир, 1972.
94.Шварц Лоран. Анализ, т. 2. М.: Мир, 1972.
95.Aumann R.J., Shapley L.S. Values of non-atomic games. Princeton: Princeton
University Press, 1974.
96. Berkovitz L.D. "A Di erential Game without Pure Strategy Solutions on the Open Set // Advances in Game Theory. Ann. Math. Stud. 1964. N 52.
97.Contributions to the Theory of Games / Ed. H.W. Kuhn, A.W. Tucker. Princeton (N.Y.): Univ. Press, 1953. P. 173-182.
98.Elliott R.J., Kalton N.J., Markus L. Saddle Points for Linear Di erential Games. // SIAM J. Control. 1973. Vol. 11, N 1. P. 100-112.
99.Fan K. Fixed Points and Minimax Theorems in Locally Convex Topological Linear Spaces. // Proc. Nat. Acad. Sci. ,US. 1952. Vol. 28, N 2. P. 121-126.
100.Gelovani V.A., Smoljakov E.R. On the Existence of Stable States in Game Problems // Theory and Decision. Vol. 20, N 2. P. 189 - 203.
101.Lawser J.J. Properties of Dynamic Games. Diss. Univ. of Mich., 1970.
102.Nash J. Non-Cooperative Games // Annals of Mathematics. 1951. V. 54. N 2. P. 286 295.
103.Neumann J. Zur Theorie der Gesellschaftsspiele // Math. Annalen. 1928. V. 100. P. 295 320.
104.Ngee Choon Chia, Whalley J. A numerical example showing globally welfare-worsening liberalization of international trade in banking services //Journal of policy modeling. 1997. V. 19. N 2. P. 119 127.
239
105. Renato G. Flores Jr. The gains from MERCOSUL: A general equilibrium, imperfect competition evaluation // Journal of policy vodeling. 1997. V. 19. N 1.
P.1 18.
106.Roos C.F. Generalized Lagrange Problems in the Calculus of Variations
//Trans. Amer. Math. Soc. 1928. V. 30. P. 360 384.
107. Rosen J.B. Existence and Uniqueness of Equilibrium Point for Concave
N-Person Games // Econometrica. 1965. V. 33. P. 520 534.
108. Wu Wen-Tsun. On Non-Cooperative Games with Restricted Domains 0f Activities // Scientia Sinica. 1961. Vol. 10, N 4. P. 387409.
109. Yu P.L., Leitmann G. Nondominated Decisions and Cone Convexity in Dynamic Vulticriteria Dtcision Problems // J. Optimiz. Theory and Appl. 1974. Vol. 14, N 5. P. 573-584.
110. Yu P.L. Cone Convexity, Cone Extreme Points and Nondominated solutions in Decision Problems with Multiobjectives // J. Optimiz. Theory and Appl. 1974. Vol. 14, N 3. P. 319-377.
240