Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Псковский государственный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

УМК ИОЭ Политех.doc

Скачиваний:

Добавлен:

22.08.2019

Размер:

3.84 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 78 / 358 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Тема 4. Теория игр

1. Основные понятия теории игр

2. Принцип минимакса и максимина в теории игр

3. Решение матричных игр без седловых точек

4. Упрощение игр

1. Основные понятия теории игр

В экономической деятельности часто встречается проблема принятия управленческих решений в условиях неопределенности. При этом неопределенность может быть связана как с сознательными действиями конкурента, противника и т.п., так и с другими факторами, влияющими на эффективность решения. Ситуации, в которых эффективность принимаемого одной стороной решения зависит от действий другой стороны, называются конфликтными.

В отличие от рассмотренных выше задач принятия решений в условиях определенности, риска и неопределенности, в которых внешняя среда (природа) предполагалась пассивной, в конфликтных ситуациях имеются противодействующие стороны, интересы которых противоположны. Теория, занимающаяся принятием решений в условиях конфликтных ситуаций, называется теорией игр.

Игра - это математическая модель конфликтной ситуации, в которой имеется, по крайней мере, два участника (игрока), каждый из которых стремится к достижению собственных целей. Задача теории игр состоит в выборе такой линии поведения данного игрока, отклонение от которой может лишь уменьшить его выигрыш.

Допустимые действия каждого из игроков, направленные на достижение некоторой цели, называются правилами игры. В общем случае правилами игры устанавливаются последовательность ходов, объем информации, которой располагает каждая сторона, о поведении другой стороны и результат (исход) игры. Правила определяют также конец игры, когда некоторая возможная последовательность выборов уже сделана и больше ходов делать не разрешается.

Количественная оценка результатов игры называется платежом.

Игра называется парной, если в ней участвуют только две стороны (два лица), либо множественной – при наличии более двух сторон. Участники множественной игры могут образовывать коалиции (игры в этом случае называются коалиционными). Множественная игра обращается в парную, если ее участники образуют две постоянные коалиции.

Парная игра называется игрой с нулевой суммой, если сумма платежей равна нулю, то есть если проигрыш одного игрока равен выигрышу второго. Такая конфликтная ситуация будет называться антагонистической.

В последние годы, помимо теории антагонистических, неантагонистических (кооперативных), конечных, бесконечных, позиционных и дифференциальных игр, начала развиваться теория рефлексивных игр. Рефлексивные игры изучают ситуации с учетом мысленного воспроизведения возможного образа действий и поведения противника. Дифференциальные игры изучают задачи преследования управляемого объекта другим управляемым объектом с учетом динамики их поведения; поведение объектов описывается дифференциальными уравнениями.

Однозначное описание выбора игрока в каждой из возможных ситуаций, когда он должен сделать личный ход, называется стратегией игрока. Стратегия игрока называется оптимальной, если при многократном повторении игры она обеспечивает игроку максимально возможный средний выигрыш (минимально возможный средний проигрыш).

Игра называется конечной, если число стратегий игроков конечно, и бесконечной, если хотя бы у одного из игроков число стратегий является бесконечным.

Выбор одной из предусмотренных правилами игры стратегий и ее осуществление называется ходом. Ходы бывают личные и случайные. Ход называется личным, если игрок сознательно выбирает один из возможных вариантов действий и осуществляет его. Ход называется случайным, если выбор производится не игроком, а каким-либо механизмом случайного выбора.

Существуют два способа описания игр: позиционный и нормальный. Позиционный способ связан с развернутой формой игры и сводится к графу последовательных шагов (дереву игры). Нормальный способ заключается в явном представлении совокупности стратегий игроков и платежной функции. Платежная функция в игре определяет для каждой совокупности выбранных игроками стратегий выигрыш каждой из сторон.

Пусть имеется два игрока, один из которых может выбрать i-ю стратегию из m своих возможных стратегий (i = 1,т), а второй, не зная выбора первого, выбирает j-ю стратегию из n своих возможных стратегий (j = 1,п). В результате первый игрок выигрывает величину a_ij и его цель будет заключаться в максимизации своего выигрыша, а второй игрок проигрывает эту величину и его цель – минимизация своего проигрыша. Если чисел a_ij составить матрицу (табл. 4.1) , то она будет называться платежной.

Таблица 4.1

Платежная матрица парной игры с нулевой суммой

Игрок 2 Игрок1	1	2	…	n
1	a₁₁	a₁₂	…	a_1n
2	a₂₁	a₂₂	…	a_2n
…	…	…	…	…
m	a_m1	a_m2	…	a_mn

Строки платежной матрицы соответствуют стратегиям первого игрока, а столбцы - стратегиям второго. Эти стратегии называются чистыми. Такую игру называют матричной игрой размерности m×n. В парной игре с ненулевой суммой выигрыш каждого игрока задается своей платежной матрицей. Поэтому такие игры называют биматричными.

2. Принцип минимакса и максимина в теории игр

При определении наилучших стратегий игроков следует учитывать, что противники, участвующие в игре, одинаково разумны, и каждый из них делает все для того, чтобы добиться своей цели. Выбирая i-ю стратегию игрока 1, мы должны рассчитывать, что игрок 2 ответит на нее той из своих j-х стратегий, для которой выигрыш игрока 1 будет минимальным. Найдем минимальное число в каждой строке матрицы и, обозначив его α_i, запишем рядом с платежной матрицей (табл. 4.2) в добавочный столбец.

Таблица 4.2

Платежная матрица парной игры с добавочным столбцом

и добавочной строкой

Игрок 2 Игрок 1	1	2	…	n	α_i=min a_ij ^j
1	a₁₁	a₁₂	…	a_1n	α₁
2	a₂₁	a₂₂	…	a_2n	α₂
…	…	…	…	…	…
m	a_m1	a_m2	…	a_mn	α_m
β_j₌max a_ij i	β₁	β₂	…	β_n

Игрок 1, зная свои минимальные выигрыши при любой стратегии игрока 2, будет предпочитать такую стратегию, при которой значение α_iявляется максимальным, то есть

(4.1)

Величина α - это гарантированный выигрыш, который может обеспечить себе игрок 1. Она называется нижней ценой игры (максимином). Стратегия, обеспечивающая получение нижней цены игры, называется максиминной стратегией. Если игрок 1 будет придерживаться своей максиминной (перестраховочной) стратегии, то ему гарантирован выигрыш не меньший величины α при любом поведении игрока 2.

Игрок 2 заинтересован уменьшить свой проигрыш или, что то же самое, выигрыш игрока 1 обратить в минимум. Поэтому для выбора своей наилучшей стратегии он должен найти максимальное значение выигрыша игрока 1 в каждом из столбцов и среди этих значений выбрать наименьшее. Максимальный элемент в каждом столбце обозначим через β_j. Эти элементы будем записывать в дополнительной строке табл. 4.2.

Наименьшее значение среди β_j обозначим β - это верхняя цена игры (минимакс), которая определяется по формуле

(4.2)

Использование игроком 2 своей минимаксной стратегии позволит ему при любом поведении игрока 1 проиграть не больше величины β.

Для нижней и верхней цены игры всегда справедливо следующее соотношение:

(4.3)

Игры, в которых нижняя цена равна верхней называются играми с седловой точкой.

Общее значение нижней и верхней цены игры в играх с седловой точкой называется чистой ценой игры γ, а стратегии, позволяющие достичь этого значения, - оптимальными чистыми стратегиями. Оптимальные стратегии и чистая цена являются решением игры.

Оптимальные стратегии обладают важным свойством. Они определяют в игре «положение равновесия», которое заключается в том, что каждый из игроков не заинтересован в отходе от своей оптимальной стратегии, так как это ему невыгодно. Чистую цену игры γ в игре с седловой точкой при условии одинаковой разумности партнеров игрок 1 не может увеличить, а игрок 2 — уменьшить.

Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях. Вероятность применения чистой стратегии в игре с седловой точкой равна единице.

Следует отметить, что игра может иметь более одной седловой точки.

Пример 5.1. Фирма планирует освоить производство трех товаров, которые будет реализовывать на рынке, где возможна продажа конкурентом аналогичных товаров. Фирме известны вероятности реализации своих товаров при наличии на рынке товаров-конкурентов (табл. 4.3).

Таблица 4.3

Платежная матрица игры

Конкурент Фирма	1	2	3	α_i
1	6	5	8	5
2	7	3	2	2
3	3	4	7	3
β_j	7	5	8

Решение:

Найдем нижнюю цену игры: .
Определим верхнюю цену игры: .
Игра имеет седловую точку, так как α=β=5. Чистая цена игры γ=5. Оптимальными чистыми стратегиями являются:

первая стратегия для рассматриваемой фирмы (производство и реализация товара 1);

вторая стратегия для конкурента (продажа товара 2).

3. Решение матричных игр без седловых точек

Поиск решения игры, платежная матрица которой не имеет седловой точки, приводит к сложной стратегии, состоящей в случайном применении двух и более чистых стратегий с определенными частотами. Такая сложная стратегия в теории игр называется смешанной. Смешанные стратегии игроков обозначаются, соответственно, p_t₌(p₁, р₂,…, р_m) и q_j₌(q₁,q₂, …, q_n), где р₁0, q_j0 - вероятности применения чистых стратегий i (i=1, m) и j (j=1, n), при этом

(4.4)

Платёжная функция в данном случае определяется как математическое ожидание выигрыша первого игрока при применении игроками смешанных стратегий p и q и равна

E(р, q)= (4.5)

В соответствии с принципом минимакса каждый игрок должен выбирать такую смешанную стратегию, которая максимизирует его наименьший гарантированный выигрыш. Аналогично случаю использования чистых стратегий наименьший гарантированный выигрыш первого игрока называется нижней ценой игры и равен

(4.6)

Аналогично определяется верхняя цена игры

(4.7)

Теорема Фон-Неймана. В любой матричной игре существует такая пара смешанных стратегий (p^*, q^*), что

Е(p,q^*) E(p^*,q^*) E(p^*,q) для любых p P_m_,q P_n_;(4.8)
(4.9)

Число γ=Е(р^*,q^*) называется ценой игры в смешанных стратегиях.

По теореме Фон-Неймана любая матричная игра имеет пару оптимальных смешанных стратегий. Для решения матричной игры необходимо отыскать эти оптимальные стратегии и цену игры.

Чистая стратегия называется активной, если она используется в некоторой оптимальной смешанной стратегии с ненулевой вероятностью.

Теорема об активных стратегиях. Если один из игроков использует оптимальную стратегию, то его противник достигает цены игры γ при любой своей смешанной стратегии, в которой используются только активные чистые стратегии. Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш (или минимальный средний проигрыш), равный цене игры у, независимо от того, какие действия предпринимает другой игрок, если только он не выходит за пределы своих активных стратегий.

В основной теореме теории игр утверждается, что любая конечная игра двух лиц с нулевой суммой имеет, по крайней мере, одно решение, возможно, в смешанных стратегиях. Цена игры γ - средний выигрыш, приходящийся на одну партию, - всегда удовлетворяет условию , т.е. лежит между нижней и верхней ценой игры. Следовательно, каждый игрок при многократном покорении игры, придерживаясь смешанных стратегий, получает более выгодный доя себя результат. Оптимальное решение игры в смешанных стратегиях, также как и решение в чистых стратегиях, обладает свойством, которое заключается в том, что каждый из игроков не заинтересован в отходе от своей оптимальной смешанной стратегии, если его противник применяет оптимальную смешанную стратегию, так как это ему невыгодно.

4. Упрощение игр

Для игр с платежными матрицами большой размерности отыскание решения можно упростить, если уменьшить их размерность путем вычеркивания дублирующих и заведомо невыгодных стратегий, а также замены некоторых групп чистых стратегий смешанными.

Если в платежной матрице игры все элементы строки (столбца) равны соответствующим элементам другой строки (столбца), то соответствующие этим строкам (столбцам) стратегии называются дублирующими.

В некоторых играх одна из стратегий может быть заведомо менее целесообразной, чем другая. Например, вторая стратегия дает первому игроку больший выигрыш, чем первая стратегия при любом выборе стратегии вторым игроком. Это означает, что первая строка платежной матрицы будет являться доминируемой, а вторая - доминирующей.

Будем говорить, что строка i₁ доминирует строку i₂,если для всех j=1,…,n справедливы неравенства и существует такая стратегия j₀, что .

Если из платежной матрицы убрать все доминируемые строки, то решение игры с полученной матрицей совпадает с решением исходной игры. Таким образом, иногда можно уменьшить размерность платежной матрицы путем удаления доминируемых строк.

Аналогично доминирование определяется и для столбцов.

Столбец j₂ доминирует столбец j₁, если для любого i = 1, …, m справедливы неравенства и существует такая стратегия i₀, что .

Платежная матрица может быть также упрощена с помощью удаления доминирующих столбцов.

Пример 4.2. Упростить игру, представленную платежной следующей матрицей (табл. 4.4).

Таблица 4.4

Платежная матрица игры

Игрок 2 Игрок 1	1	2	3
1	-2	0	1
2	3	4	5
3	2	7	-2

Решение:

Сравнивая почленно элементы 1-й и 2-й строк, видим, что все элементы 1-й строки меньше соответствующих элементов 2-й строки. Следовательно, 1-я стратегия для игрока 1 заведомо невыгодна, и ее можно исключить.

Аналогично, сравнивая элементы 1-го и 2-го столбца, исключаем 2-й столбец, так как для игрока 2 невыгодна 2-я стратегия. В полученной матрице 2х2 исключаем доминируемую 2-ю строку и т.д.

<<< < Предыдущая 1 2 3 4 5 6 78 / 358 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
15.07.2019133.42 Кб12Уголовное право_Геворкян.rtf
#
20.11.2018252.93 Кб20УД гидротермическая обработка и консервированги....doc
#
10.04.2015940.57 Кб222УИП Учебник для юр.ВУЗов.rtf
#
26.11.2019239.62 Кб30Указания к контр.doc
#
01.05.2025173.57 Кб4УМК 3.2. Совремн драмат.2012.doc
#
22.08.20193.84 Mб78УМК ИОЭ Политех.doc
#
01.05.2025127.49 Кб5УМК по математике.doc
#
25.11.2019579.07 Кб20УМК по риторике испр.doc
#
16.08.20191.37 Mб24УМК по экономике.doc
#
29.08.2019186.37 Кб15УМК Русский язык в функциональном аспекте.doc
#
01.04.20252.34 Mб6УМК Статистика .docx