- •Факультет «Информатизации и управления»
- •Учебно - методический комплекс
- •08010007 «Финансы и кредит» ______________________________________________________
- •Экспертное заключение
- •Рабочая учебная программа
- •Основание
- •8. Глоссарий
- •10.Содержание
- •11. Приложение 1. Краткий конспект лекций
- •Введение в теорию игр.
- •Игры в чистых стратегиях.
- •3. Игры в смешанных стратегиях
- •4. Примеры конечных игр. Принцип минимакса
- •5. Решение игры в смешанных стратегиях. Основная теорема теории игр
- •6. Игры с природой в условиях неопределённости.Критерии для принятия решений в статистических играх.
- •2. Критерий Лапласа.
- •3. Критерий Сэвиджа.
- •4. Пример и выводы.
- •5. Критерий Гурвица.
- •7. Сведение матричной игры к задаче линейного программирования
4. Примеры конечных игр. Принцип минимакса
Приведем несколько примеров конечных игр. Каждую из них мы запишем в нормальной форме. Пример 1. Рассматривается игра, которую назовем «Поиск». В ней участвуют две стороны: К и С. К хочет найти С; С, наоборот, хочет спрятаться от К. У С есть два места — убежища I и II, где он может прятаться. Выбирает он себе любое убежище. Игрок К по правилам игры тоже может искать С, где ему вздумается. Если он нашел С, С проиграл одно очко, если не нашел, т. е. пошел не в то убежище, где спрятался С, то, наоборот, К проиграл одно очко. Требуется записать игру в нормальной форме. Решение. У К — две стратегии: К1 — искать в убежище I, К2 — искать в убежище II. У С — тоже две стратегии: C1 — прятаться в убежище I, C2 — прятаться в убежище II. Игра конечная — 2x2, матрица игры будет:
|
C1 |
C2 |
К1 |
1 |
-1 |
К2 |
-1 |
1 |
К этой игре мы еще вернемся в дальнейшем и найдем ее решение. А пока что просто порассуждаем за игрока К. Представим себе, что мы игрок К и что нам предлагается выбрать себе стратегию. Что ж, попробуем! Выберем, на пример, К1, т. е. будем искать всегда в убежище I. Но тогда разумный противник через несколько партий догадается о нашей стратегии и будет прятаться там, где мы его не ищем, т. е. в убежище II. Плохо! Выберем стратегию К2. Ничуть не лучше: противник снова догадаётся и будет прятаться в убежище I. Что же нам делать? Попробуем применять стратегии К1 и К2 попеременно, через одну партию игры. Но ведь противник и об этом может догадаться и будет прятаться каждый раз не там, где мы его ищем. Как ни кинь — все клин! Что же, значит, наше положение безвыходно? При любом выборе стратегии нам придется проигрывать? Выходит, что так. Давайте теперь встанем на точку зрения противника. С удивлением мы обнаружим, что его положение — ничуть не лучше нашего! Какую бы стратегию он ни выбрал — все ему невыгодно. Позже мы с вами решим эту игру, т. е. найдем пару оптимальных стратегий К и С. Впрочем, о них можно по секрету сообщить заранее: каждому игроку надо будет чередовать свои стратегии, но не регулярно (через одну), а случайным образом (например, подбросить монету и, если она упадет гербом, искать в убежище I, а если цифрой -в убежище II). Аналогично должен будет действовать и С. При этом в среднем на одну партию будет приходиться нулевой выигрыш («цена этой игры будет равна нулю): К не будет ни выигрывать, ни проигрывать. Не очень приятно, но все-таки много лучше, чем всегда быть в проигрыше! Здесь мы впервые столкнулись с одним из важных понятий теории игр — с понятием смешанной стратегии, т. е. чередования нескольких «чистых» стратегий по случайному закону в определенных пропорциях, или, как говорят, с определенными частотами. В данном примере каждая из стратегий применяется с частотой 1/2. Рассмотрим теперь другую игру, решение которой уже не будет столь очевидным. Пример 2. Игра «Три пальца». Два игрока К и С одновременно и не сговариваясь показывают друг другу один, два или три пальца. Если всего показанных пальцев (первым и вторым вместе) будет четное число, то выигрывает К: он получает столько очков, сколько всего было пальцев, если нечетное — выигрывает С, на тех же условиях. Требуется записать игру в нормальной форме. Решение. Перенумеруем стратегии по числу показанных пальцев. Игра 3x3. Матрица игры будет:
|
C1 |
C2 |
C3 |
К1 |
2 |
-3 |
4 |
К2 |
-3 |
4 |
-5 |
К3 |
4 |
-5 |
6 |
Поразмыслим немного над стратегиями каж дой стороны. Станем сначала на сторону К. Предположим, что мы выбрали стратегию К1. Что будет делать противник? Он разумен и хочет отдать поменьше. Ясно, он выберет стратегию С2; наш выигрыш при этом будет равен —3, т. е. мы потеряем 3 очка. Плоховато! За пишем число —3 против первой строки в добавочном столбце (см. матрицу 3):
|
C1 |
C2 |
C3 |
Минимумы строк |
К1 |
2 |
-3 |
4 |
-3* |
К2 |
-3 |
4 |
-5 |
-5 |
К3 |
4 |
-5 |
6 |
-5 |
Максимумы столбцов |
4* |
4* |
6 |
|
Попробуем другую стратегию - К2. На нее разумный противник ответит С3. Тогда мы потеряем 5 очков. Еще хуже! Третья стратегия — К3 — дает точно тот же результат: выигрыш (—5). Что же делать? Пожалуй, лучше других будет все-таки стратегия К1 - при ней мы, по крайней мере, не проиграем больше 3 очков! Ведь против этой стратегии стоит максимальное число дополнительного столбца — мы его отметили звездочкой. Выбрав стратегию К1, мы гарантируем себе, что, как бы ни вел себя противник, мы никак не проиграем больше 3 очков (т. е. не выиграем меньше (—3) очков). Величина (—3) есть максимальный гарантированный выигрыш, который мы («красные») можем себе обеспечить, применяя только одну-единственную стратегию. Та кой стратегией должна быть К1. Как мы получили (-3)? Нашли минимум каждой строки и из этих минимумов взяли максимальный. Эта величина называется максимином или нижней ценой игры. Будем обозначать ее α. Подумаем теперь за противника. Он тоже хочет отдать поменьше, а получить побольше. Но, какую бы он стратегию ни выбрал, мы («красные») поведем себя таким образом, чтобы получить с него побольше. Значит противник («синие») должен в каждом столбце выписать не минимальное, а максимальное число (см нижнюю добавочную строку в матрице (3)). Из этих максимумов он должен найти минимальный, так называемый минимакс или верхняя цена игры, которую мы обозначим β. Эта величина в нашем случае равна 4 и отмечена звездочкой. Чтобы не проиграть больше 4, «синие» должны придерживаться любой из своих двух стратегий С1, С2. Значит, если каждому участнику предлагается выбрать одну-единственную стратегию, то эти стратегии должны быть: К1 для «красных» и С1 или С2 для «синих». Как мы выбрали эти стратегии? Руководствуясь принципом осторожности, который говорит: в игре веди себя так, чтобы получить наибольшую выгоду при наихудших для тебя действиях противника. Этот принцип называется принципом минимакса и является в теории игр основным. Применяя этот принцип, мы пока что рекомендовали игроку К показывать один палец, игроку С - показывать один или два пальца. Но нашли ли мы решение игры, т.е. такую пару стратегий, которая являемся равновесным положением? Легко убедиться, что нет. Найденные нами стратегии обладают досадным свойством: они неустойчивы. Действительно, пусть оба игрока держатся рекомендованных чистых стратегий: К1 и, скажем, С1 Пока оба держатся этих стратегий, выигрыш будет равен 2, т. е. на каждую партию игры С проигрывает К два очка. К, может быть, и доволен, но С досадно. Он не хочет проигрывать. Допустим, он откуда-то узнал что мы придерживаемся стратегии К1. Что он будет делать? Разумеется, немедленно перейдет к стратегии С2 и будет получать по 3 очка, т. е. сведет наш выигрыш к -3. А если мы теперь узнаем о поведении С? Перейдем на стратегию К2. В ответ на это С перейдет на С3 и т. д. Мы убедились, что пара стратегий, вытекающих из принципа минимакса неустойчива: стоит одному игроку узнать, что делает другой, как равновесие нарушается... Всегда ли это будет так? Оказывается, не всегда.