Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Мат. мет. исл. оп Погорелов / Лекции по мат. мет. ИО.doc
Скачиваний:
67
Добавлен:
26.03.2015
Размер:
3.62 Mб
Скачать

12.2. Задача полуопределенного программирования

Пусть является множеством симметричныхn × n матриц. Пусть C, и . Определим задачу полуопределенного программирования (ПОП) как:

минимизовать при условиях:

, .

а) ЛП является частным случаем ПОП, когда ,и. ПОП в этом случае формулируется следующим образом:минимизировать . Полуопределенное программирование получило названиелинейного программирования 21-го века.

б) Лагранжиан двойственной задачи ПОП равен:

ДПОП: =

=при условии.

Это справедливо, поскольку: для всех тогда и только тогда, когда . Дополнительное менее жесткое требование: .

в) Задачи полуопределенного программирования эффективно решаются при использовании методов внутренней точки.

12.3. Игра «Симметричное рандеву»

Предположим, что два игрока находятся в двух комнатах. В каждой комнате имеются часы с боем и три телефона, которые попарно соединены наугад по схеме, неизвестной игрокам. В момент боя курантов (который происходит каждый час) игроки выбирают один из своих телефонов, чтобы связаться друг с другом.

Рис. 12.1. Схема игры

Поскольку соединение не гарантированно в каждом отдельном случае, игроки желают минимизировать ожидаемое количество попыток. Пусть в момент времени 1 каждый игрок поднял телефонную трубку выбранного наугад телефона, и они не смогли подключится.

Предположим, что игрок I пометил телефонный аппарат, трубку которого он поднял в момент наступления первого часа, как «a». Другие два телефона он пометил случайным образом как «b» и «с». Его возможные чистые стратегии для второго часа – поднять либо a, либо b, либо с. Обозначим вероятности этих событий как . Мы предполагаем, что игроки симметричны в своих возможностях, и поэтому игрок II должен использовать те же смешанные стратегии. Вероятность того, что игрокам не удастся соединиться при следующей попытке равна

.

Матрица положительно определена и минимизация достигается при с . Подобным образом рассматриваем вероятности и в последующие моменты времени. Для момента времени 3 мы имеем 9 чистых стратегий:aa, ab, ac, ba, bb, bc, ca, cb, cc. Предположим, игроки принимают их с вероятностями . Можно показать, что вероятность того, что игрокам не удастся соединиться после третьей попытки, равна

Матрица не является положительно определенной. (Ее собственные значения равны.) Это означает, что квадратичная формаимеет локальные минимумы. Например: даст . Однако, лучше , который дает. Как мы можем доказать, что последний минимум является глобальным?

Пусть являетсяматрицей, элементами которой являются единицы. Заметим, что для того, чтобы х был вектором вероятностей, должно выполняться . Как и в случае задачи минимального разреза мы сводимк положительно определенной матрицеХ и рассматриваем задачу:

минимизировать при условиях , .

Мы можем определить оптимальное значение этой задачи ПОП численно. Оно равно . Эта величина обеспечивает нижнюю границу вероятности того, что игроки не соединятся после третьей попытки. Оптимальному решению соответствует вектор. Данная стратегия минимизирует вероятность, что игроки не соединятся к концу третьей попытки.

Итак успешной оказывается следующая стратегия. Вначале игроки выбирают телефонные трубки наугад, и если не соединяются сразу, тогда должны выбрать комбинации ,или, каждую с вероятностью.

Примем, что они не соединились при первой попытке, ожидаемое число дальнейших попыток равно . Это число меньше, чем 3. Существует много простых, но нерешенных проблем в играх типа рандеву.