1.Классификация.
Разбиение исходного множества на классы. Можно считать, что каждый класс есть подмножество исходного множества альтернатив. Здесь важно отметить, что классы не упорядочены друг относительно друга. При этом не указано, какой класс лучше (старше, дороже) другого. Можно, например, классифицировать население по полу или по региону проживания. Правильная постановка диагноза - также пример классификации. Компьютерные системы, помогающие врачу ставить диагноз, существуют. И решают они именно задачу классификации, т.е. отнесения больного к нужному классу, который эквивалентен названию болезни.
2. Стратификация.
Это название произошло от термина "страта", (strata) что означает "слой", "пласт". Стратификация в этом случае является разбиением множества на ряд уровней или слоев. В отличие от классов, страты упорядочены.
Можно полагать, что страты выражают некоторые уровни "качества".
Несколько примеров классических стратификаций:
оценки уровня знаний ("отлично", "хорошо" и т.д.)
звезды отелей
спортивные разряды
Связь страт с неким абстрактным "качеством" крайне важна для понимания идеи стратификации.
3. Ранжирование.
Внешне метод напоминает стратификацию, но в отличие от нее уровни не выражают качества, а трактуются просто как порядковый номер в списке. Это различие настолько важно, что на нем стоит остановиться подробнее.
Упорядочение называется ранжировкой, если указан только номер места объекта в упорядочении, и больше ничего. Если мы знаем только места, полученные спортсменами по результатам соревнований, но не знаем результаты, то это - типичная ранжировка.
Места в ранжировке естественно называются "рангами". Ранг 1 принято присваивать наилучшему объекту. Итак, в отличие от стратификации, здесь играет роль только номер "полочки", на которую кладут альтернативы. Один и тот же ранг может быть присвоен нескольким объектам. Тогда ранжировка называется нестрогой. Тогда как в строгой ранжировке каждому объекту присваивается уникальный номер ранга.
Таковы общие черты понятия структуризации множества альтернатив. Однако структура нам нужна не сама по себе, а с целью выполнить выбор. Классификация сводится по сути к выбору определенного класса, к которому следует отнести альтернативу. Стратификация и ранжировка предоставляют более широкие возможности выбора. Чтобы выполнить структуризацию, надо рассмотреть методы, которыми она выполняется. Методы структуризации по существу и есть сердцевина поддержки принятия решений.
Две классификации методов структурирования множества альтернатив
Такие методы можно классифицировать различным образом. Прежде всего, и чаще всего эти методы делят на критериальные и некритериальные.
Термин критерий применяют для описания ситуации выбора. Например, говорят о "критериях выбора автомобиля".
Понятно, что критериальное структурирование основано на сопоставлении альтернатив по некоторому набору критериев. Что же такое некритериальные методы структурирования?
Предположим у нас есть множество альтернатив. Если выбирать из него пары и просить экспертов или ЛПР сравнить членов пары "в целом". Предполагается, что все альтернативы попарно сравнимы. При этом эксплуатируется способность человеческого мозга создавать общее представление о предмете.
Следующий по важности способ классификации методов структурирования связан с количеством ЛПР или экспертов, участвующих в процессе выбора. Говорят либо об индивидуальных, либо о групповых решениях. Рейтинговое голосование в Думе - пример одного из методов группового принятия решений.
Допустим, на роль спикера претендуют 5 человек. Тогда каждый из депутатов дает свою ранжировку (возможно нестрогую) этих пяти кандидатов. Возникает задача построения обобщенной (синонимы: интегральной, результирующей, компромиссной) ранжировки, на основе которой и будет определено - кто же станет спикером.
Некритериальное структурирование множества альтернатив
Возьмем две альтернативы А и Б. При их парном сравнении возможны только 3 варианта результата:
А лучше Б (будем обозначать это как А > Б)
А хуже Б (А < Б)
А и Б равноценны (А = Б)
Если сравнить попарно все альтернативы исходного множества, то часто можно получить нестрогую ранжировку. Например, для множества {a,b,c,d,e} можно получить: c > d > a = e > b, или тот же результат с номерами рангов
|
№ ранга |
альтернатива |
|
1 |
c |
|
2 |
d |
|
3 |
a, e |
|
4 |
b |
В итоге мы получили структурированное множество, не используя понятия "критерий".
Существует более десятка способов преобразования подобных структур в ранжировку.
Рассмотрим один из наиболее часто применяемых способов, который называется "метод строчных сумм". Для реализации метода, прежде всего, нужно построить таблицу парных сравнений.
Для нашего примера она выглядит следующим образом.
|
|
a |
b |
c |
d |
|
|
a |
*** |
1 |
0 |
1 |
2 |
|
b |
0 |
*** |
1/2 |
1 |
1,5 |
|
c |
1 |
1/2 |
*** |
0 |
1,5 |
|
d |
0 |
0 |
1 |
*** |
1 |
Наименования строк и столбцов соответствуют именам альтернатив. На пересечении строки и столбца ставятся числа по следующим правилам:
- ставится 1, если альтернатива с именем строки лучше альтернативы с именем столбца,
- ставится 0, если альтернатива с именем строки хуже альтернативы с именем столбца,
- ставится 1/2, если альтернатива с именем строки равноценна альтернативе с именем столбца.
Клетки таблицы, у которых имя строки совпадает с именем столбца, не заполняются (в нашем примере в этих клетках проставлены "звездочки"). Затем подсчитываются суммы строк (в примере - красные числа в крайнем справа столбце). Наконец, строится ранжировка альтернатив следующим способом.
Альтернативе, имеющей максимальную строчную сумму, присваивается ранг 1. Альтернативе, имеющей следующую по величине сумму, присваивается ранг 2 (в нашем примере таких альтернатив две: b и c). И так далее, пока не будут отранжированы все альтернативы.
В итоге, получаем ранжировку:
|
№ ранга |
альтернатива |
|
1 |
a |
|
2 |
b, c |
|
3 |
d |
Описанный метод – лишь один из многих методов упорядочения альтернатив на основе результатов парных сравнений.
Структурирование множества альтернатив с использованием критериев
В этом случае, исходная модель имеет вид следующей таблицы.
|
|
k1 |
k2 |
... |
km |
|
a1 |
x11 |
x12 |
... |
x1m |
|
a2 |
x21 |
x22 |
... |
... |
|
... |
... |
... |
... |
... |
|
an |
xn1 |
xn2 |
... |
xnm |
Имена строк представляют имена альтернатив, имена столбцов - имена критериев. На пересечении i-й строки и j-го столбца записывается оценка xij альтернативы ai по критерию kj .
Назовем такую форму представления модели выбора "критериальной таблицей".
Одним из способов упорядочения альтернатив является так называемая "линейная свертка" (взвешенная сумма). Суть его состоит в том, что сначала некоторым образом выбираются весовые коэффициенты критериев. Обозначим их вектором w=(w1 , w2 , ... , wm). Затем, для каждой альтернативы (каждой i-ой строки таблицы) рассчитывается следующая величина
si = xij wj (сумма берется для всех j от 1 до m).
Наконец, принимается правило: чем больше значение si, тем лучше альтернатива ai.
Кроме того, линейная свертка основана на неявном постулате: "низкая оценка по одному критерию может быть компенсирована высокой оценкой по другому". Однако, этот постулат верен отнюдь не для всех моделей сравнительной оценки "качества". Простейший пример – ухудшение качества видеоизображения не может быть компенсировано улучшением качества его звука.
Линейная свертка – простейший пример функции полезности. Таких функций разработано достаточно много.
Рассмотрим мультипликативную свертку. Она используется в моделях, основанных на постулате: "низкая оценка хотя бы по одному критерию влечет за собой низкое значение функции полезности". Записывается такая свертка следующим образом
si = П xijwj (произведение берется для всех j от 1 до m).
При этом, должны быть выполнены условия: 0≤ xij ≤ 1 и wj = 1. (где w – вес критерия)
В теории многокритериального анализа метод структурирования множества альтернатив (с учетом весов критериев или без него) принято называть "решающим правилом". Разнообразие решающих правил очень велико.
Методы теории игр.
Теория игр - это математическая теория конфликтных ситуаций, разрабатывающая рекомендации по наиболее рациональному образу действий каждого из участников конфликтной ситуации, а именно, таких действий, которые обеспечили бы ему наилучший результат. Стороны, участвующие в конфликте называют игроками. Каждый игрок имеет некоторое множество возможных выборов, называемых стратегиями. Результаты или платежи в игре задаются функциями выигрыша, зависящими от стратегий каждого из игроков.
В зависимости от количества игроков различают игры двух и n игроков.
Первые из них наиболее изучены. Игры трех и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения.
В зависимости от числа возможных стратегий игры делятся на «конечные» и «бесконечные».
Игра называется конечной, если у каждого игрока имеется только конечное число стратегий, и бесконечной, если хотя бы у одного из игроков имеется бесконечное число стратегий.
Игра с двумя игроками, в которых выигрыш одного из них равен проигрышу другого, называется игрой двух лиц с нулевой суммой, или антагонистической. В такой игре достаточно задать результаты в виде платежей для одного из игроков.
Предполагается, что функция выигрыша и множество стратегий, доступных каждому из игроков, общеизвестны.
Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры обеспечивает одному игроку максимально возможный средний выигрыш, а другому – минимальный средний проигрыш.
Задачей теории игр является определение оптимальной стратегии для каждого игрока. При выборе оптимальной стратегии предполагается, что лицу, принимающего решение противостоит разумный противник.
Платежная матрица.
Рассмотрим конечную парную игру с нулевой суммой, где у игрока А имеется m стратегий, а у игрока В – n стратегий (игра m×n). Обозначим стратегии игрока А через А1, А2,…, Аm, а стратегии игрока В через В1, В2,…, Вn.
В результате выбора игроками любой пары стратегий (Аi, Bj) однозначно определяется исход игры, т.е. выигрыш aij игрока А (положительный или отрицательный) и проигрыш (-aij) игрока В.
Набор выигрышей aij для разных значений i, j располагают в виде матрицы, строки которой отвечают стратегия игрока А, а столбцы - стратегиям игрока В.
Такая матрица называется платежной матрицей или матрицей игры. Общий вид платежной матрицы представлен в следующей таблице.
|
Стратегии |
В1 |
В2 |
… |
Вn |
|
А1 |
a11 |
a12 |
… |
a1n |
|
А2 |
a21 |
a22 |
… |
a2n |
|
… |
… |
… |
… |
… |
|
Аm |
am1 |
am2 |
… |
amn |
Задать игру означает задать m стратегий игрока А, n стратегий игрока В и платежную матрицу.
Пример 1. Пусть каждый из двух игроков А, В может записать независимо от другого цифры 1, 2, 3. Если разность между цифрами положительна, то первый игрок выигрывает количество очков, равное разности между цифрами, и, наоборот, если разность отрицательна, то выигрывает второй игрок. Если разность равна нулю, то игра заканчивается вничью.
В этой игре каждый из игроков имеет три стратегии – записать число 1, записать 2, записать 3, которые составляют матрицу игры 3×3., представляющую выигрыш игрока А.
|
стратегии |
В1=1 |
В2=2 |
В3=3 |
|
А1=1 А2=2 А3=3 |
0 1 2 |
-1 0 1 |
-2 -1 0 |
Оптимальные решения в играх двух лиц с нулевой суммой.
Для решения игры двух лиц с нулевой суммой предлагается критерий минимакса – максимина. Этот критерий является наиболее осторожным, поскольку основывается на выборе наилучшей из наихудших возможностей. Рассмотрим игру с матрицей
|
Стратегии |
В1 |
В2 |
… |
Вn |
αi |
|
А1 |
a11 |
a12 |
… |
a1n |
α1 |
|
А2 |
a21 |
a22 |
… |
a2n |
α2 |
|
… |
… |
… |
… |
… |
… |
|
Аm |
am1 |
am2 |
… |
amn |
αm |
|
j |
1 |
2 |
… |
n |
|
Каждый игрок стремится себе обеспечить максимально возможный выигрыш при любых действиях противника. Найдем оптимальные стратегии для каждого из игроков.
Игрок А играет против игрока В и считает, что какую бы стратегию он ни выбрал, игрок В постарается выбрать стратегию, минимизирующую его проигрыш, и тем самым минимизирующую выигрыш игрока А, т.е.
,
(по строкам).
За оптимальную игрок А разумеется, выберет стратегию, для которой выигрыш будет максимальным, т.е.

Выбранная игроком А стратегия называется максиминной стратегией, а соответствующее ей значение выигрыша α называется нижней ценой игры. Это гарантированный выигрыш игрока А при любой стратегии игрока В.
В итоге, если игрок А придерживается своей максиминной стратегии, его выигрышв любом случае будет не меньше нижней цены игры, т.е.

Игрок В считает, что какую бы стратегию он ни выбрал, игрок А выберет стратегию, максимизирующую его выигрыш, значит, из осторожности он должен выбрать максимальный свой проигрыш
,
(по столбцам).
Далее, среди этих стратегий игрок В должен выбрать в качестве оптимальной такую стратегию, для которой его проигрыш j минимален, т.е.

Выбранная игроком В стратегия называется минимаксной стратегией, а соответствующее ей значение проигрыша называется верхней ценой игры. Это гарантированный минимальный проигрыш игрока В при любой стратегии игрока А.
В итоге, если игрок В придерживается своей минимаксной стратегии, его проигрыш в любом случае будет не больше верхней цены игры, т.е.

Из условий, определяющих критерий минимакса – максимина, следует

Игра, для которой α = называется игрой с седловой точкой.
Решением игры
называется пара
оптимальных стратегий, соответствующих
седловой точке.
Выигрыш aij,
соответствующий решению игры называется
ценой игры
(ν),
причем ν = α
= .
Решение игры обладает следующим свойством (устойчивостью): если один из игроков придерживается своей оптимальной стратегии, то для другого игрока не выгодно отклоняться от своей оптимальной стратегии.
Если игра имеет седловую точку, то есть α = , то говорят, что она решается в чистых стратегиях
Найдем решение игры примера 1. Платежная матрица игры имеет вид
|
Стратегии |
В1 |
В2 |
В3 |
αi |
|
А1 А2 А3 |
0 1 2 |
-1 0 1 |
-2 -1 0 |
-2 -1 0 |
|
j |
2 |
1 |
0 |
|
Нижняя цена игры
,
верхняя цена игры
.
Так какα =
,
то игра имеет
седловую точку. Решение игры (А3,В3),
цена игры ν
=0.
Решение игры в смешанных стратегиях.
Если игра не имеет седловой точки, т.е. α < , то применение чистых стратегий не дает оптимального решения игры. Поиск решения таких игр приводит к применению смешанных стратегий.
Существует несколько методов нахождения оптимальных стратегий в играх двух лиц с нулевой суммой. Задача нахождения оптимального решения усложняется с ростом числа стратегий.
Смешанной стратегией
SA
игрока А называется применение чистых
стратегий А1,
А2,…,Аi,…Аm
с вероятностями p1,
p2,…,pi,…pm,
причем сумма вероятностей равна 1:
.
Смешанные стратегии игрока записываются
в виде матрицы:
,
или в виде строки
.
Аналогично свешанные стратегии игрока
В обозначаются:
или
,
где сумма вероятностей появления
стратегий игрока В равна 1:
.
Чистые стратегии можно считать частным случаем смешанных и задавать строкой из нулей и единицы, причем единица должна стоять в позиции, соответствующей чистой стратегии.
На основании
принципа минимакса определяется
оптимальное решение игры: это пара
оптимальных стратегий
,
в общем случае смешанных, обладающих
следующим свойством: если один из игроков
придерживается своей оптимальной
стратегии, то другому не может быть
выгодно отступать от своей оптимальной
стратегии. Выигрыш, соответствующей
оптимальному решению, называетсяценой
игры
.
Цена игры удовлетворяет неравенству:
,
где
- нижняя цена игры;
- верхняя.
Теорема Неймана (основная теорема теории игр)
Каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий.
Если чистая стратегия входит в оптимальную смешанную стратегию с вероятностью, отличной от нуля, то она называется активной.
Теорема об активных стратегиях.
Если один из
игроков придерживается своей оптимальной
смешанной стратегии, то выигрыш остается
неизменным и равен цене игры
,
если второй игрок не выходит за пределы
своих активных стратегий.
Пусть задана платежная матрица игры:

Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию
,
а игрок В чистую стратегию
(соответствует первому столбцу платежной
матрицы Р), равен цене игры
:
.
Тот же средний
выигрыш получит игрок А, если игрок В
выберет стратегию
,
то есть:
.
Учитывая, что
,
получим систему уравнений для определения
оптимальной стратегии
и цены игра
:

Решая эту систему, получим оптимальную стратегию и цену игры:

Применяя теорему
об активных стратегиях
- оптимальной стратегии игрока В,
получаем, что при любой чистой стратегии
игрока А (
или
)
средней проигрыш игрока В равен цене
игры
:

Решая эту систему, получим оптимальную стратегию и цену игры:

Пример
Игра "Поиск" задана платежной матрицей без седловой точки:

Ищем решение в
смешанных стратегиях; для игрока А
средней выигрыш равен цене игры
,
для игрока В средний проигрыш равен
цене игры. Системы уравнений имеет вид:

Решая эти системы
получаем

Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью 1/2, при этом средней выигрыш равен 0.
Для уменьшения размерности игры используют удаление дублирующих (одинаковых) и заведомо невыгодных стратегий.
Упрощение платежной матрицы.
Доминирующие и доминируемые стратегии
Столбцы и строки, у которых соответствующие элементы платежной матрицы равны, называются дублирующими и в платежной матрице следует оставить только одну из них.
Доминирование по строкам.
Если в платежной матрице для двух строк k, s выполняются условия:


,
то стратегия Ак называется доминирующей (заведомо выгодной), а стратегия Аs – доминируемой (заведомо не выгодной) и ее можно удалить (в смешанной стратегии получим вероятность для этой стратегии, равную нулю).
Доминирование по столбцам.
Если в платежной матрице для двух столбцов k, s выполняются условия:
,
то стратегия Вк является доминирующей, а стратегия Вs – доминируемой и ее удалить.
Пример. Рассмотрим игру, представленную платежной матрицей




Все элементы стратегии А2 меньше элементов стратегии А3, т.е. А2 заведомо невыгодна для первого игрока и ее можно исключить.
Все элементы А4 меньше А3, исключаем А4.

Для второго игрока: сравнивая В1 и В4, исключаем В1; сравнивая В2 и В4, исключаем В2; сравнивая В3 и В4, исключаем В3. В результате преобразований получим матрицу




Решение игры не изменится, если добавить ко всем элементам матрицы некоторое число, при этом цена игры увеличится на это число. Например,
.
Решив преобразованную игру, нужно помнить, что от полученной цены игры необходимо вновь отнять добавленное в начале решения число
Активные стратегии.
Чистая стратегия, которая входит в смешанную стратегию с вероятностью больше нуля, называется активной.
Теорема об
активных стратегиях:
если один из
игроков придерживается своей оптимальной
смешанной стратегии, то выигрыш остается
неизменным и равен цене игры
,
если второй игрок не выходит за пределы
своих активных стратегий.
