Теория Азартного Игрока
.docxКакие условия использования критерия азартного игрока?
Критерий азартного игрока (или максимакса, от англ. maximax) применяется в теории принятия решений в условиях неопределенности, когда человек склонен к максимальному оптимизму и рассчитывает на наилучший возможный исход.
Условия использования критерия максимакса (азартного игрока):
Неизвестны вероятности состояний природы. — Нет оснований судить, какое из возможных состояний наступит.
Известны выигрыши (или прибыли) по всем альтернативам и возможным состояниям. — Представлены в виде матрицы выигрышей.
Лицо, принимающее решение, склонно к риску и оптимизму. — Считает, что сработает наилучший возможный сценарий.
Суть критерия:
Для каждой альтернативы определяется её максимально возможный выигрыш, и затем выбирается альтернатива с наибольшим из этих максимумов:
Максимакс=maxi(maxjaij)\text{Максимакс} = \max_i \left( \max_j a_{ij} \right)
Где:
aija_{ij} — выигрыш при ii-й альтернативе и jj-м состоянии природы.
Выбирается та альтернатива, у которой наибольший из возможных выигрышей.
Пример:
Если у альтернатив:
a1a_1: максимум = 8
a2a_2: максимум = 7 то азартный игрок выберет a1a_1, потому что "вдруг повезёт".
Решить задачу с помощью критерия азартного игрока.
Решим задачу с помощью критерия азартного игрока (максимакса), используя твою матрицу выигрышей:
Обозначим:
Альтернатива a1=(4,3,8,2)a_1 = (4, 3, 8, 2)
Альтернатива a2=(3,7,1,3)a_2 = (3, 7, 1, 3)
Шаг 1. Найдём максимальные значения (наилучшие исходы) для каждой альтернативы:
max(a1)=max(4,3,8,2)=8\max(a_1) = \max(4, 3, 8, 2) = 8
max(a2)=max(3,7,1,3)=7\max(a_2) = \max(3, 7, 1, 3) = 7
Шаг 2. Выберем наибольший максимум:
max(8,7)=8\max(8, 7) = 8
Ответ:
По критерию азартного игрока (максимакса) выбираем альтернативу с наивысшим возможным выигрышем:
Выбор: альтернатива a1
Какие условия использования критерия произведений?
Критерий произведений (или критерий умножения выигрышей) используется реже, но он также относится к методам принятия решений в условиях неопределенности. Этот критерий ориентирован на максимизацию произведения всех возможных выигрышей по каждой альтернативе.
Условия использования критерия произведений:
Неизвестны вероятности состояний природы. — Как и в других критериях для неопределённости, вероятности либо отсутствуют, либо считаются равновероятными.
**Рассматриваются только положительные значения выигрышей. — Так как используется произведение, все значения должны быть строго больше нуля (иначе результат будет равен нулю или бессмысленен).
ЛПР (лицо, принимающее решение) считает, что выгодно учитывать все исходы одновременно, и ориентируется на сбалансированную устойчивость альтернативы по всем возможным сценариям. — Предпочтение отдаётся той альтернативе, у которой произведение всех её выигрышей наибольшее.
Суть критерия:
Для каждой альтернативы aia_i вычисляется:
P(ai)=∏j=1naijP(a_i) = \prod_{j=1}^{n} a_{ij}
Где:
aija_{ij} — выигрыш при ii-й альтернативе и jj-м состоянии природы,
∏\prod — произведение.
Затем выбирается альтернатива с максимальным произведением.
Важно:
Если хотя бы один элемент равен нулю, всё произведение станет нулевым.
Если есть отрицательные значения, критерий может давать парадоксальные или неприменимые результаты, так что он применим только к положительным выигрышам.
Когда использовать:
Когда выигрыши положительные.
Когда интересует устойчивая совокупная эффективность по всем исходам, а не только лучший или худший.
Решить задачу с помощью критерия произведений.
Решим задачу с помощью критерия произведений, используя твою матрицу выигрышей:
Обозначим:
Альтернатива a1=(4,3,8,2)a_1 = (4, 3, 8, 2)
Альтернатива a2=(3,7,1,3)a_2 = (3, 7, 1, 3)
Шаг 1. Вычислим произведение всех значений для каждой альтернативы:
Для a1a_1:
P(a1)=4×3×8×2=192P(a_1) = 4 \times 3 \times 8 \times 2 = 192
Для a2a_2:
P(a2)=3×7×1×3=63P(a_2) = 3 \times 7 \times 1 \times 3 = 63
Шаг 2. Сравниваем произведения:
P(a1)=192P(a_1) = 192
P(a2)=63P(a_2) = 63
Ответ:
По критерию произведений выбираем альтернативу с наибольшим произведением выигрышей:
Выбор: альтернатива a1
Какие условия использования критерия Севиджа?
Критерий Сэвиджа (или минимакса сожаления) применяется в теории принятия решений в условиях неопределенности, когда человек хочет минимизировать риск сожаления из-за принятия неидеального решения.
Условия использования критерия Сэвиджа:
Неизвестны вероятности состояний природы. — Нет данных о вероятностях, и нельзя их достоверно оценить.
Дано множество альтернатив и состояний природы, представленных в виде матрицы выигрышей (или потерь).
Требуется избежать наибольших возможных сожалений (упущенных выгод) — т.е. выбрать стратегию, при которой максимальное сожаление будет наименьшим.
Используется матрица сожалений — она строится на основе исходной матрицы выигрышей.
Суть критерия:
Сожаление (упущенная выгода) — это разница между максимальным выигрышем при данном состоянии природы и выигрышем от выбранной альтернативы.
Шаги:
Для каждого столбца (состояния природы) найти максимальное значение.
Построить матрицу сожалений:
rij=maxj(a⋅j)−aijr_{ij} = \max_j (a_{\cdot j}) - a_{ij}
Для каждой альтернативы найти её максимальное сожаление.
Выбрать альтернативу с минимальным из этих максимумов.
Решение=mini(maxjrij)\text{Решение} = \min_i \left( \max_j r_{ij} \right)
Выбирается альтернатива, которая минимизирует наибольшее сожаление.
Когда использовать критерий Сэвиджа:
Когда лицо, принимающее решение, боится ошибки или упущенной выгоды.
Когда важно минимизировать последствия неправильного выбора.
