Основные критерии задач принятия решения в условиях неопределенности.

В теоретико-игровой терминологии задача принятия решения в условиях неопределенности формулируется следующим образом. Пусть X – множество стратегий игрока, Y – множество состояний среды, F(x, y) – функция выигрыша игрока. Требуется указать наилучшую в некотором смысле альтернативу, то есть найти оптимальную стратегию.

В случае, когда множества X и Y являются конечными, функцию F(x, y) в виде матрицы , считая X={1,…, n}, Y={1,…, m}, при этом , есть значение функции выигрыша F, когда игрок выбирает стратегию i, а среда принимает значение j.

Основной метод, позволяющий найти оптимальную стратегию в данных задачах, состоит в следующем: формулируется некоторая гипотеза о поведении среды, позволяющая дать единую численную оценку каждой стратегии. Оптимальной считается та стратегия, для которой численная оценка является максимальной. Задание оценки позволяет сравнивать две любые стратегии, то есть устанавливает критерий для сравнения стратегий. Основными являются следующие критерии.

Критерий Лапласа основан на гипотезе равновероятности, при котором все состояния среды считаются равновероятными. При принятии данной гипотезы в качестве оценки стратегии i берется соответствующий ей средний выигрыш, то есть

Оптимальной будет та стратегия, у которой эта величина достигает максимального значения.

Критерий Вальда основан на гипотезе крайней осторожности (крайнего пессимизма), которая формулируется в виде: “при выборе той иди иной стратегии надо рассчитывать на самый худший возможный вариант”. Оценкой стратегии в данном случае будет Оптимальной будет стратегия, максимизирующая этот минимум, она называется максиминной стратегией. Принцип оптимальности, основанный на критерии Вальда, называется принципом максимина.

Критерий Гурвица связан с введением числа 0 ≤ α ≤ 1, называемого “показателем пессимизма-оптимизма”. Гипотеза о поведении среды состоит в том, что наихудший вариант реализуется с вероятностью α, а наилучший с вероятностью 1-α. Тогда оценкой стратегии i является сумма При α=1 данный критерий превращается в критерий Вальда, а при α=0 в критерий крайнего оптимизма.

Критерий Севиджа основан на преобразовании первоначальной матрицы - матрицы выигрышей в матрицу – матрицу рисков. Риском при выборе стратегии i в состоянии природы j называется число , где Содержательно интерпретируется как “мера сожаления” , возникающего от незнания истинного состояния среды. Для критерия Севиджа оптимальной считается стратегия, минимизирующая максимальный риск.

Алгоритм решения задачи.

Моей непосредственной задачей была реализация данных критериев на языке программирования Pascal.

Нам дана матрица - матрица выигрышей, где i – номер стратегии, j – состояние среды. Необходимо найти номер оптимальной стратегии для каждого из приведенных выше критериев.

Для поиска стратегии оптимальной по критерию Лапласа необходимо для каждой строки подсчитать сумму ее элементов, найти максимальную сумму и вывести номер соответствующей строки. В моей программе это реализуется с помощью функции laplas, которая выводит номер строки с максимальной суммой (первой из таких, если их несколько).

Для поиска оптимальной стратегии по критерию Вальда необходимо для каждой строки найти минимальный элемент и вывести строку, у которой он максимален. У меня это делает функция vald.

Для критерия Гурвица дополнительно задается параметр α, для каждой строки ищется минимальный и максимальный элемент, составляется сумма , и выводится строка, у которой данная сумма максимальна. Это реализует функция gurv.

Для поиска оптимальной стратегии по критерию Севиджа сначала для каждого столбца ищется максимальный элемент . Затем составляется новая матрица . Для каждой строки ищется максимальный элемент и выводится номер строки, у которой этот элемент минимален. В моей программе это делает функция sevidg.

В итоге мы получаем номера оптимальных стратегий для каждого из критериев.

В моей программе из текстового файла input.txt, где указаны число строк и столбцов n и m соответственно матрицы выигрыша, параметр alfa для критерия Гурвица и матрица выигрыша, последовательно считываются эти данные, в выходной файл output.txt выводятся номера оптимальных стратегий: il=laplas(n,m), iv=vald(n,m), ig=gurv(n,m, alfa), is=sevidg(n,m).

<<< < Предыдущая 12 / 42 3 4 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
09.06.201530.93 Кб5Предлоги направления.docx
#
25.11.201981.73 Кб1Предыстория.docx
#
06.12.201835.71 Кб5ПРЕСТУПЛЕНИЯ В СФЕРЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ1....docx
#
09.06.2015368.53 Кб28Преступность несовершеннолетних.rtf
#
20.08.201954.27 Кб1Приложение 2 ПСР в зимних условиях 2012 пр.doc
#
08.11.2019246.78 Кб1Пример отчёта.doc
#
09.06.2015135.17 Кб49Пример оформления реферата.doc
#
29.03.2016660.53 Кб9примерные поурочные рекомендации.pdf
#
10.07.2019321.54 Кб1Примерные темы для экзамена по английскому.doc
#
09.06.201551.09 Кб40примеры групп.docx
#
09.06.2015410.26 Кб14прионы.pdf