Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лек01 Динамическое программирование.doc
Скачиваний:
53
Добавлен:
25.03.2016
Размер:
457.22 Кб
Скачать

Системное описание задачи принятия решений

Наиболее общий подход к описанию задач принятия решений (ЗПР) формулируется «на языке систем». Приведем системное описание задач принятия решений.

Пусть имеется некоторая система, в которой выделена управляемая подсистема (объект управления), управляющая подсистема и среда. Управляющая подсистема может воздействовать на объект управления с помощью альтернативных управляющих воздействий (рис. 1.2). Состояние объекта управления определяется двумя факторами: выбранным управляющим воздействием со стороны управляющей подсистемы и состоянием среды. Принципиальным является следующее обстоятельство: управляющая подсистема не может воздействовать на среду и, более ��ого, она, как правило, не имеет полной информации о наличном состоянии среды.

Рис. 1.2.

Управляющая подсистема является целенаправленной, причем цель управляющей подсистемы состоит в том, чтобы перевести объект управления в наиболее предпочтительное для себя состояние (или в некоторое подмножество предпочтительных состояний). Для достижения этой цели управляющая подсистема может использовать любое находящееся в ее распоряжении управляющее воздействие.

Выбор управляющей подсистемой конкретного управляющего воздействия (выбор допустимой альтернативы) называется принятием решения.

При принятии решения основной задачей является нахождение оптимального решения. На содержательном уровне оптимальное решение может быть определено как наилучшее в следующем смысле: оно в наибольшей степени соответствует цели управляющей подсистемы в рамках имеющейся у ней информации о состоянии среды.

Математическая модель принятия решений

Математическая модель принятия решения представляет собой формализацию той схемы, которая приведена в системном описании ЗПР. Для построения математической модели принятия решения необходимо задать следующие три множества:

X– множество допустимых альтернатив,

Y– множество возможных состояний среды,

А– множество возможных исходов.

В системном описании ЗПР альтернативы интерпретируются как управляющие воздействия, а исходы – как состояния управляемой подсистемы.

Варианты действий принято называть альтернативами.

Так как состояние управляемой подсистемы полностью определяется выбором управляющего воздействия и состоянием среды, то каждой паре (х, у), гдехXиуY, соответствует определенный исходаА. Другими словами, существует функцияF:XхYА, которая называется функцией реализации. Функция реализации каждой паре вида (альтернатива, состояние среды) ставит в соответствие определяемый ею исход.

Набор объектов (X,Y,A, F) составляет реализационную структуру ЗПР. Реализационная структура отражает связь между выбираемыми альтернативами и исходами.

Реализационная структура задачи принятия решения составляет ее первую компоненту. Вторая компонента ЗПР называется ее оценочной структурой. Если реализационная структура определяет возникающий результат, то оценочная структура указывает оценку этого результата с точки зрения принимающего решение.

В математической модели ЗПР оценочная структура может задаваться различными способами.

Например, если принимающий решение может оценить эффективность (равнозначные по смыслу термины: «полезность», «ценность») каждого исхода аАнекоторым числомφ(а), то оценочная структура задается в виде пары (A,φ), гдеφ:А R; при этомφназывается оценочной функцией.

Другой способ задания оценочной структуры состоит в указании отношения предпочтения исходов, что сводится к перечислению пар исходов a1,a2, для которыха1лучше, чема2(это записывается в видеa1a2и читается «а1почтительней, чема2».

Еще один способ задания оценочной структуры – разбиение множества исходов Ана два класса:А0– класс «плохих» исходов иА1– класс «хороших» исходов.

Существуют и другие способы задания оценочной структуры. Наиболее распространенным является задание оценочной структуры в виде оценочной функции φ.

Целевая функция fесть композиция функции реализацииFи оценочной функцииφ, т.е.f=φ F. Таким образом,f(x,y)=φ(F(x,y)). Целевая функция имеет следующий содержательный смысл: числоf(x,у)есть оценка полезности (с точки зрения принимающего решение) того исхода, который возникает в ситуации, когда он выбирает альтернативух, а среда принимает состояниеу.

Замечание. В некоторых задачах принятия решения оценка исхода характеризует его в негативном смысле, являясь выражением затрат, убытков и т.п. В этом случае целевая функция fназывается функцией потерь.

Учитывая, что постановки задач, а также применяемые методы их решения, существенно зависят от степени неопределенности параметров анализируемой системы и состояния внешней среды, то общепринятой является классификация задач ТПР, представленная на рис. 1.3.

Рис. 1.3.

Задачи первого типа характеризуются тем, что все параметры анализируемой системы и внешней среды являются детерминированными, а искомые решения – непрерывными либо дискретными. Наиболее известными и распространенными из задач с дискретными значениями переменных являются: задача коммивояжера; задача о минимальном покрытии графа; минимаксная задача о назначениях. В частности, задача выбора состава тиражируемых пакетов программ, соответствующих требованиям пользователей к функциональным возможностям системы, сводится к задаче о минимальном покрытии графа, а задача конструирования топологии локальной вычислительной сети (ЛВС) кольцевой структуры стандарта Token Ring – к известной задаче коммивояжера.

Для решения этих задач используются алгоритмы Гомори, ветвей и границ, динамического программирования, эвристические алгоритмы, методы случайного поиска и др. В последнее время применяются алгоритмы отжига, генетические алгоритмы и нейронные сети.

Второй тип задач относится к задачам принятия решений в условиях риска и характеризуется тем, что для ряда параметров неизвестны точные значения, а определены диапазоны их изменений и на каждом из диапазонов заданы плотности распределения случайных величин. Необходимо выбрать такое решение, которое для заданных распределений вероятностей обеспечивает экстремум показателя эффективности. В качестве показателя эффективности выбирается либо среднее значение, либо комбинация среднего значения и дисперсии. Наиболее известными задачами второго типа являются задачи управления запасами, управления Марковскими процессами, анализа и синтеза систем массового обслуживания и др.

Третий тип задач характеризуется тем, что для каждого из параметров заданы возможные дискретные значения и для них определены значения показателя эффективности, соответствующие каждому из вариантов альтернативных решений, т.е. исходная задача представляется в виде таблицы, в которой строки соответствуют альтернативным решениям, а столбцы – дискретным значениям параметров.

Необходимо отметить, что в задачах этого типа отсутствует информация о распределении вероятностей для значений параметров.

Четвертый тип задач характеризуется тем, что принятие решений системным аналитиком производится в условиях конкуренции противоборствующих сторон. В качестве схемы принятия решений используется игровая модель.

Необходимо отметить, что перечисленные типы задач могут быть как однокритериальными, так и многокритериальными. В многокритериальных задачах аналитик при выборе альтернативы стремится улучшить значения двух и более показателей.