Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции(ИИС) / ИИС(Лекции).doc
Скачиваний:
19
Добавлен:
17.04.2015
Размер:
432.13 Кб
Скачать

Упрощение дерева решений

При построении дерева решений необходимо знать значения полезностей исходов. В случае, когда не удается вычислить действительные значения полезностей, находят их ожидаемые значения.

Рассмотрим некоторые практические рекомендации.

Допустим, необходимо сделать выбор между двумя играми.

Первая игра. Бросается монета. Если выпадает герб, игрок выигрывает 100 р, в противном случае он проигрывает 50р.

Вторая игра. Бросается монета. Если выпадает герб, игрок выигрывает 5р, в противном случае он проигрывает 2р.

Дерево решений имеет две альтернативы, каждая из которых включает по два исхода.

Оценивая альтернативы, мы должны как-то учитывать вероятности и полезности исходов. Простым приемом, позволяющим это сделать, является вычисление Ожидаемого значения альтернативы, по известным вероятностям и полезностей их исходов. Ожидаемое значение альтернативы равно взвешенной сумме значений ее исходов, где вкачестве весов выступают вероятностей исходов.

Однако, ясно, что оно не является действительным значением полезностей. Это тот результат, который можно ожидать в среднем при многократном бросании монеты, причем он тем точнее, чем больше будет бросаний.

Вместе с тем, вычисление ожидаемых значений полезностей позволяет упростить дерево решений.

Усложним наш пример. Добавим третью альтернативу: если выпадет герб, то игрок получает 200р, а, если цифра – проигрывает 100р.Если монета первый раз выпадает гербом, то игрок может бросить правильную игральную кость. При выпадении 6 очков он получит 1000р, в противном случае проиграет 400р.

Новым объективным событием, от которого зависит выбор альтернатив, является игральная кость. Имеем: О3 = выпадает 6 очков, О4 = выпадает любое очко, кроме 6. Р(О3)= 1/6, P(O4) = 5/6,

Критериальный способ описания выбора

Выбор наилучшей альтернативы часто осуществляют по тому или иному критерию. В этом случае каждой альтернативе дают численную оценку. Тогда сравнение альтернатив сводится к сопоставлению соответствующих им числовых значений.

В зависимости от цели и объекта исследования критерии или параметры оптимизации могут быть весьма разнообразны. Состав параметров оптимизации в значительной мере зависит от класса исследуемой системы. Так, различают технико-экономические, технологические, экономические, психологические, социологические множества параметров оптимизации.

Критерий или параметр оптимизации – это признак, по которому определяют качество решения. Он должен иметь количественную оценку. Множество возможных значений критерия (параметра оптимизации) называют областью его определения. Области определения могут быть дискретными и непрерывными, ограниченными и неограниченными. Если не удается дать количественные оценки выбранным критериям, то применяют метод ранжирования параметров. В этом случае каждому параметру оптимизации присваивают свой ранг по заранее выбранной шкале. Ранг является сравнительная характеристика оцениваемого параметра. Чаще всего ранжирование используют в тех случаях, когда требуется определить качественный признак. В простейшем случае область определения содержит только два значения (да-нет, хорошо-плохо). Например, изготовленное средство может быть годным или бракованным.

При выборе состава критериев следует учитывать требования, предъявлямые к ним.

Параметры оптимизации должны быть однозначными в статистическом смысле. Заданному набору значений, воздействующих на исследуемую систему факторов, должно соответствовать одно определенное с точностью до погрешности измерения, значения параметра оптимизации. Однако обратное утверждение неверно, поскольку одному и тому же значению параметра могут соответствовать разные наборы значений факторов.

Критерий должен оценивать эффективность функционирования системы в заранее выбранном смысле. Это требование является главным, определяющим корректность постановки задач.

Следующее требование к параметру оптимизации – требование универсальности и полноты. Универсальность параметра оптимизации означает всестороннюю характеристику изучаемого объекта. Такие параметры по существу представляют собой функцию от других параметров.

Постановка задачи критериального выбора.

Пусть Х – множество альтернатив. Пусть далее на ътом множестве задана функция F(x). Тогда ее называют критерием или параметром оптимизации (критерием качества, целевой функцией, функцией предпочтения, функцией полезностей и т.п.), если альтернатива х1 предпочтительнее х2 при F(x1)> F(x2).

Выбор как определение экстремума функционала.

В общем случае задачу поиска наилучшей альтернативы можно рассматривать как задачу отыскания экстремума некоторого функционала.

При принятии решения в условиях определенности состояние среды известно лицу, принимающему решение, и оно фиксировано. В этом случае исход однозначно определяется выбором альтернативы. Стало быть, альтернативы и исходы могут быть отождествлены, а целевая функция становится функцией альтернатив. Отсюда выбор альтернативы эквивалентен выбору альтернативы.

Итак, в рассматриваемом случае первый этап исследования задачи принятия решения заключается в построении математической модели, а именно – к определению множества Х допустимых альтернатив хi целевой функции F(x) на этом множестве.

Второй этап состоит во введении понятия оптимального решения и нахождения оптимальных решений. Так как в данном случае значение целевой функции при альтернативе хi представляет собой оценку полезности альтернативы хi (с точки зрения принимающего решения), то на множестве значений Х допустимых альтернатив естественным образом определяется отношения предпочтения одной альтернативы к другой.

Исходя из этого представляется разумной концепция оптимальности, когда оптимальной считается та допустимая альтернатива х0 € Х, которая является не менее предпочтительной, чем любая другая альтернатива хi €. В терминах целевой функции это означает, что оптимальная альтернатива доставляет максимум (минимум) целевой функции.

При рассмотрении математических моделей процесса принятия решений основными вопросами являются следующие:

  1. Существует ли оптимальное решение?;

  2. Каким способом найти искомое решение?.

Решение задачи поиска экстремальных точек заданной функции составляет область математического программирования.

На сегодня отсутствуют общие и формальные методы построения моделей систем управления. При математическом моделировании пользуются как аналитическими, так и численными методами. Последние наиболее широко применяются на практике, поскольку численные методы позволяют сравнительно легко строить алгоритмы поиска оптимального управления. Вместе с тем трудоемкость получения искомого решения остается на повестке дня, так как в основе всех алгоритмов лежит тот или иной метод решения задач математического программирования. Особенную трудность вызывает задача нахождения глобального максимума (минимума).Вследствие того, что современный математический аппарат, применяемый для решения подобных задач, далеко не всегда приемлем для практики, приходится исследовать целесообразность использования новых методов для построения алгоритмов поиска параметров, доставляющих экстремальное значение целевой функции.

Лекция 3

ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ОПРЕДЕЛЕННОСТИ

При принятии решений в условиях определенности считается, что множество внешних событий, влияющих на процесс принятия решений, задано, т.е. известно ЛПР. В этом случае выбор наилучшей альтернативы эквивалентен выбору исхода. Другими словами, альтернативы могут быть отождествлены с исходами. Стало быть, чтобы выбрать наилучшую альтернативу, достаточно построить целевую функцию f и найти ее экстремальное значение, поскольку она становится функцией неизвестного переменного х..

Таким образом, построение математической модели ЗПР (задачи принятия решения) сводится в рассматриваемом случае к определению множества допустимых альтернатив Х и заданию целевой функции f: Х→ R.

Далее мы должны найти оптимальное решение. Учитывая, что в нашем случае значение функции f(x) является оценкой полезности альтернативы, можно принять, что чем больше значение целевой функции, тем предпочтительной будет альтернатива. Стало быть, наилучшей альтернативой будет та, которая доставляет максимум (минимум) целевой функции.

Итак, чтобы решить ЗПР в условиях определенности, необходимо:

-определить множество допустимых альтернатив Х;

-задать целевую функцию f: Х→ R;

-найти максимум или минимум целевой функции.

Вполне понятно, что при решении ЗПР необходимо, прежде всего, ответить на вопрос: существует ли вообще оптимальное решение?

При положительном ответе на данный вопрос, возникает вопрос: как найти искомое решение?

В случае, конечного множества Х допустимых альтернатив, всегда можно найти наилучшую альтернативу путем простого их перебора. В самом деле, в конечном множестве существует наибольший (наименьший) элементы. Значит, можно перебрать все возможные варианты решения. Правда, для такого перебора может потребоваться значительное время. Однако на практике такие случаи возникают не так уж часто.

В случае, когда множества Х допустимых альтернатив бесконечно, для нахождения экстремума целевой функции, а значит, и наилучшей альтернативы, можно воспользоваться классическими методами поиска экстремальных значений функции. Здесь различают два вида экстремумов: глобальные и минимальные. Согласно теореме Вейерштрасса всякая непрерывная функция на замкнутом интервале имеет глобальный максимум и минимум. В математике также показано, какие необходимые и достаточные условия должны быть выполнены для дифференцируемых функций в точках достижения локальных экстремумов.

В качестве примера ЗПР в условиях определенности рассмотрим следующую задачу

Задача.

Найти объем закупаемой фирмой партии товара, который обеспечивает ей минимальные издержки на приобретение и хранение товара.

Пусть задан временной интервал Т, в течение которого фирма закупает и реализует товар. Товар хранится на складе. Стоимость единицы товара и ее хранения известна. Его реализация происходит с постоянной скоростью. Как только товар на складе заканчивается, оформляют заказ на следующую партию. Затраты на оформление заказа также известны. Требуемый объем товара на весь период Т задан При этом объем заказываемой партии предполагается неизменным, хотя и неизвестным. Задача как раз и состоит в том, чтобы определиться с размером заказываемой партии товара, т.е. принять решение: каков должен быть объем закупаемой партии?

Решение.

Введем следующие обозначения.

V – требуемый объем товара на весь период Т.

х -. объем заказываемой партии товара.

с– стоимость хранения единицы товара в течение всего периода времени Т.

с1 – стоимость единицы товара.

с2 – стоимость оформления заказа партии товара.

Построим математическую модель ЗПР.

Целевая функция в нашем случае выражает суммарные затраты на закупку товара и хранения его на складе, а также на оформление всех заказов.

Поскольку фирма должна приобрести весь требуемый объем товара (V), то общая стоимость товара равна с1V, а количество заказываемых партий - V/x. Отсюда затраты на оформление составят с2 V/x

Чтобы рассчитать затраты на хранение, поступим следующим образом.

Обозначим функцию, показывающую изменение затрат на хранение товара на временном интервале Т, через u(t). Тогда общая стоимость хранения товараY будет равна

Y= c/T 0 Т u(t).dt.

Пусть закупки товара происходят в моменты времени т0 т1 , …, тn-1.

Примем, что товар реализуется равномерно, т.е. он равномерно убывает на каждом отрезке времени. Если размер заказываемых партии будет х, то в моменты их заказа происходит изменение хранимого товара от нулевого значения до значения х. Тогда функция u(t) представляет собой набор линейных функций. На каждом отрезке времени среднее значение каждой функции равно х/2. Отсюда с достаточной степенью точности можно положить, что затраты на хранение товара составят сх/2.

Итак, в рассматриваемом случае целевая функция имеет вид

f(x) = с1V +с2 V/x + сх/2.

Исследуем данную функцию.

ПРИНЯТИЕ РЕШЕНИЙ

ПРИ НАЛИЧИИ ОГРАНИЧЕНИЙ НА ЦЕЛЕВУЮ ФУНКЦИЮ

В предыдущей лекции мы рассмотрели ЗПР, в которой оценка альтернативы осуществлялась по одному критерию. В этом случае целевая функция является функция от одного неизвестного. К сожалению далеко не всегда удается свести поиска искомого решения к максимизации (минимизации) функции одного переменного. Кроме того, в практических приложениях на эти переменные накладываются определенные ограничения.

Общая задача поиска оптимального решения в рассматриваемом случае ставится следующим образом.

Найти

max f(x) (х - n-мерный вектор)

при условии, что переменные xi (i = 1, 2, …n) удовлетворяют условиям вида

q j(x) = 0, j = 1, 2, …, m.

Для решения данной задачи можно воспользоваться методом множителей Лагранжа..

Суть этого метода состоит в том, что к функции f(x) прибавляются функции qj(x), умноженные на некоторые, пока неизвестные, коэффициенты λj . Такую функцию называют функцией Лагранжа:

L(x, λ) = f(x) + ∑ λj qj(x).

Далее ищется максимум полученной функции Лагранжа.

Имеет место следующее утверждение:

Точка, являющаяся точкой условного экстремума функции f(x), должна быть стационарной точкой функции Лагранжа L(x, λ) (т.е. в этой точке все частные производные функции L(x, λ) по ее переменным должны быть равны нулю).

Отсюда вытекает и метод поиска искомого экстремума.

В качестве примера решим следующую задачу.

Пусть требуется распределить заказ между фирмами А и В.

Стоимость заказа х единиц продукта на фирме А составляет

а0 1х +а2х2 денежных единиц, на фирме В –

b0 +b1х +b2х2 денежных единиц (а0 1,а2, b0 ,b1,b2 >0).

Вам нужно принять решение: сколько заказать продукта фирме А и фирме В, чтобы стоимость N приобретенных единиц продукта была наименьшей?

Решение.

Пусть заказ распределен так: х единиц продукта производит фирма А, y единиц продукта производит фирма B.

Тогда целевая функция имеет вид

f(x,у) = (а0 1х +а2х2) + (b0 +b1у +b2у2).

Нужно найти минимум этой функции при условии, что х+у = N.

Функция Лагранжа в этом случае определяется как сумма целевой функции и ограничения (N – х –у), умноженного на коэффициент λ:

L(x,y, λ)=(а0 1х +а2х2)+(b0 +b1у +b2у2)+ λ(N – х –у).

Из условия, частные производные функции L в стационарной точке должны быть равны нулю, получим три линейных уравнения для нахождения неизвестных х,у, λ:

а1х + 2а2х – λ = 0,

а1у+ 2а2у – λ = 0,

N – х –у = 0.

х и у, удовлетворяющие данной системе уравнений, и будут нашим оптимальным решением.

Задачи математического программирования

Задачи математического программирования находят применение в различных областях человеческой деятельности, где необходим выбор из набора возможных вариантов программ действий наилучшего с какой-то точки зрения лица. Значительное число задач, связанных с выработкой решений, можно свести к задачам математического программирования.

Под принятием решений в исследовании операций понимают сложный процесс, включающий в себя следующие этапы.

1-й этап. Построение качественной модели рассматриваемой проблемы, т.е. формирование множества факторов, которые оказывают наибольшее влияние на искомое решение, и установление закономерностей, которым они подчиняются.

2-й этап. Построение математической модели исследуемой проблемы, т.е. представление качественной модели на математическом языке. Математическая модель устанавливает соотношения между совокупностью переменных – параметрами управления явлением.

На данном этапе формируется также и целевая функция, т.е. критерий принятия решения.

3- й этап. Исследование влияния переменных на значение целевой функции.

Широкий класс задач поиска оптимального решения составляют такие задачи, в математических моделях которых ограничения, накладываемые на искомое решение, могут быть заданы в виде равенств и неравенств. Теория и методы решения задач подобного рода как раз и составляют содержание математического программирования.

Традиционно в математическом программировании выделяют следующие основние разделы: линейное программирование и нелинейное программирование.

К задачам линейного программирования относятся задачи, в которых целевая функция линейна и ограничения, накладываемые на решения, задаются системой линейных равенств и неравенств.

Нелинейное программирование – нелинейная целевая функция и ограничения. Нелинейное программирование принято подразделять следующим образом:

  • выпуклое программирование;

  • квадратичное программирование;

  • многокритериальные задачи.

Важным разделом математического программирования является целочисленное программирование – когда на переменные накладываются условия целочисленности.

Для иллюстрации задач линейного программирования рассмотрим следующую задачу.

Пусть фермерское хозяйство имеет в своем распоряжении 100 га земли, фиксированное количество наемного труда в 160 человека-дней и 1100 млн рубл на расходы, связанные с выращиванием пшеницы и картофеля. Доход с одного гектара пшеницы составляет 1200 руб, с одного гектара картофеля - 400руб,. Затраты (на сев, выращивание т.д.) составляют 200 руб/га для пшеницы и 100 руб/га для картофеля. Затраты труда, необходимые для выращивания урожая, составляют четыре человека/дня для пшеницы и один человека/день для картофеля.

Требуется принять решение: сколько выделить гектаров земли под пшеницу и картофель, чтобы обеспечить максимальный доход.

Построим математическую модель рассматриваемой задачи.

Пусть х – количество га земли, выделяемое под пшеницу, y – картофель.

Тогда целевая функция, т.е. доход фермерского хозяйства, определяется формулой

R – 1200 x +400 y.

Ограничения, накладываемые на переменные, можно выразить в виде линейных неравенств:

X+y ≤ 100

4x+y ≤ 160

200x + 100y≤ 11000

x≥0, y≤ 0.

Таким образом, задача поиска оптимального решения в нашем случае заключается в определении значений переменных х и y, при которых целевая функция (доход) примет максимальное значение.

Интересно отметить, что данную задачу можно представить в следующей постановке.

Лекция 4

Принятие решений в условиях неопределенности

Как указывалось в лекции 1, процесс принятия решения включает в себя определение следующих множеств:

  • множество альтернативных действий, каждое из которых указывает один из возможных способов решения рассматриваемой проблемы;

  • множество объективных, т.е. не зависящих от лица, принимающего решение, событий, влияющих на исходы альтернатив, одно из которых обязательно должно осуществиться;

  • множество вероятностей (вероятных оценок) появления объективных событий влияющих на исходы (результаты) альтернативных действий;

  • множество исходов (результатов, последствий) альтернативных действий в зависимости от того, какое из объективных событий осуществиться;

  • множество субъективных значений исходов для лица, принимающего решение, называемые так же их полезностями

Если выбор лучшей альтернативы происходит при определенных последствиях решения, то говорят, что решение принимается в условиях определенности. Во многих случаях выбор альтернативы неодназначно определяет последствия его выбора. Когда решение принимается при отсутствии достоверной информации о последствиях его реализации, то говорят, что выбор осуществляется в условиях неопределенности.

При этом обычно различают три вида неопределенности. К первому виду относят неопределенности, связанные с множеством факторов, влияющих на выбор, т.е. когда исследователь не знает всех факторов. Ко второму виду относят ситуации, когда исследователю приходится принимать решение при неоднозначных результатах его решений. И, наконец, могут быть случаи, когда имеется ни одна, а несколько целей, цели могут даже противоречить друг другу.

Принятие решения в условиях неопределенности характеризуется тем, что при выборе альтернативы, лицу, принимающему решение, неизвестно состояние среды и отсутствует информация о вероятности появления событий, влияющих на исходы. Правда, эта неопределенность не носит абсолютный характер, так как, вообще говоря, известно множество принципиально возможных состояний среды и функции реализации.

Итак, математическая модель задачи принятия решения в условиях неопределенности может быть задана в виде тройки следующих объектов:

(X,Y,F).

Здесь

Х – множество допустимых альтернатив;

Y – множество возможных состояний среды (объективных событий, влияющих на значение целевой функции);

F – целевая функция.

Теория принятия решений в настоящее время представляет собой самостоятельную научную дисциплину. Центральным моментом данной теории является введение критерия для оценки качества принятого решения.

Одним из распространенных критериев является максиминный (минимаксный) критерий. Данный критерий мы рассмотрим ниже. В сегодняшней лекции остановимся на критериях Вальда, Гурвица, Лапласа и Сэвиджа.

Критерии выбора решений

Нередко вероятностная оценка объективных событий отсутствует. В таких случаях принятие решения основывается на критериях, оправдавших себя на практике. Наиболее часто пользуются критериями Вальда, Гурвица, Лапласа, Сэвиджа.

Рассмотрим эти критерии.

Согласно критерию Гурвица объективные события всегда благоприятствуют лицу, принимающему решению. Руководствуясь этим принципом, сначала для каждой альтернативы оставляем исходы с максимальной полезностью. Из оставшихся альтернатив выбираем ту, которая имеет наибольшее значение полезности. В результате дерево решений упрощается. Затем уменьшают значения полезности, умножая последние на различные так называемые коэффициенты осторожности. Этим самым добиваются значительного упрощения исходного дерева решений. Поясним данный критерий на следующем примере.

Пусть требуется решить вопрос: модернизировать уже выпускаемый товар или начать выпускать новый. В том и другом случае производство может остаться в прежних размерах или расширено.

Таким образом, объективными событиями, которые должны быть учтены в нашем примере, являются:

  • расширение производства;

  • объем производства остается в прежних размерах.

Вероятности этих событий неизвестны, ибо новый товар ранее не выпускался.

Допустим, что ожидаемая годовая прибыль, т.е. возможные исходы равны 50, 30, 25, и 10 единиц. Тогда дерево решений примет вид:

50

о

А1. 30

А

А2 25

о

10

Упростив данное дерево, пользуясь критерием Гурвица, можно будет принять вполне обоснованное решение.

Критерий Вальда в противоположность критерию Гурвица основан на предположении, что объективные события всегда против субъекта. Это означает, что сначала следует выбирать альтернативы с минимальными значениями полезности и только на последнем этапе выбирать альтернативу с максимальным значением полезности.

Критерий Лапласа основан на предположении, что все события равновероятны.

Идея критерия Сэвиджа состоит в том, что тот, кто выбрал решение, сожалеет о своем выборе. Поэтому он должен минимизировать величину своего сожаления. Величина сожаления принимается равной разности между максимально возможным значением полезности и актуальным значением полезности исхода для данного действия и события. Дерево упрощается путем исключения исходов с максимальным значением сожаления.

Лекция 5