- •1.1. Методы искусственного интеллекта в прикладных системах и системах принятии решений
- •1.2. Интеллектуальные информационные технологии в прикладных системах и системах принятия решений
- •1.3. Типология задач интеллектуализации систем
- •Лекция 2. Представление знаний в интеллектуальных системах
- •2.1. Модели представления знаний
- •2.2. Системы, основанные на правилах
- •2.3. Системы, основанные на автоматическом доказательстве теорем
- •2.4. Системы, основанные на автоматическом порождении (выдвижении) гипотез
- •Лекция 3. Структура и основные компоненты прикладных интеллектуальных систем
- •3.1. Прикладные системы, основанные на знаниях
- •3.2. Структура системы управления, основанной на знаниях
- •3.3. Структура интеллектуальных систем поддержки принятия решения
- •3.4. Обобщенная структура экспертной системы
- •Лекция 4. Классификация прикладных интеллектуальных систем
- •4.1. Классификация экспертных систем
- •4.2. Примеры прикладных интеллектуальных систем
- •Лекция 5. Основные понятия и определения теории принятия решений
- •5.1. Роли людей в процессе принятия решений
- •5.2. Альтернативы
- •5.3. Критерии
- •5.4. Основные этапы процесса принятия решений
- •5.5. Математические методы теории принятия решений
- •Лекция 6. Принятие решений с помощью статистической проверки гипотез
- •6.1. Статистические решения
- •6.2. Основные задачи статистических решений
- •6.3. Статистическая проверка гипотез
- •6.4. Ошибки решения
- •6.5. Решающее правило при проверке гипотез
- •Лекция 7. Байесовская и последовательная процедуры принятия решения.
- •7.1. Байесовские процедуры принятия решения
- •7.1.1. Байесовская процедура при проверке простой гипотезы
- •7.1.2. Байесовские процедуры в задаче классификации
- •7.2. Принятие решения с помощью последовательной процедуры Вальда
- •Лекция 8. Принятие решения методом дискриминантнного анализа
- •8.1. Классификация в случае, когда распределения классов определены полностью
- •8.1.1. Модель двух нормальных распределений с общей ковариационной матрицей (модель Фишера)
- •8.1.2. Модель двух нормальных распределений с разными ковариационными матрицами
- •8.1.3. Модель нескольких нормальных распределений с общей ковариационной матрицей
- •8.2. Классификация при наличии обучающих выборок
- •8.2.1. Подстановочный алгоритм в модели Фишера
- •8.2.3. Правила классификации
- •8.3. Ошибка решающего правила
- •Лекция 9. Древообразные классификаторы
- •9.1. Назначение древообразных классификаторов
- •9.1. Структура дерева классификации
- •9.3. Вычислительные задачи древообразных классификаторов
- •9.3.1. Определение качества предсказания
- •9.3.2. Выбор разбиений
- •9.3.3. Определение правила прекращения разбиения
- •Лекция 10. Деревья решений
- •9.1. Характеристики дерева решений
- •9.2. Построение дерева решений
- •Лекция 11. Методы прогнозирования
- •11.1. Анализ временных рядов
- •11.1.1. Модель временного ряда
- •11.1.2. Тренд, сезонная и циклическая компоненты
- •11.1.3. Декомпозиция временного ряда
- •11.1.4. Экспоненциальное сглаживание
- •11.2. Каузальные методы прогнозирования
- •11.3. Качественные методы прогнозирования
- •Лекция 12. Основная задача линейного программирования
- •12.1. Математическая модель основной задачи линейного программирования
- •12.2. Задача линейного программирования с ограничениями-неравенствами
- •12.3. Примеры задач линейного программирования
- •12.3.1. Транспортная задача
- •12.3.2. Задача о назначениях
- •Лекция 13. Симплекс-метода решения задачи линейного программирования
- •13.1. Характеристика симплекс–метода
- •13.2. Табличный алгоритм замены базисных переменных
- •13.3. Отыскание опорного решения основной задачи линейного программирования
- •13.4. Отыскание оптимального решения основной задачи линейного программирования
- •Лекция 14. Многокритериальные методы принятия решений при объективных моделях
- •14.1. Объединение критериев
- •14.2. Метод главного критерия
- •14.3. Метод последовательных уступок
- •14.4. Метод целевого программирования
- •14.5. Метод, использующий принцип гарантированного результата
- •14.6. Метод равных наименьших относительных отклонений
- •14.7. Процедура STEM поиска удовлетворительных значений критериев
- •Лекция 15. Выбор Парето–оптимальных решений
- •15.1. Основные определения
- •15.2. Графическая интерпретация
- •15.3. Постановка задачи
- •Лекция 16. Оценка многокритериальных альтернатив с помощью теории полезности
- •16.1. Теория полезности
- •16.2. Принятие решения на основе значения ожидаемой полезности
- •16.3. Многокритериальная теория полезности (MAUT)
- •Лекция 17. Сравнение альтернатив методом аналитической иерархии
- •17.1. Основные этапы метода аналитической иерархии
- •17.2. Декомпозиция задачи
- •17.3. Попарное сравнение критериев и альтернатив
- •17.4. Свойства идеальной матрицы сравнений
- •Лекция 18. Приоритеты для критериев и альтернатив и выбор наилучшей альтернативы в методе анализа иерархий
- •18.1. Вычисление собственных характеристик обратно симметричной матрицы
- •18.2. Вычисление величины приоритетов
- •18.3. Определение наилучшей альтернативы
- •18.4. Проверка согласованности
- •18.5. Пример применения метода анализа иерархий
- •Лекция 19. Оценка многокритериальных альтернатив методами ELECTRE
- •19.1. Этапы подхода, направленного на разработку индексов попарного сравнения альтернатив
- •19.2. Свойства бинарных отношений
- •19.3. Метод ELECTRE I
- •19.4. Метод ELECTRE II
- •19.5. Метод ELECTRE III
- •Лекция 20. Основные понятия и математическая модель игровых методов обоснования решений
- •20.1. Основные понятия теории игр
- •20.2. Математическая модель игры
- •20.3. Нижняя и верхняя цена игры. Принцип минимакса
- •Лекция 21. Методы решения игр
- •21.1. Решение игры в чистых стратегиях
- •21.2. Решение игры в смешанных стратегиях
- •21.3. Упрощение игр
- •21.4. Решение игры 2х2
- •21.5. Графический метод решения (2х2)-игр
- •Лекция 22. Игры 2 х п
- •Лекция 23. Решение игр т х 2 и т х п
- •23.1. Решение игр т х 2
- •23.2. Решение игр т х п
- •Лекция 24. Критерии принятия решений в условиях риска и неопределенности
- •24.1. Основные понятия. Математическая модель
- •24.3. Максиминный критерий Вальда
- •24.4. Критерий минимаксного риска Сэвиджа
- •24.5. Критерий пессимизма-оптимизма Гурвица
- •Литература
Лекция 24. Критерии принятия решений в условиях риска и неопределенности
24.1. Основные понятия. Математическая модель
В задачах теории игр мы рассматривали операции, проводимые в условиях неопределенности. Эта неопределенность была связана с неизвестным нам поведением противной стороны. При этом делалось предположение о том, что противник является «разумным» и предпринимает действия, наименее выгодные для нас.
Однако при исследовании операций приходится встречаться и с иным видом неопределенности. Очень часто неопределенность связана не с характером поведения противника, а с отсутствием у нас информации об условиях проведения операций (погодные условия, конъюнктура на рынке, покупательский спрос и т.д.).
Внешняя среда (объективная действительность), в условиях которой проходит операция и от которой зависят результаты операции, называется «природой». «Природа» в теории статистических решений не выбирает стратегию и не оказывает сознательного противодействия.
Парная матричная игра, в которой разумный игрок А, заинтересованный в наиболее выгодном для него исходе игры, выступает против участника, безразличного к результату игры, называется игрой с природой.
Рассмотрим игру, в которой игрок А имеет т возможных стратегий: А1, А2,…, Ат; о состояниях природы можно сделать п предположений П1, П2,…, Пп. Запишем т х п-матрицу
выигрышей А = (аij). Требуется выбрать такую стратегию игрока А (чистую или смешанную), которая является более выгодной по сравнению с другими [5].
Анализируя игровую матрицу, можно отбросить дублируемые и заведомо невыгодные стратегии игрока А (строки матрицы). Исключать столбцы нельзя, так как для природы нет невыгодных состояний. Теперь на основании матрицы выигрышей можно искать наилучшие стратегии.
Если оказалось, что ни одна из стратегий не доминирует над другими, то не всегда матрица дает полную информацию о преимуществах тех или иных стратегий. Предположим,
что выигрыш при стратегии Аi и состоянии природы Пj больше, чем при стратегии Аk и состоянии природы Пl: аij > аkl. Это не обязательно означает, что стратегия Аi лучше стратегии Аk. Возможно, состояние Пj более благоприятно, чем состояние Пl.
Дополнительную информацию дает матрица рисков (матрица сожалений) R = (rij).
Выразим риск rij через элементы матрицы выигрышей (аij). Риском rij игрока А при использовании стратегии Аi в условиях Пj называется разность между максимальным выигрышем в столбце βj, который мы получили бы, если бы знали состояние природы Пj, и выигрышем аij, который мы получим, не зная его и выбирая стратегию Аi:
rij = βj – аij,
где βj = max аij.
i
Из этого определения следует, что риск не может быть отрицательным: rij ≥ 0. Матрица рисков (rij) зачастую дает более наглядную картину неопределенной
ситуации, чем матрица выигрышей (аij).
Пример 24.1 [5]. Относительно этих условий можно сделать различные предположения: П1, П2, П3, П4. Ожидаемая прибыль (Аi) для различных условий (Пj) задана матрицей выигрышей (аij) (табл. 24.1). Построить матрицу рисков (rij).
113
Таблица 24.1
Матрица выигрышей
|
П1 |
П2 |
П3 |
П4 |
А1 |
1 |
4 |
5 |
9 |
А2 |
3 |
8 |
4 |
3 |
А3 |
4 |
6 |
6 |
2 |
Решение. Каждый элемент матрицы вычитаем из максимального в данном столбце значения. В первом столбце это β1 = 4, в остальных β2 = 8, β3 = 6, β4 = 9. Получаем матрицу рисков (табл. 24.2).
Таблица 24.2
Матрица рисков
|
|
П1 |
П2 |
П3 |
П4 |
|
|
А1 |
3 |
4 |
1 |
0 |
|
|
А2 |
1 |
0 |
2 |
6 |
|
|
А3 |
0 |
2 |
0 |
7 |
|
В матрице выигрышей (аij) (табл. 24.1) |
а21 = а24 = 3. Однако эти выигрыши |
|||||
неравноценны друг другу, что отражается элементами матрицы рисков r21 = 1, r24 = 6. |
||||||
Выбор оптимальной стратегии |
игрока А зависит от принципа оптимальности, на |
котором этот выбор основан. Рассмотрим наиболее известные критерии принятия решений
[5, 26,27].
24.2.Критерий, основанный на известных вероятностях условий (критерий Байеса–Лапласа)
Пусть нам неизвестны состояния природы, но известны их вероятности:
n
q1 = Р (П1), q2 = Р (П2), …, qn = Р (Пп), ∑qi = 1.
i=1
Вкачестве оптимальной по критерию Байеса принимается та стратегия Аi, для которой
средний выигрыш аi , или математическое ожидание выигрыша, максимален:
|
|
n |
а = max аi = |
max |
∑aijq j , |
i |
i |
j=1 |
|
|
|
n |
|
|
где аi = ∑aijq j . |
|
|
j=1
Спомощью такого приема задача о выборе решения в условиях неопределенности превращается в задачу выбора решения в условиях определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем.
При выборе оптимальной стратегии в неизвестных условиях с известными
вероятностями можно пользоваться не только средним выигрышем аi , но и средним риском
n
ri = ∑rijq j , j=1
114
|
|
|
|
|
n |
который нужно обратить не в максимум, а в минимум : |
r |
= min |
ri |
= min |
∑rijq j . |
|
|
i |
|
i |
j=1 |
|
|
|
|
|
Если у игрока А нет информации о вероятностях q j состояний природы (все гипотезы
равнозначны), то вероятности полагают равными друг другу:
q1 = q2 =…= qn = 1/п.
Это – принцип недостаточного основания Лапласа.
Если игрок может проранжировать гипотезы в порядке убывания их правдоподобности, то в этом случае можно назначить вероятности состояний пропорциональными членам убывающей арифметической прогрессии:
q1 : q2: … : qn = п : (п – 1) : … : 1, n
или, учитывая, что ∑qi = 1, i=1
qi = 2 (п – i +1) / (п (п +1)), i = 1, 2, … п.
Критерий Байеса–Лапласа рекомендуется применять, если:
• вероятности q1 , q2, …, qn известны;
•решение реализуется многократно;
•риск при небольшом числе реализаций решения допустим.
Пример 24.2. Условия игры заданы 4 х 3-матрицей |
(табл. 24.3). Априорные |
вероятности состояний природы равны: q1 = 0,3; q2 = 0,2; q3 = |
0,5. Найти оптимальную |
стратегию игрока А с помощью критерия Байеса и среднего риска. Средние выигрыши аi
помещены в соответствующем столбце табл. 24.3.
Таблица 24.3
Матрица выигрышей
|
П1 |
П2 |
П3 |
аi |
А1 |
15 |
15 |
30 |
15 |
А2 |
2,5 |
22,5 |
22,5 |
16,5 |
А3 |
–10 |
30 |
30 |
18 |
А4 |
–35 |
5 |
45 |
13 |
q j |
0,3 |
0,2 |
0,5 |
|
Как следует из табл. 24.3, оптимальной по критерию Байеса является чистая стратегия
А3: max аi =18, А0 = А3.
i
Используем для решения задачи понятие риска. Составим матрицу рисков (табл. 24.4). Таблица 24.4
Матрица рисков
|
П1 |
П2 |
П3 |
ri |
А1 |
0 |
15 |
30 |
18 |
А2 |
12,5 |
7,5 |
22,5 |
16,5 |
А3 |
25 |
0 |
15 |
15 |
А4 |
50 |
25 |
0 |
20 |
q j |
0,3 |
0,2 |
0,5 |
|
115
Табл. 24.4 показывает, что чистая стратегия А3 |
является оптимальной: min |
ri |
= 15, |
А0 = А3. |
i |
||
|
|
|
24.3. Максиминный критерий Вальда
Согласно этому критерию в качестве оптимальной выбирается та стратегия игрока А, при которой минимальный выигрыш максимален, т.е. стратегия, гарантирующая при любых условиях выигрыш не меньший, чем при наихудшем состоянии природы:
W = max min аij. |
(24.1) |
|
i |
j |
|
Этот критерий называют критерием крайнего пессимизма – всегда надо рассчитывать на худшее. Применение критерия W оправдано, если ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:
•о возможности появления состояний природы Пj ничего неизвестно;
•приходится считаться с появлением Пj;
•решение реализуется лишь один раз, поэтому необходимо исключить какой бы то ни было риск.
24.4. Критерий минимаксного риска Сэвиджа
Этот критерий рекомендует в условиях неопределенности выбирать ту стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации (когда риск максимален):
S = min max rij. |
(24.2) |
|
i |
j |
|
Критерий Сэвиджа, так же как и критерий Вальда – это критерий крайнего пессимизма. Отличие состоит в том, что худшим объявляется не минимальный выигрыш, а максимальная потеря выигрыша по сравнению с тем, чего можно было бы достичь в данных условиях (максимальный риск).
При использовании критерия Сэвиджа к ситуации принятия решения предъявляются те же требования, что и в случае критерия Вальда.
24.5. Критерий пессимизма-оптимизма Гурвица
Критерий Гурвица рекомендует осуществлять выбор на основе комбинации максиминной и крайне оптимистичной стратегий. Оптимальной считается стратегия, выбираемая из условия:
Н = max (γmin аij + ((1 – γ) max аij), |
(24.3) |
||
i |
j |
j |
|
где γ – коэффициент (весовой множитель), 0 ≤ γ ≤ 1. При γ = 1 критерий Гурвица превращается в пессимистический критерий Вальда, при γ = 0 получается критерий крайнего оптимизма, ориентированный на получение максимального выигрыша в наилучших условиях. При 0 < γ < 1 получается комбинированная мера пессимизма. Значения коэффициента γ выбираются субъективно: чем опаснее ситуация, чем больше мы хотим подстраховаться, тем ближе к 1 выбирается γ (тем больше наше доверие к критерию Вальда).
Обычно данный критерий рекомендуют применять, если
•о вероятности появления состояний природы Пj ничего неизвестно, поэтому в равной мере приходится считаться со всеми;
•решение реализуется один или несколько раз;
•риск допускается.
Пример 24.3. Найти оптимальное решение для матрицы выигрышей (24.3), пользуясь критериями Вальда, Сэвиджа и критерием Гурвица при γ = 0,4.
116
Решение.
1. Воспользуемся формулой (24.1). Для каждой строки матрицы выигрышей рассчи-
тываем наименьший выигрыш (табл. 24.5): wi = min аij. Затем находим W = max min аij = 15. |
||||||||
|
|
|
j |
|
|
i |
j |
|
Следовательно, оптимальной стратегией является А1. |
|
|
|
Таблица 24.5 |
||||
|
Матрица выигрышей для расчета критерия Вальда |
|||||||
|
|
|||||||
|
|
П1 |
П2 |
|
П3 |
wi |
|
|
|
А1 |
15 |
15 |
|
15 |
15 |
|
|
|
А2 |
2,5 |
22,5 |
|
22,5 |
2,5 |
|
|
|
А3 |
–10 |
30 |
|
30 |
–10 |
|
|
|
А4 |
–35 |
5 |
|
45 |
–35 |
|
|
2. Для вычисления критерия Сэвиджа составим матрицу рисков (табл. 24.6), которую
дополним столбцом, содержащим значения si = max rij. Затем по формуле (24.2) находим
j
S = min si |
= 22,5. Следовательно, оптимальной стратегией является А2. |
|
|||||||||||||||
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 24.6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
Матрица рисков для расчета критерия Сэвиджа |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
П1 |
|
П2 |
|
П3 |
|
si |
|
|
||||
|
|
А1 |
|
0 |
|
15 |
|
30 |
|
30 |
|
|
|||||
|
|
А2 |
|
12,5 |
|
7,5 |
|
22,5 |
|
22,5 |
|
|
|||||
|
|
А3 |
|
25 |
|
0 |
|
15 |
|
25 |
|
|
|||||
|
|
А4 |
|
50 |
|
25 |
|
0 |
|
50 |
|
vi = max аij, |
|||||
3. Для отыскания значения критерия Гурвица (24.3) вычислим wi = min аij, |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
j |
j |
hi = 0,4wi |
+ (1 – 0,4) vi (табл. |
24.7). |
|
Тогда |
критерий |
Гурвица Н = max |
hi = 15. |
||||||||||
Следовательно, оптимальной стратегией является А1. |
|
|
|
i |
|
||||||||||||
|
|
|
Таблица 24.7 |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
Расчет критерия Гурвица |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
wi |
|
vi |
|
hi |
|
|
||||
|
|
|
А1 |
|
|
15 |
|
15 |
|
15 |
|
|
|
||||
|
|
|
А2 |
|
2,5 |
|
22,5 |
|
14,5 |
|
|
|
|||||
|
|
|
А3 |
|
–10 |
|
30 |
|
14 |
|
|
|
|||||
|
|
|
А4 |
|
-–35 |
|
45 |
|
13 |
|
|
|
117