
konspect_2010
.pdf
1 Постановка задачі
2Формування множини допустимих рішень
3Формування набору критеріїв
4Розробка шкал оцінювання критеріїв
5Оцінка допустимих варіантів критеріїв
6Оцінка та уточнення інформації щодо пріоритетів
7Побудова правил для рішення
8Впорядкування допустимих варіантів рішень
9Аналіз результатів впорядкування
Так |
10 Проведення впорядкування є |
|
|
|
задовільним? |
11 Аналіз причин незадовільності та необхідний вид коректив
Так |
12 Одержане впорядкування |
|
|
|
відповідає поставленій меті? |
Кінець розв’язку задачі
Рисунок 10 - Структура процесу прийняття рішення
На 2 етапі формується безліч варіантів рішення, перевіряється можливість досягнення поставленої мети. Установлюється поняття «допустимість», розробляється спосіб перевірки допустимості, виділяється безліч варіантів рішення.
У блоці 3 аналізуються можливі наслідки обраних варіантів рішень, визначаються показники, які характеризують можливі наслідки, формується набір критеріїв для оцінки наслідків, розробляються шкали оцінювання критеріїв (блок 4).
Реалізація 3 й 4 етапів тісно зв'язана між собою. Під час розробки шкал оцінювання може виявитися незначний вплив одного із критеріїв, неоднорідність оцінювання, може виявитися комплексний характер одного
50
із критеріїв. У цих випадках доцільно повернутися до блоку 3 і скорегувати критерії.
На 5 етапі оцінюють припустимі варіанти рішень. На цьому етапі також може виникнути неоднозначний комплексний характер критеріїв, надлишкова детальність оцінок, невідповідність змісту деяких критеріїв їхнім шкалам. Для цього вносяться відповідні корективи в безліч критеріїв або шкал оцінювання.
Побудова вирішального правила, що приводить до необхідного впорядкування варіантів рішення, можлива протягом декількох етапів. На кожному з таких етапів одержують певну інформацію щодо пріоритету суб'єкта управління (блок 6). У блоці 7 інформація використовується для побудови відповідного вирішального правила.
Блок 8 – здійснюється порівняння й упорядкування варіантів рішення.
Блок 9 – аналіз результатів упорядкування. Під час такого аналізу може виявитися незадовільний результат (блок 10), тобто невідповідність упорядкування уявленням суб'єкта управління, тоді блок 11 – дослідження причини невідповідності.
Причини невідповідності:
1 Неадекватність використання інформації або допущень інтуїтивним пріоритетам.
2Випадання з аналізу якогось із припустимих варіантів рішень.
3Неповнота наборів критеріїв.
4Невідповідність шкал критеріїв можливостям оцінці.
5Неточності або помилки при оцінюванні деяких допустимих варіантів.
6Неточне визначення поняття допустимих варіантів.
Залежно від причин незадовільного впорядкування варіантів рішення до моделі вносяться необхідні уточнення, виправлення й доповнення й повторюються відповідні етапи.
Якщо впорядкування варіантів виявиться задовільним (блок 10), то при використанні вирішальних правил перевіряється, чи відповідає його вид поставленому завданню (блок 12).
Наприклад, у поставленому завданні необхідно лінійно впорядкувати припустимі варіанти рішення, у той же час, вирішальне правило призводить лише до їхнього часткового впорядкування, тоді необхідно одержати додаткову інформацію щодо пріоритету (повернення до блоку 6), побудувати нове більш жорстке вирішальне правило. Цю процедуру повторювати доти, поки не буде вичерпана вся додаткова інформація. При неможливості одержання додаткової інформації, початкова постановка задачі повинна бути менш жорсткою.
Коли впорядкування варіантів рішень визнається суб'єктом управління як задовільне, то воно вважається остаточним.
51
1.5.3 Постановка багатокритеріальної задачі
Багатокритеріальна задача оптимального управління подана тройкою U , , R , де U – множина управлінь, – відображення U в просторі доходів Em ; R – бінарне відношення на Em , за яким доходи
порівнюються.
Постановка задачі та її властивості
Нехай U – множина управлінь для деякого об’єкта. Управління u U можуть мати різну природу: стратегії в грі, неперервні функції, правила зупинки. Природа та структура множин U для загальної постановки задачі оптимального управління несуттєві. Кожному управлінню u U ставиться у відповідність m -мірний вектор доходу (u) Em . Вид визначається
властивостями об’єкта управління. Будемо інтерпретувати Em як простір
доходів.
Замість доходів можна розглядати штрафи. У першому випадку оптимальні управління будуть відповідати мажорантам, в іншому – мінорантам; обидва випадки еквівалентні один одному, тому далі будемо розглядати доходи.
Нехай на просторі Em задане бінарне відношення. Управління u* U
являється оптимальним, якщо за всіма іншими управліннями u U неможливо отримати вектор доходів (u) , який має більшу перевагу у
|
|
|
|
|
|
відношенні до R , ніж |
(u* ) , тобто |
(u) R (u* ) |
для всіх u U . Будемо |
||
називати такі рівняння |
R -оптимальними. Позначимо множину всіх R – |
||||
оптимальних рівнянь як (U ) . |
|
|
|
|
Багатокритеріальна задача оптимального управління полягає в тому, щоб при заданих U , та R виділити (U ) . Якщо відображення зіставляє кожному u U число (u) E1 , а відношення R являється відношенням „більше‖ на множині дійсних чисел, то отримаємо класичну однокритеріальну задачу оптимального управління.
Багатокритеріальна задача оптимального управління звичайно має
множину розв’язків. Розв’язком (U , , R) |
задачі оптимального управління |
U , , R називається множина всіх |
R -оптимальних рівнянь u* U ; |
окремим розв’язком – будь-яке R -оптимальне управління u* U . Специфіка задачі може привести до того, що стає необов’язковим
виділення множини (U ) : достатньо знайти хоч один елемент u (U ) чи частину (U ) , яка характеризується деякими додатковими властивостями.
Ситуація прийняття багатоцільових рішень характеризується парою {x,F}, де x={x1,..xm} – безліч рішень суб'єктів управління, F={F1,F2,…,FQ}={fkq}Q,m, (q,k=1) – вектор функціонала оцінювань. Необхідно вибрати єдине рішення, що буде оптимальним за критерієм згортки з урахуванням впливу факторів (v, w, u) , де
v – метод нормалізації;
52

u – співвідношення пріоритету; w – критерій згортки.
Метод нормалізації – це функція переходу F, як однозначного відображення RQ в Rl, нормалізація використовується для переходу до порівняльних шкал у значеннях функціонала оцінювання (табл. 16).
Метод пріоритету – вектор оцінок (u1,…uQ) на компонентах
F={F1,F2,…,FQ} (табл. 17).
Критерій згортки – принцип прийняття оптимальних рішень або функція відображення RQ в Rl (табл. 18).
Таблиця 16 - Методи нормалізації
|
Методи нормалізації |
Математичний запис |
|||
1 |
Заміна інгредієнтів |
( f kq ), |
1 |
|
|
|
|
|
|||
|
|
f kq |
|
||
|
|
|
|
|
|
2 |
Відносна нормалізація |
( fkq / maxf/q );( fkq / minfkq ) |
|||
|
|
k |
|
|
k |
3 |
Порівняльна нормалізація |
( f kq minf kq |
);( max f kq f kq ) |
||
|
|
k |
|
k |
|
4 |
Природна нормалізація |
( fkq min fkq ) /(max fkq |
min fkq ) |
||
|
|
k |
k |
k |
|
5 |
Севіджа |
(max fkq fkq ) /(max f kq min f kq ) |
|||
|
|
k |
k |
k |
|
|
|
|
|
|
|
Таблиця 17Принципи побудови пріоритетів
|
Принципи |
Математичний запис |
||||
1 |
Лінійний |
|
uq fkq |
|||
|
|
|
|
|
|
|
2 |
Показовий |
|
q |
) |
uq |
|
|
|
|
( fk |
|
||
3 |
Зменшення розмірності задачі |
F {F q }, q Q0 |
||||
|
|
|
|
|
||
|
|
Q 0 {q 1, Q /(F q F q0 )} |
||||
|
|
q0 невідоме |
|
число |
Таблиця 18 - Критерій згортки
|
Критерій згортки |
Математичний запис |
1 |
Гарантований результат |
minf kq |
|
|
q |
|
|
|
2 |
Домінуючий результат |
max f kq |
|
|
q |
|
|
|
3 |
Рівність |
fk10 fk20 ... fkQ0 |
4 |
Сумарна ефективність |
fkq |
|
|
q |
|
|
|
5 |
Рівномірність |
fkq |
|
|
q |
53
1.5.4 Багатокритеріальна модель обґрунтування прийняття рішень [11]
Одноцільова багатокритеріальна модель обґрунтування прийняття рішень у полі однієї інформаційної ситуації
За наявності однієї цілі (одного цільового функціонала оцінювання) у полі вибраної інформаційної ситуації актуальною стає проблема обґрунтування прийняття рішення, яке є компромісним щодо кількох критеріїв оптимальності (характерних для даної інформаційної ситуації) [11].
У цьому випадку обґрунтування прийняття рішення доцільно здійснювати згідно з ієрархічною моделлю (схемою), наведеною на рисунку 11.
Зазначимо, що реалізація цієї й подальших ієрархічних моделей базується на використанні так званої операції «згортки інформації». Формально під методом (оператором) згортки інформації, що відповідає певному критерію, будемо розуміти внутрішню частину цього критерію, яка здійснює перетворення початкової інформації до вигляду, зручного щодо застосування критеріїв обґрунтування прийняття рішення.
K
Цю операцію позначимо таким чином: « » , де К — це ознака критерію, на основі якого здійснюють згортку.
На рис. 10 використано такі умовні позначення:
K qj — оператори згортки функціонала оцінювання Р, які
відповідають критеріям обґрунтування прийняття рішень, що використовуються в полі інформаційної ситуації I j , ( j 1,..., 5; q 1,..., Q j ) ;
Q j |
— кількість операторів згортки, що |
використовуються в |
полі |
||||||
інформаційної ситуації I j , ( j 1,..., 5) ; |
|
|
|
|
|
||||
~ |
j |
|
|
|
|
|
|
|
|
FK q — вектор-стовпчик рейтингів альтернативних рішень, який є |
|||||||||
результатом |
згортки |
матриці |
F |
за |
допомогою |
оператора |
|||
Kqj , ( j 1,...; q 1,..., Q j |
) ; |
|
|
|
|
|
|
||
U kj |
u kj1 ,..., u kjQ |
— вектор вагових |
коефіцієнтів, які відображають |
||||||
|
|
|
j |
|
|
|
|
|
|
пріоритетність |
критеріїв |
обґрунтування |
прийняття рішень |
щодо |
–ої |
||||
|
|
|
|
Q j |
|
|
|
|
|
|
|
|
k |
k |
|
|
|
|
|
інформаційної ситуації u jq |
0; u jq |
1 . |
|
|
|
|
|||
|
|
|
|
q 1 |
|
|
|
|
|
FI j |
— інтегральний функціонал оцінювання (матриця розмірності |
||||||||
|
|
|
|
|
~ |
j |
|
|
|
m Q j ), утворений з векторів-стовпчиків FK q , q 1,..., Q j ; |
|
|
НОРМ— оператор нормалізації матриці FI j ;
FI H — нормалізована матриця;
j
54

KU |
— оператор згортки матриці FI H з урахуванням коефіцієнтів |
||||
|
|
j |
u kj1 ,..., u kjQ |
; |
|
пріоритету, що становлять вектор пріоритету U kj |
|
||||
|
|
|
|
j |
|
~ |
— вектор-стовпчик, який відображає рейтинги альтернативних |
||||
FI j |
|||||
рішень і |
отриманий у |
результаті зваженої |
згортки матриці |
FI H за |
|
|
|
|
|
|
j |
допомогою оператора КІІ. |
|
|
|
|
|
S ko |
— компромісне (оптимальне) рішення; |
|
|
|
|
ZI j |
— оператор |
згортки функціонала |
оцінювання F |
у полі |
інформаційної ситуації I j .
Рисунок 11 – Ієрархічна модель обґрунтування прийняття одноцільового багатокритеріального рішення у полі однієї інформаційної ситуації
I j ( j 1,..., 5)
Одноцільова багатокритеріальна модель обґрунтування прийняття рішень у полі кількох інформаційних ситуацій
У практичній діяльності можливе поєднання інформаційних ситуацій.
Обґрунтування рішень у зазначених (а також інших) «проміжних» ситуаціях доцільно здійснювати за ієрархічною моделлю, наведеною на рис. 12, яка відображає ситуацію обґрунтування одноцільового багатокритеріального рішення у полі кількох інформаційних ситуацій.
55

На рисунку 12 використано умовні позначення, вже застосовані
раніше (рис. 10), а також: |
|
|
|
|
|
|
|
FF — інтегральний |
функціонал |
оцінювання |
(матриця розмірів |
||||
m 5 ), утворений з векторів-стовпчиків |
|
~ |
( j 1,..., 5) ; |
|
|
||
FI j |
|
|
|||||
U 1 u1 |
,..., u1 — вектор |
вагових |
|
коефіцієнтів, |
які відображають |
||
1 |
5 |
|
|
|
|
|
|
|
|
|
|
5 |
|
||
пріоритетність інформаційних ситуацій |
|
1 |
1 |
|
; |
||
u j |
0, u j |
1 |
|||||
|
|
|
|
|
j 1 |
|
|
~ — вектор-стовпчик рейтингів альтернативних рішень, отриманий
FF
у результаті зваженого згортання матриці FF за допомогою оператора KU ; ZF — оператор згортки функціонала оцінювання F у полі кількох
інформаційних ситуацій.
Рисунок 12 – Ієрархічна модель обґрунтування прийняття одно цільового багатокритеріального рішення у полі кількох інформаційних ситуацій
Багатоцільова багатокритеріальна модель обґрунтування прийняття рішень у полі кількох інформаційних ситуацій
Процес обґрунтування компромісу в полі кількох інформаційних ситуацій може розглядатися як ієрархічна модель (рис. 12), яка враховує можливість компромісу у полі кількох інформаційних ситуацій.
На рисунку 13 використано умовні позначення, застосовані на рисунках 12 та 11, а також:
F1 ,..., FN — функціонали оцінювання;
ZFl — оператор згортки функціонала оцінювання Fl , l 1,..., N ;
~
FFl — вектор-стовпчик, отриманий у результаті згортки функціонала оцінювання Fl , l 1,..., N ;
56

F — інтегральний |
функціонал оцінювання |
|
(матриця |
розмірів |
|||||
m N ), утворений із векторів-стовпчиків |
~ |
; |
|
|
|
|
|
||
FF ,l 1,..., N |
|
|
|
|
|
||||
|
|
|
l |
|
|
|
|
|
|
~ |
|
|
|
|
F |
, за допомогою |
|||
F — вектор-стовпчик рейтингів альтернатив |
|
|
|||||||
оператора KU . |
|
|
|
|
|
|
|
|
|
U F u F ,...,u F — вектор вагових |
коефіцієнтів, що |
відображають |
|||||||
1 |
N |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
||
пріоритетність відповідних функціоналів оцінювання |
|
|
1 |
1 |
|
||||
u j 0, |
u j |
1 . |
|||||||
|
|
|
|
|
|
|
|
j 1 |
|
ZNF – оператор згортки |
N функціоналів оцінювання у полі кількох |
||||||||
інформаційних ситуацій. |
|
|
|
|
|
|
|
|
Рисунок 13 – Ієрархічна модель обґрунтування прийняття багатоцільового багатокритеріального рішення
Приклад. Маємо l =2, X x1 ,..., x6 , 1 , 2 , 3 , F F , F1 , F2 та F3
задані у вигляді таких матриць:
|
|
1 |
2 |
|
|
|
|
x1 |
2 |
4 |
|
x |
|
4 |
3 |
F1 |
2 |
|
|
x3 |
6 |
7 |
|
x |
|
10 |
10 |
|
4 |
|
|
|
|
2 |
10 |
x5 |
3 |
|
|
|
|
1 |
2 |
3 |
|
|
|
|
|
|
|
|
|
|
1 |
|
|
x1 |
0 |
12 |
7 |
|
|
4 |
|
; |
x |
|
4 |
0 |
8 |
|
|
|
F 2 |
2 |
|
|
|
. |
|
5 |
|
|
x3 |
7 |
3 |
9 |
|
|
8 |
|
|
x |
|
4 |
2 |
5 |
|
|
|
|
|
4 |
|
|
|
|
9 |
|
|
|
|
10 |
1 |
2 |
|
|
|
x5 |
|
Прийняття рішення здійснюється у полі п’ятої інформаційної ситуації. Суб’єкт керування задає пріоритет з такими ваговими коефіцієнтами: u1 0.35 ; u2 0.65 .
57
Нормалізація – природна нормалізація. Критерій прийняття рішення
– критерій Вальда. Обирається показовий принцип врахування пріоритетів. Розв’язання. Для природної нормалізації для матриці F1 маємо:
– для стану середовища 1 :
min fk11 |
2 , max fk11 |
10 , |
max fk11 |
min fk11 |
8 ; |
k |
k |
|
k |
k |
|
– для стану середовища 2 : |
|
|
|||
min fk12 |
3 , max fk12 |
10 , |
max fk12 |
min fk12 7 ; |
|
k |
k |
|
k |
k |
|
– для стану середовища 3 : |
|
|
|||
min fk13 |
1, max fk13 |
9 , max fk13 min fk13 |
8. |
||
k |
k |
|
k |
k |
|
Звідси одержимо
x1x
F1 2
x3
x4x5
1 |
2 |
3 |
|
0 |
1/ 7 |
0 |
|
|
|||
2 / 8 |
0 |
3/ 8 |
|
|
|
|
. |
4 / 8 |
4 / 7 |
4 / 8 |
|
1 |
1 |
7 / 8 |
|
|
|||
0 |
1 |
1 |
|
|
Для природної нормалізації для матриці F2 маємо:
– для стану середовища 1 :
min fk21 |
0 , max fk21 |
10 , |
max fk21 |
min fk21 |
10 ; |
|
|||
k |
k |
|
k |
|
k |
|
|
|
|
– для стану середовища 2 : |
|
|
|
|
|
|
|||
min fk22 |
0 , max fk22 |
12 , max fk22 |
min fk22 |
12 ; |
|
||||
k |
k |
|
k |
|
k |
|
|
|
|
– для стану середовища 3 : |
|
|
|
|
|
|
|||
min fk23 |
2 , max fk23 |
9 , max fk23 |
min fk23 7 . |
|
|
||||
k |
k |
|
k |
|
k |
|
|
|
|
Звідси одержимо |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2 |
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x1 |
|
0 |
1 |
|
5 / 7 |
|
|
|
F 2 |
x |
4 /10 |
0 |
|
6 / 7 |
|
|
|
|
2 |
|
|
|
|
|
. |
|
|
|
|
x3 |
7 /10 |
3/12 |
1 |
|
||
|
|
|
x |
4 /10 |
2 /12 |
3/ 7 |
|
||
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
1 |
1/12 |
0 |
|
|
|
|
|
x5 |
|
|
Враховуючи показовий принцип пріоритету, одержимо: |
|||||||
~1 |
1 |
u |
~2 |
2 |
u |
|
, |
F |
( fk |
) |
1 , F |
( fk |
) |
2 |
тобто
58

x1
~ x
F1 2
x3
x4x5
1 |
2 |
3 |
|
|
0 |
0 |
0 |
|
|
|
|
|||
0.62 |
0.51 |
0.71 |
та |
|
|
|
|
|
|
0.78 |
0.82 |
0.78 |
|
|
1 |
1 |
0.95 |
|
|
|
|
|||
0 |
1 |
1 |
|
|
|
|
x1
~ x
F1 2
x3
x4x5
1 |
2 |
3 |
|
0 |
1 |
0.8 |
|
|
|||
0.55 |
0 |
0.9 |
|
|
|
|
. |
0.79 |
0.41 |
1 |
|
0.55 |
0.31 |
0.58 |
|
|
|||
1 |
0.2 |
0 |
|
|
Застосовуючи рівномірний вид згортки отримаємо матрицю функціоналу оцінювання:
x1x F 2x3
x 4x5
1 |
2 |
3 |
|
0 |
0 |
0 |
|
|
|||
0.34 |
0 |
0.64 |
|
|
|
|
. |
0.6 |
0.33 |
0.78 |
|
0.55 |
0.31 |
0.55 |
|
|
|||
0 |
0.2 |
0 |
|
|
За критерієм Вальда приймається оптимальне рішення x* x3 .
1.6Динамічні багатокритеріальні задачі
1.6.1 Поняття динамічного програмування [5-7, 11]
Динамічне програмування – це багатоетапний (багатокроковий) процес, на кожному етапі якого визначаються рішення деякої частини задачі, що обумовлено вихідною задачею.
Постановка задачі. Розглядається фізична система S, що перебуває у деякому початковому стані S0 S0 і являється керованою. За допомогою здійснення деякого управління U зазначена система переходить із
початкового стану S0 у кінцевий стан Sкон SR . При цьому якість
кожного з реалізованих управлінь U характеризується відповідним значенням функції W(U). Задача полягає у тому, щоб з безлічі можливих керувань U знайти таке U*, при якому функція W(U) набуває екстремального (мінімум або максимум) значення W(U*) (рис. 16).
Стан системи характеризується деякою точкою S на площині х10х2. Управління – це траєкторія руху. Задача полягає в тому, щоб із всіх припустимих траєкторій руху точки S знайти таку, котра вийде в результаті реалізації управління U*, що забезпечує екстремальне значення функції W(U*).
59