
- •Робота з нечіткою інформацією та нечіткими запитами в базі даних
- •1 Мета роботи
- •2 Нечіткі множини
- •3 Приклади нечітких множин
- •4 Методи побудови функцій приналежності нечітких множин
- •5 Нечітка і лінгвістична змінні
- •6 Нечіткі висловлення і нечіткі моделі систем
- •9 Контрольні запитання
- •10 Хід роботи
- •11.1 Звіт повинен містити:
- •11.2 Вимоги до оформлення звіту:
- •Робота з нечіткою інформацією та нечіткими запитами в базі даних
5 Нечітка і лінгвістична змінні
При описі об'єктів і явищ за допомогою нечітких множин використовується поняття нечіткої і лінгвістичної змінних .
Нечітка змінна характеризується трійкою <a, X, A>, де a - найменування змінної,
X - універсальна множина (область визначення a),
A - нечітка множина на X, що описує обмеження (тобто m A(x)) на значення нечіткої змінної a.
Лінгвістичною змінною називається набір <b ,T,X,G,M>, де b - найменування лінгвістичної змінної;
Т - множина її значень (терм-множина), що представляють собою імена нечітких змінних, областю визначення, кожної з яких є множина X. Множина T називається базовою терм-множиною лінгвістичної змінної;
G - синтаксична процедура, що дозволяє оперувати елементами терм-множини T, зокрема, генерувати нові терми (значення). Множина TИG(T), де G(T) - множина згенерованих термів, називається розширеною терм-множиною лінгвістичної змінної;
М - семантична процедура, що дозволяє перетворити кожне нове значення лінгвістичної змінної, утвореною процедурою G, у нечітку змінну, тобто сформувати відповідну нечітку множину.
Щоб уникнути великої кількості символів:
· символ b використовують як для назви самої змінної, так і для всіх її значень;
· для позначення нечіткої множини і його назви користуються одним символом , наприклад, терм "молодий", що є значенням лінгвістичної змінної b = "вік", одночасно є і нечіткою множиною М ("молодий").
Присвоєння декількох значень символам припускає, що контекст дозволяє робити можливі невизначеності.
Приклад Нехай експерт визначає товщину виробу, за допомогою поняття "мала товщина", "середня товщина" і "велика товщина", при цьому мінімальна товщина дорівнює 10 мм, а максимальна - 80 мм.
7
Формалізація такого опису може бути проведена за допомогою наступної лінгвістичної змінної <b, T, X, G, M>, де
b - товщина виробу;
T - {"мала товщина", "середня товщина", "велика товщина"}; X - [10, 80];
G - процедура утворення нових термів за допомогою зв'язувань "і", "або" і модифікаторів типу "дуже", "не", "злегка" і ін. Наприклад, "мала або середня товщина", "дуже мала товщина" і ін.;
М - процедура завдання на X = [10, 80] нечітких підмножин А1="мала товщина", А2 = "середня товщина", А3="велика товщина", а також нечітких множин для термів з G(T) відповідно до правил трансляції нечітких зв'язувань і модифікаторів "і", "або", "не", "дуже", "злегка" і ін. операції над нечіткими множинами виду: А З C, АИ C, , CON А = А2 , DIL А = А0,5 і ін.
Разом із розглянутими вище базовими значеннями лінгвістичної змінної "товщина" (Т={"мала товщина", "середня товщина", "велика товщина"}) існують можливі значення, що залежать від області визначення Х. У даному випадку значення лінгвістичної змінної "товщина виробу" можуть бути визначені як "близько 20 мм", "близько 50 мм", "близько 70 мм", тобто у вигляді нечітких чисел.
6 Нечіткі висловлення і нечіткі моделі систем
Нечіткими висловленнями будемо називати висловлення наступного виду: Висловлення <b є b'>, де b - найменування лінгвістичної змінної, b' - її значення, якому відповідає нечітка множина на універсальній множині Х. Наприклад, висловлення <тиск великий> припускає, що лінгвістичній змінній "тиск" надається значення "великий", для якого на універсальній множині Х змінної "тиск" визначена, відповідно даному значенню "великий", нечітка множина.
Висловлення <b є mb'>, де m - модифікатор, якому відповідають слова "ДУЖЕ", "БІЛЬШ-МЕНШ", "НАБАГАТО БІЛЬШЕ" і ін. Наприклад: <тиск дуже великий>, <швидкість набагато більше середньої> і ін.
Складні висловлення, утворені з висловлень видів 1. і 2. і союзів "І", "АБО", "ЯКЩО.., ТОДІ...", "ЯКЩО.., ТОДІ.., ІНАКШЕ".
7 Висловлення на множині значень фіксованої лінгвістичної змінної Якщо значення фіксованої лінгвістичної змінної відповідають нечітким
множинам однієї універсальної множини Х, можна ототожнювати модифікатори "дуже" чи "не" з операціями "CON" і "доповнення", а союзи "І", "АБО" з операціями "перетинання" і "об'єднання" над нечіткими множинами . 8 Лінгвістичні змінні для побудови нечітких запитів до бази даних
8
Хоча інформація в базі даних може бути найчіткіша (ціни з точністю до цента), а от елементарний запит для підтримки ухвалення рішення “ роздрукувати дані про акції з ціною близько 150 доларів ” є нечітким запитом. У таких випадках механізмом витягу інформації з бази знань для прийняття рішень є механізм нечітких запитів.
Проблема полягає в тому, як підключити в класичну мову запитів нечіткі терміни такі, як “низьке значення”, “набагато більш”, “більшість” і інші. Тобто, як розширити синтаксис і семантику запиту; як зробити ці нечіткі терміни доступними для користувача. Чіткий і нечіткий запити до бази даних Access мають структуру, представлену на малюнку 1.
|
Нечіткий запит
|
Чіткий запит
|
|
|
<запит> ::= SELECT <список полів> FROM <список таблиць> WHERE <нечіткий квантифіфікатор> <ланцюжок підумов> ; <ланцюжок підумов> ::= <підумова> | <підумова> OR <ланцюжок підумов> <підумов> ::= <нечіткий квантифікатор><коефіцієнт значимості> <ланцюжок атомарних умов> <ланцюжок атомарних умов> ::= <атомарна умова> | <атомарна умова> AND <ланцюжок атомарних умов> <атомарна умова> ::= <атрибут> = <нечітке значення> | <атрибут> = <нечітке відношення> <атрибут>| <атрибут> = <нечітке відношення> <число>| <інші форми відповідно до синтакса запиту Microsoft Access> <атрибут> ::= <числове поле> <нечіткий квантифікатор> ::= <таг ОВА> <ім'я квантифікатора> | <таг ОВА> ::= OWA
|
SELECT <список полів> WHERE умова11 AND умова12 AND ... AND умова1k OR ... OR
умоваn1 AND умоваn2 AND ... AND умоваnk
|
Рис.1. Порівняння структур чіткого і нечіткого запиту до бази даних <атрибут> - числове поле для використання в нечіткому запиті. Для кожного
атрибута задається найменше (LL) і найбільше (UL) граничне значення, що визначає інтервал можливих значень і використовується для масштабування значень при розрахунку ступеня відповідності з застосованим нечітким значенням чи зі ступенем приналежності до нечіткого відношення.
<нечітке значення> - еквівалент неточних лінгвістичних термів (наприклад, “великий” у “великий відсоток”) задається трапецієподібною функцією приналежності на [-10;10] для запобігання залежності від контексту.
<нечітке відношення> - нечітке відношення (“трошки більше ніж”) задається бінарним нечітким відношенням із трапецієподібною функцією приналежності. Обидва операнда можуть бути атрибутами чи числами. Для двох атрибутів різниця істиних
9
значень D лінійно приводиться до інтервалу [-10;10], зберігаючи інтервал змін, тобто масштабується інтервал [LL1-UL2; UL1-LL2] на [-10;10]. За ступінь відповідності покладають ступінь приналежності D у нечіткому відношенні. Якщо другим операндом є число, його інтервалом зміни покладають інтервал зміни першого, нечіткого параметра і ступінь відповідності обчислюють аналогічно.
<нечіткий квантифікатор> <коефіцієнт важливості><таг ОВА> - нечіткі квантифікатори використовуються у твердженнях, де “більшість (Q) з параметрів запиту повинні бути виконані”. Для обчислення значення цього запиту ми масштабуємо чітке кардинальне число (=міра кількості) нечіткої множини виконаних підумов на інтервал [0;10]. Використання коефіцієнта важливості дозволяє розрізняти головні підумови, виконання яких необхідно для збереження змісту поняття, представленого даним запитом, і другорядні підумови, не стільки важливі для змісту цього поняття. Більш того, підтримуються ОВА-оператори.
Отже, створення системи підтримки прийняття рішень у даній роботі, у якій механізм обчислення нечітких правил з'єднаний з механізмом нечітких запитів, дозволяє одержати нову інтерпретацію моделі ухвалення рішення, у якій інтерполюються зв'язки між вхідними перемінними.
Інтерполяція відбувається за допомогою масштабування повного інтервалу змін вхідних змінних на відомий інтервал фузіфікації, і далі, при почерговому відображенні результату на трапецієподібну функцію приналежності всіх лінгвістичних термів системи, методом перебору визначається результат з максимальною функцією відповідності.