
- •Міністерство освіти і науки україни
- •Одеська національна академія харчових технологій
- •Сахарова с.В.
- •Експертні системи
- •Посібник до самостійної роботи та виконання контрольних робіт для студентів заочної (дистанційної) форми навчання
- •1 Програма навчальної дисципліни
- •2 Завдання до контрольної роботи
- •Послідовність виконання
- •Послідовність виконання
- •3 Список варіантів завдання
- •4 Теоретичні відомості
- •4.1 Інтелектуальна обробка даних (іод) Класифікація задач іод
- •Основні підходи до вирішення задач іод Кластерінг (таксономія)
- •Оцінка складних об єктів, вибір, класифікація (роспізнавання образів), формування висновку
- •4.2 Вирішення задачі кваліметрії
- •Опис оціночної моделі
- •Формування переліку властивостей
- •Формулювання вимог
- •4.3 Вирішення задачі класифікації
- •5 Приклад розробки та побудови експертної системи для мереждоступу
- •6 Список питань до іспиту з дисципліни Експертні системи
4.3 Вирішення задачі класифікації
Якщо у множині об’єктів, які розглядаємо містяться локальні групи – класи, та основною задачею аналізу є визначення до якого класу належить об’єкт, то Ви маєте справу з задачею класифікації. В задачі класифікації для кожного класу, що розпізнаємо формується позитивний еталон, та для об’єкта рахується стільки інтегральних характеристик, скільки маємо розпізнати класів. Ця множина інтегральних характеристик визначає ступень наближення об’єкта до еталонів різних класів. На основі порівняння цієї множини інтегральних характеристик приймається рішення про належність об’єкта до одного з класів, які розпізнаємо.
Проведення класифікації всіх об’єктів з вікна бази даних об’єктів виконується вибором пункту меню "Расчет|Множественный". У результаті система оцінить об’єкти у кожному з класів окремо та прийме рішення про належність кожного об’єкта до того чи іншого класу.
Особливості формування вимог
Послідовність формування шаблону вимог в задачі класифікації відрізняється додатковими діями, що спричинені описом вимог для кожного класу:
Ввести ім’я вимоги в рядку введення ім’я. Якщо ім’я вимоги унікальне, то при переході з рядка введення ім’я або натисненні кнопки "Добавить" вимога автоматично додається до списку вимог. Інакше здійснюється перехід до редагування тієї вимоги, ім’я якої було введено.
У вікні списку незалежних властивостей обрати ті, які слід зробити залежними від цієї вимоги. Натиснути кнопку "->". При рішенні задачі класифікації відповідності завжди однакові у всіх класах. В рядку введення дугового коефіцієнта задати вагу властивості в цій вимозі. Після натиску кнопки "OK" система автоматично приведе до норми дугові вагові коефіцієнти так, що сума ваги всіх властивостей , залежних від цієї вимоги буде дорівнювати одиниці.
Обрати клас, де слід встановити вагу. В рядку введення ваги задати вагу вимоги в цьому класі. Встановити прапорець критичності, якщо вимога критична у даному класі.
Повторити кроки 3 для всіх класів.
Повторити кроки 1 – 4 для всіх вимог.
Нагадаємо, що версія Expek 1.5+ дає можливість надавати різні вагові та дугові коефіцієнти, а також вектор критичності в різних класах. Ви, звичайно маєте можливість надати однакові коефіцієнти, але у такому випадку з’являється питання: Як врахувати різну значимість та критичність вимог в різних класах.
Особливості навчання проекту
Можливі два варіанти відносин між класами: які перетинаються та які не перетинаються. Якщо система навчена так, що класи не перетинаються (С та В) або перетинаються в дуже малій зоні (А та В), то помилок при оцінюванні не буде та спроможність розпізнавати властивостей буде максимальною. Якщо класи перетинаються (А та С), то системі буде важко прийняти рішення для об’єкту з зони перетину (зверніть увагу при поодинокому розрахунку на наявність пошти однакових інтегральних характеристик об’єкту в різних класах – має місце перетин класів та велика вірогідність помилки системи).
Особливістю навчання задачі класифікації є наявність додаткової панелі графічного перегляду еталонів у нижній правій частині діалогового вікна редактора еталонів. Вона призначена для перегляду еталонів властивості, яку редагуємо в інших класах. Панель графічного перегляду еталонів складається з:
комбінована панель вибору ім’я класу, для котрого Ви бажаєте переглянути еталон властивості, яку редагуємо;
панелі візуалізації функції міри виразу.
Для перегляду еталонів даної властивості оберіть в комбінованій панелі вибору відповідне ім’я класу.
В задачі класифікації еталони вважаються добре сформованими та будуть мати високу спроможність розпізнавати, якщо при накладанні один на одного еталонів однієї властивості різних класів площа перетину буде мінімальна. Можливість відстежувати ідентичність еталонів дає панель графічного редагування.
Після формування еталонів оцініть якість навчання ("Обучение|Анализ"). При низькій спроможності розпізнавання радимо редагування еталонів с ціллю її підвищення. Детальніше це описано нижче.
Аналіз еталонів
В задачі класифікації, на основі порівняння еталонів різних класів, можливо отримати інформацію для аналізу встановлених ваг вимог та спроможності розпізнавання окремих властивостей. Для цього оберіть пункт меню " Обучение|Анализ ". На робочому полі Expek Pro з’явиться вікно аналізу еталонів. Це вікно багатодокументного інтерфейсу уявляє собою таблицю. Перший стовпчик містить список властивостей, далі іде стільки стовпчиків, скільки класів розпізнається в задачі. Кожний зі стовпчиків містить дві колонки цифр: сумарну вагу властивості в даному класі та вагу, яку пропонує система для підвищення якості розпізнавання. В стовпчику "Распознающая способность" значення в відсотках показують, як точно та чи інша властивість розпізнає належність об’єкта тому чи іншому класу.
Особливості множинного розрахунку
Зробивши множинний розрахунок, Ви отримаєте n+1 стовпчиків, де n – кількість класів, в яких система оцінить об’єкти в кожному класі окремо та прийме рішення про належність кожного з об’єктів тому чи іншому класу (стовпчик "Решение"). Проаналізувавши інтегральні характеристики об’єкта за класами, слід звернути увагу, якщо об’єкт в різних класах має значення, які мало відрізняються – це свідчить про можливість помилки в прийнятті рішення про належність об’єкта до класу.
Для вияву помилок пропонують системі оцінити контрольну вибірку об’єктів, для яких відома належність до класу та порівнюють рішення системи з відомим (правила формування контрольної вибірки див. в теоретичних відомостях до лабораторної роботи №3). Якщо система зробила помилку, слід відстежити, використовуючи поодинокий розрахунок, в якому класі помилка та яка властивість (або властивості) чинять найбільший вплив. Відношення кількості помилок до кількості об’єктів в контрольній вибірці є імовірністю помилки системи. Розраховують за класами (імовірність помилки в кожному класі) та в цілому системи.
В контрольній роботі кількість об’єктів в базі даних, на яких будуть розпізнаватися класи повинно бути у 3 – 4 рази більше кількості класів.
Особливості візуалізації результатів
Для візуалізації результатів оцінювання об’єктів необхідно обрати "Расчет|Визуализация результатов" при відкритому (але не обов’язково активному) вікні бази даних. На екрані буде виведено вікно, яке містить візуалізацію результатів оцінювання об’єктів у вигляді гістограми. Кожен об’єкт постає одним горизонтальним стовпчиком. Зліва від нього виводиться ім’я об’єкта (перше реєстраційне поле), а справа – його інтегральна характеристика. Інтегральна характеристика об’єкта відбивається у відсотках від інтегральної характеристики еталона. Особливістю є те, яка саме оцінка обирається для візуалізації: для візуалізації береться оцінка за тим класом, належність до якого визначена системою, для контрольної вибірки – оцінка в тому класі, який визначений системою (незалежно від прийнятого рішення).
Особливості аналізу внеску властивостей в інтегральну характеристику
Докладну інформацію для аналізу вкладу властивостей поточного об’єкта в його інтегральну характеристику Ви маєте можливість отримати, обравши пункт меню "Расчет|Одиночный". Тоді на робочому полі Expek Pro з’явиться вікно аналізу. Це вікно постає у вигляді таблиці. Перший стовпчик містить список властивостей об’єкта, другий – значення його властивостей. Якщо вирішується задача класифікації, то ще стільки стовпчиків, скільки класів розпізнається в задачі. Але в задачі класифікації ці данні в вікні містять додаткову інформацію для аналізу рішення про належність об’єкта до того чи іншого класу.
Контрольна вибірка
Оцінити наявність помилок в прийнятих рішеннях про належність об’єктів до класів, можливо , якщо запропонувати розпізнати класу на контрольній групі об’єктів. Ця група відрізняється наявністю експертної оцінки ("База данных|Редактировать экспертную оценку..."), яку слід порівняти з рішенням системи.
Не намагайтеся візуалізувати результати розрахунків для контрольної вибірки, тому що для неї буде виведена оцінка за тим класом, який визначено експертом (незалежно від прийнятого рішення).