Алгоритми і методика побудови «дерева рішень»

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный университет Львовская политехника

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Lab_2_Інтелектуальний аналіз даних.doc

Скачиваний:

Добавлен:

01.07.2025

Размер:

709.12 Кб

Скачать

☆

<<< < Предыдущая 1 2 34 / 104 5 6 7 8 9 10 > Следующая >>>

Алгоритми і методика побудови «дерева рішень»

На сьогоднішній день існує значна кількість алгоритмів, що реалізують побудову дерев рішень.

Методика «розділяй і владарюй»

Методика ґрунтується на рекурсивному розбитті множини об’єктів із навчаючої вибірки на підмножини, які містять об’єкти, що відносяться до однакових класів.

Спершу вибирається незалежна змінна, яку поміщують в корінь дерева.

Із вершини будуються вітки, що відповідають всім можливим значенням вибраної незалежної змінної.

Множина об’єктів із навчальної вибірки розбивається на декілька підмножин у відповідність до значення вибраної незалежної змінної.

Таким чином, в кожній підмножині будуть знаходитись об’єкти. У яких значення вибраної незалежної змінної будуть однакові.

Відносно навчальної вибірки Т і множини класів С можливі три ситуації:

множина Т містить один або декілька об’єктів, що відносяться до одного класу С_r. Тоді дерево рішень для Т – це лист, який визначає (оприділяє) клас С_r;
множина Т не містить ні одного об’єкта (порожня множина). Тоді це знову ж таки – лист, і клас, який асоціюють з листом, вибирається із іншої множини, відмінної від Т, наприклад із множини, асоційованої з предком;
множина Т містить об’єкти, які відносяться до різних класів. В такому випадку потрібно розбити множину Т на деякі підмножини. Для цього вибирається одна із незалежних змінних х_h, яка має два і більше відмінних одне від одного значень с_h², c_h², …, c_hⁿ. Множина Т розбивається на підмножини Т₁, Т₂, …, Т_n, де кожна підмножина Т_і містить всі об’єкти, у яких значення вибраної залежної змінної дорівнює с_h^і. Далі процес продовжується рекурсивно для кожної підмножини до тих пір, поки значення залежної змінної у новоствореній підмножині не буде однаковим (коли об’єкти належать одному класу). В цьому випадку процес даної вітки дерева зупиняється.

При використанні даної методики побудова дерева рішень буде відбуватись зверху вниз. Більшість алгоритмів, які її використовують є «жадібними алгоритмами». Це означає, що якщо один раз змінна була вибрана і по ній відбулось розбиття, то алгоритм не може повернутись назад і вибрати іншу змінну, яка дала би краще розбиття.

Питання полягає в тому, що невідомо яку змінну треба вибрати для початкового розбиття. Від цього повністю залежить якість отриманого в майбутньому дерева.

Загальне правило для вибору змінної для розбиття: вибрана змінна повинна розбити множину так, щоб отримати в результаті підмножину, яка складатиметься з об’єктів, які належатимуть одному класу і будуть максимально приближені до цього, тобто щоб кількість об’єктів із інших класів ("домішок") в кожному з цих множин було мінімальним. Іншою проблемою при побудові дерева є проблема зупинки його розбиття. Методи її вирішення:

1. Рання зупинка. Використання статистичних методів для оцінки доцільності подальшого розбиття. Заощаджує час побудови моделі, але будує менш точні моделі.

2. Обмеження глибини дерева. Потрібно зупинити подальшу побудову, якщо розбиття перевищує задане значення глибини дерева.

3. Розбиття не повинно бути тривіальним, тобто отримані в результаті розбиття вузли повинні містити не менше заданої кількості об'єктів.

4. Відсікання гілок (знизу вгору). Побудувати дерево, відсікти або замінити під деревом ті гілки, які призведуть до зростання кількості неправильно класифікованих об'єктів.

Побудувати всі можливі варіанти розбиття і вибрати найкращий є проблематично, якщо є багато незалежних змінних чи можливих класів.

<<< < Предыдущая 1 2 34 / 104 5 6 7 8 9 10 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025431.62 Кб0lab_2_3.doc
#
13.11.201970.14 Кб3Lab_2_asm.doc
#
12.02.2016753.66 Кб15Lab_2_C#.doc
#
01.07.20252.44 Mб1LAB_2_review_Kon.doc
#
01.07.2025165.38 Кб0lab_2_UNIVER_base_14.doc
#
01.07.2025709.12 Кб0Lab_2_Інтелектуальний аналіз даних.doc
#
12.02.20161.48 Mб14lab_3.doc
#
01.04.2025603.14 Кб0lab_3.doc
#
15.08.2019335.9 Кб8Lab_3.docx
#
19.07.2019100.35 Кб3Lab_31.doc
#
01.05.2025363.01 Кб0Lab_33.doc

Алгоритми і методика побудови «дерева рішень»

Методика «розділяй і владарюй»