Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lab05_Decision trees_2011.doc
Скачиваний:
3
Добавлен:
13.11.2019
Размер:
905.22 Кб
Скачать

2.2 Алгоритм id3

ID3(A,S,ʋ)

  1. Створити корінь дерева.

  2. Якщо S виконується на всіх елементах А, поставити в корінь мітку 1 і вийти.

  3. Якщо S не виконується на жодному з елементів А, поставити в корінь мітку 0 і вийти.

  4. Якщо Q=0, то :

а) якщо S виконується на половині чи більшій частині А, поставити в корінь мітку 1 і вийти;

б) якщо S не виконується на більшій частині А, поставити в корінь мітку 0 і вийти.

  1. Вибрати Q є ʋ, для якого Gain(A,Q) є максимальним.

  2. Поставити в корінь мітку Q.

7. Для кожного значення q атрибуту Q:

а) добавити нового потомка кореня і помітити відповідне вихідне ребро міткою q;

б) якщо в А немає випадків, для яких Q приймає значення q (тобто | Aq |= =0) , то помітити цього потомка в залежності від того, на якій частині А виконується S ( аналогічно до 4);

в) інакше запустити ID3( Aq, S, ʋ\ {Q} ) і добавити його результат, як піддерево з коренем у цьому потомку.

ПРИКЛАД 2.

Нехай нам потрібно дізнатися про те чи відбудеться гра в теніс у цю суботу. За результатами попередніх досліджень було сформовано наступне відношення. У відношенні маємо перелік шести днів за яких гра відбувалась чи ні. Атрибут Погода приймає значення {Сонячно; Похмуро; Дощ}, атрибут Вологість --{Висока; Нормальна; Низька}, атрибут Вітер -- {Сильний; Слабкий} атрибут Гра в теніс називається атрибутом прийняття рішень і приймає значення Так або Ні.

Для спрощення у цьому прикладі пропонується тільки початкове відношення та кінцеве дерево.

Таблиця 2.3 Приклад таблиці прийняття рішень

День

Погода

Вологість

Вітер

Гра в теніс

D1

Сонячно

Висока

Слабкий

Ні

D2

Сонячно

Висока

Сильний

Ні

D3

Похмуро

Висока

Слабкий

Так

D4

Дощ

Висока

Слабкий

Так

D5

Дощ

Нормальна

Слабкий

Так

D6

Дощ

Нормальна

Сильний

Ні

Найпростіша структура дерева рішень прийме вигляд як на Рис.2.4:

Рис.2.4 Дерево прийняття рішення

Крім цього, в процесі побудови дерева рішень на основі таблиці прийняття рішень великих розмірів, яка містить реальні дані, виникає проблема суперечливості цих даних. При виконанні алгоритму побудови дерева рішень (наприклад, ID3) ця проблема призводить до того, що для формування листка дерева рішень потрібно приймати спеціальне рішення, виходячи із специфіки задачі. Тому було розроблено серію алгоритмів для попередньої обробки відношень. Фактично їх суть зводиться до підготовки матриці до побудови дерева рішень.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]