Деревья решений

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Поволжский государственный университет телекоммуникаций и информатики

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

17.01.2015 ИСиТ2015-01-16-17041.docx

Скачиваний:

Добавлен:

01.07.2025

Размер:

143.92 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 56 / 66

Деревья решений

Относится к методам автоматического анализа данных. Работы над алгоритмом начались в 50-х гг а первые серьезные труды в 60-х.

Дерево решений (ДР) – это способ представления правил в иерархической последовательной структуре, где каждому объекту соответствует единственный узел дающий решение.

Понятия из теории деревьев решений: Объект – пример, шаблон, наблюдение. Атрибут - признак, независимая переменная, св-во. Метка класса – зависимая (целевая) переменная. Узел - внутренний узел дерева или узел проверки. Лист – конечный узел дерева или узел решения. Проверка – условие в узле.

Область применения деревьев решений широка, но все задачи могут быть сведены к 3 классам: 1) Описание данных 2) Классификация 3) Регрессия.

Преимуществами использования ДР является: быстрый процесс обучения, извлечение правил на естественном языке, понятная классификационная модель, высокая точность прогноза. Недостатки: способность порождать очень ветвистые деревья.

***

Общий принцип построения ДР:

Пусть нам задано некоторое обучающее множество T, содержащее объекты, каждое из которых хранится “m” атрибутами, причем 1 из них указывает на принадлежность объекта к определённому классу. Пусть через {с₁,с₂,…,с_к} обозначены классы, тогда существует 3 ситуации:

Множество T содержит 1 или > примеров относящихся к первому классу с_ктогда дерево решений для T это лист определяющий класс с_к.
Множество Т не содержит ни одного примера, тогда это снова лист и класс ассоциированный с этим листом выбираются из другого множества отличного от Т, из множества ассоциированного с родителем этого листа.
Множество Т содержит пример относящийся к разным классам в этом случае множество Т разбивают на подмножества. Для этого выбирают один из признаков который имеет 2 и > отличных друг от друга значений o₁, o₂, …, o_n то есть таким образом Т разбивается на Т₁, Т₂, …, Т_n, где каждое подмножество Т_iсодержит все примеры имеющие значения o_iдля данного признака. Данный процесс рекурсивно повторяется до тех пор пока конечное множество не будет состоять из примеров относящихся к одному и тому же классу.

<<< < Предыдущая 1 2 3 4 56 / 66

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
10.06.2015177.66 Кб3516 лекция.doc
#
21.11.201848.51 Кб4216. Защитные механизмы операционных систем.docx
#
01.07.20251.07 Mб5168627.rtf
#
01.07.20251.82 Mб216_глава 16.Прикладное ТВ.doc
#
10.06.2015172.03 Кб3017 лекция.doc
#
01.07.2025143.92 Кб517.01.2015 ИСиТ2015-01-16-17041.docx
#
01.07.20251.48 Mб417_Глава17 Качественные показатели видеоканала.doc
#
10.06.2015173.57 Кб3418 лекция.doc
#
17.08.20191.86 Mб3718,25,28,11,21..doc
#
23.08.2019214.19 Кб5218675[1].rtf
#
01.07.20251.42 Mб318_Глава 18. Запись ТВ сигналов.doc