10. Деревья решений. Определение, назначение.

Деревья решений – один из методов автоматического анализа данных и принятия решений в бизнесе.

Деревья решений – это способ представления правил в иерархической, последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение.

Под правилом понимается логическая конструкция, представленная в виде "если ... то ...".

Область применения деревья решений в настоящее время широка, но все задачи, решаемые этим аппаратом могут быть объединены в следующие три класса:

Описание данных: Деревья решений позволяют хранить информацию о данных в компактной форме, вместо них мы можем хранить дерево решений, которое содержит точное описание объектов.
Классификация: Деревья решений отлично справляются с задачами классификации, т.е. отнесения объектов к одному из заранее известных классов. Целевая переменная должна иметь дискретные значения.
Регрессия: Если целевая переменная имеет непрерывные значения, деревья решений позволяют установить зависимость целевой переменной от независимых(входных) переменных. Например, к этому классу относятся задачи численногопрогнозирования(предсказания значений целевой переменной).

В узлах дерева, не являвшимися листьями, находятся атрибуты, по которым различаются ситуации.

В листьях – значения целевой функции.

На ребрах – значения атрибута, из которого исходит это ребро.

ДР строятся следующим образом:

1. Выбирается атрибут A и помещается в корень. Для всех значений этого атрибута строим ребра.

2. Выбирается значение целевой функции для измерения значений ребра.

ДР не позволяет извлечь какие-либо закономерности из данных, оно позволяет только наиболее эффективно принимать решения и предсказывать значения целевых атрибутов.

Цель: построить самое короткое дерево, таким образом, чтобы в его корне стоял наиболее важный атрибут, позволяющий наиболее эффективную классификацию.

Достоинства:

быстрый процесс обучения;
генерация правил в областях, где эксперту трудно формализовать свои знания;
извлечение правил на естественном языке;
интуитивно понятная классификационная модель;
высокая точность прогноза, сопоставимая с другими методами (статистика, нейронные сети);
построение непараметрических моделей.

В силу этих и многих других причин, методология деревьев решений является важным инструментом в работе каждого специалиста, занимающегося анализом данных, вне зависимости от того практик он или теоретик.

Деревья решений являются прекрасным инструментом в системах поддержки принятия решений, интеллектуального анализа данных (data mining). В состав многих пакетов, предназначенных для интеллектуального анализа данных, уже включены методы построения деревьев решений. В областях, где высока цена ошибки, они послужат отличным подспорьем аналитика или руководителя

Деревья решений успешно применяются для решения практических задач в следующих областях:

Банковское дело. Оценка кредитоспособности клиентов банка при выдаче кредитов.
Промышленность. Контроль за качеством продукции (выявление дефектов), испытания без разрушений (например проверка качества сварки) и т.д.
Медицина. Диагностика различных заболеваний.
Молекулярная биология. Анализ строения аминокислот.

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 2910 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.03.20169.58 Mб115Rusakov.docx
#
01.03.20163.73 Mб18RUSLAN2.doc
#
20.11.2019121.31 Кб26Seryeznaya_shpora_po_Istorii.docx
#
01.03.2016354.13 Кб365SET Shumakov ISPR.docx
#
22.12.2018126.39 Кб18Shema_upr_f (2).docx
#
27.09.2019807.77 Кб62shp.docx
#
28.09.2019620.54 Кб60Shpargalka_k_ekzamenu_po_khimii_2_semestr.doc
#
14.04.201963.09 Кб9shpora-po-miket1.docx
#
01.03.2016577.54 Кб19shpora.doc
#
25.09.2019302.59 Кб25shporaa_ история.doc
#
14.04.201958.13 Кб6Shpora_AVMiS.docx