Классификация и регрессия

1. Постановка задачи

В задаче классификации и регрессии требуется определить значение зависимой переменной объекта на основании значений других переменных, характеризующих данный объект. Формально задачу классификации и регрессии, но описать следующим образом. Имеется множество объектов:

I={i1,i2,…,i_j_,..,i_n},

где i_j- исследуемый объект. Примером таких объектов может быть информация о проведении игр при разных погодных условиях (табл. 5.1).


Наблюдение	Температура	Влажность	Ветер	Игра
Солнце	Жарко	Высокая	Нет	Нет
Солнце	Жарко	Высокая	Есть	Нет
Облачность	Жарко	Высокая	Нет	Да
Дождь	Норма	Высокая	Нет	Да
Дождь	Холодно	Норма	Нет	Да
Дождь	Холодно	Норма	Есть	Нет
Облачность	Холодно	Норма	Есть	Да
Солнце	Норма	Высокая	Нет	Нет
Солнце	Холодно	Норма	Нет	Да
Дождь	Норма	Норма	Нет	Да

Солнце	Норма	Норма	Есть	Да
Облачность	Норма	Высокая	Есть	Да
Облачность	Жарко	Норма	Нет	Да
Дождь	Норма	Высокая	Есть	Нет

Каждый объект характеризуется набором переменных:

I_j= {x_1,x₂, ...,x_h,...,x_m_,y},

где x_h — независимые переменные, значения которых известны и на основании которых определяется значение зависимой переменной у. В данном примере независимыми переменными являются: наблюдение, температура, влажность и ветер. Зависимой переменной является игра.

В Data Mining часто набор независимых переменных обозначают в виде вектора:

Х={x_1,x₂, ...,x_h,...,x_m},

Каждая переменная x₁ может принимать значения из некоторого множества:

С_h={c_h1,c_.h2,…}

Если значениями переменной являются элементы конечного множества, то говорят, что она имеет категориальный тип. Например, переменная наблюдение принимает значения на множестве значений {солнце, облачность, дождь}.

Если множество значений С = {с_ь с₂, ..., с_г,..., с_к} переменной у - конечное, то задача называется задачей классификации. Если переменная у принимает значение на множестве действительных чисел R, то задача называется задачей регрессии.

Представление результатов

1. Правила классификации

Несмотря на то, что был назван способ определения значения зависимой переменной функцией классификации или регрессии, он необязательно может быть выражен математической функцией. Существуют следующие основные виды представления таких способов: классификационные правила, деревья решений и математические функции.

Классификационные правила состоят из двух частей: условия и заключения:

если (условие) то (заключение).

Условием является проверка одной или нескольких независимых переменных. Проверки нескольких переменных могут быть объединены с помощью операций "и", "или" и "не". Заключением является значение зависимой переменной или распределение ее вероятности по классам. Например:

если (наблюдение = солнце и температура = жарко) то (игра = нет);

если (наблюдение = облачность и температура = холодно) то (игра = да).

Основным достоинством правил является легкость их восприятия и запись на естественном языке. Другое преимущество - относительная их независимость. В набор правил легко добавить новое без необходимости изменять уже существующие. Относительность независимости правил связана с возможной их противоречивостью друг другу. Если переменные, характеризующие некоторый объект, удовлетворяют условным частям правил с разными заключениями, то возникает неопределенность со значением его зависимой переменной. Например, имеются правила:

если (наблюдение = солнце) то (игра = нет);

если (наблюдение = облачность и температура = холодно) то (игра = да).

В них объекты, удовлетворяющие условиям из второго правила, удовлетворяют и условиям первого правила. Однако вывод делается разный. Другими словами, в соответствии с этими правилами при одинаковых обстоятельствах получены противоречивые указания, что неприемлемо.

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 299 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в папке Лекции по СППР

#
23.03.201689.6 Кб79Карта_Кохонена.doc
#
23.03.201610.75 Кб114Лекция 1.doc
#
23.03.201674.75 Кб91Лекция 2.doc
#
23.03.2016354.82 Кб109Лекция 3.doc
#
23.03.2016968.7 Кб148Лекция 5.doc
#
23.03.20162.2 Mб190Лекция 6-7.doc
#
23.03.20163.38 Mб90Приложение.doc
#
23.03.2016236.03 Кб72Рабочая программа СПР.doc
#
23.03.20161.39 Mб87рахманова а.и.pptx
#
23.03.201663.2 Кб71Системы_поддержки_принятия_решений.htm