5. Методы построения математических функций

5.1. Общий вид

Методы, рассмотренные для правил и деревьев решений, работают наиболее естественно с категориальными переменными. Их можно адаптировать для работы с числовыми переменными, однако существуют методы, которые наиболее естественно работают с ними.

Рис. 5.5. Варианты линейного разделения обучающей выборки

Каждая из трех линий успешно разделяет все точки на два класса (представленные на рисунке квадратами и кружками), однако модель должна быть представлена одной функцией, которая наилучшим образом решит задачу для новых объектов.

В результате задачу построения функции классификации и регрессии можно формально описать как задачу выбора функции с минимальной степенью представлена одной функцией, которая наилучшим образом решит задачу для новых объектов.

В результате задачу построения функции классификации и регрессии можно формально описать как задачу выбора функции с минимальной степенью ошибки:

(5.1).

где F— множество всех возможных функций; c(y,f(x,))— функция потерь (loss function), в которой f(x,) значение зависимой переменной, найденное с помощью функции f для вектора х,принадлежит Т, а у — ее точное (известное) значение.

Следует отметить, что функция потерь принимает неотрицательные значения. Это означает, что невозможно получить "вознаграждение" за очень хорошее предсказание. Если выбранная функция потерь все же принимает отрицательные значения, то это легко исправить, вводя положительный сдвиг (возможно, с зависимостью от x). Такими же простыми средствами можно добиться нулевых потерь при абсолютно точном предсказании f(x)= y. Преимущества подобного ограничения функции потерь заключаются в том, что всегда известен минимум и известно, что он достижим (по крайней мере, для данной пары х, у).

Для задач классификации и регрессии такие функции имеют разный вид. Так, в случае бинарной классификации (принадлежности объекта к одному из двух классов; далее первый класс обозначается через+1, а второй класс через-1) простейшая функция потерь (называемая "0-1 loss" в англоязычной литературе) принимает значение 1 в случае неправильного предсказания и 0 в противном случае:

Здесь не учитывается ни тип ошибки f(х) =1 (у = -1 — положительная ошибка, f(х) =-1, у = 1 — отрицательная ошибка), ни ее величина.

Небольшое изменение позволяет учесть характер ошибки:

Здесь c'(x,y,fix)) может учитывать многие параметры классифицируемого объекта и характер ошибки.

Cитуация усложняется в случае классификации с числом классов более двух. Каждый тип ошибки классификации в общем случае вносит свой тип потерь таким образом, что получается матрица размера k *к (где к— число классов).

При оценке величин, принимающих вещественные значения, целесообразно использовать разность fix) - у для оценки качества классификации. Эта разность в случае регрессии имеет вполне определенный смысл (например, размер финансовых потерь при неправильной оценке стоимости финансового инструмента на рынке ценных бумаг). Учитывая условие независимости от положения, функция потерь будет иметь вид

c(x,y,fix)) = c'(fix)-y).

Чаще всего применяется минимизация квадратов разностей fix)-у. Этот вариант соответствует наличию аддитивного нормально распределенного шума, влияющего на результаты наблюдений у_i.

Соответственно, минимизируем:

(5.2),

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 2913 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в папке Лекции по СППР!

#
23.03.201689.6 Кб80Карта_Кохонена.doc
#
23.03.2016952.83 Кб122Лек1,2.doc
#
23.03.20162.2 Mб194Лек4-7.doc
#
23.03.2016315.9 Кб147Лекция 3.doc
#
23.03.20163.38 Mб111Приложение.doc
#
23.03.201663.2 Кб66Системы_поддержки_принятия_решений.htm