
- •Н.Н. Апраушева элементарный курс
- •Решений
- •Научное издание
- •Н.С. Гумилев
- •Глава 1. Элементы теории эвристических решений (эр)
- •§1. Строгие и эвристические методы пр
- •§2. Общая структура процесса принятия решения
- •§3. Центральная проблема теории эр
- •§4. Краткая история развития эр
- •Глава 2. Принятие решений в распознавании образов
- •§ 1. Понятие о распознавании образов, классификации
- •§2. Условия применимости математических
- •§3. Критерий оптимальной классификации
- •§4. Основные условия, гарантирующие оптимальную
- •§ 5. Алгоритмы классификации в режиме с обучением
- •§6. Классификация как задача проверки
- •§7. Алгоритмы автоматической классификации (ак)
- •§8. Предварительное обнаружение классов
- •Глава 3. Общая математическая теория принятия решений
- •§1. Принятие решений в условиях неопределенности
- •§ 2. Принятие решений в условиях риска
- •§3. Принятие решений при проведении эксперимента
- •§4. Принятие решений при проведении
- •Ррпт – резко различающиеся плотности точек
- •Содержание
§ 5. Алгоритмы классификации в режиме с обучением
Задача классификации в режиме с обучением уже была сформулирована: имеется k классов
k
,
(2.8)
описанных своими основными признаками, новый объект Xнужно отнести к одному из имеющихся классов. Дадим описание нескольких алгоритмов, по которым проводится классификация в этом режиме.
5.1. Алгоритм классификации по расстоянию
Для простоты и наглядности рассмотрим случай p = 2, k = 2. Пусть классы1, 2 представлены своими обучающими выборками
(2.9)
n1
– число наблюдений класса1
, n2
– число наблюдений класса2.
Новое наблюдение X нужно отнести
только к одному классу1или2.
На рис. 2.5 представлена описанная
ситуация.
Зададим
на множестве
Хn
X(n)
=
расстояниеr(Xi
, Xj),
Xi ,
Xj
X(n)
, n=n1+n2,
и вычислим среднее расстояние от
испытуемой точкиX до всех
точек каждого класса:
,
.
Если имеем
r1 < r2 , (2.10 a)
то наблюдаемая точка Xотносится к классу1. Если
r2 < r1 , (2.10 b)
то точка Х относится к 2. Если
r2 = r1 , (2.11)
то точку Xможно отнести к любому из имеющихся классов. Уравнение (2.11) есть уравнение границы классов Г. Граница Г делит пространство признаковR на два подпространстваR1 иR2 , которые содержат классы,
,
.
Так что, если испытуемая точка Xпопадает в областьR1(R2), то естественно считать, что она принадлежит классу 1 (2).
Замечание. Если для испытуемой точки Y(рис. 2.5) имеет место одно из соотношений (2.10), (2.11) но значенияr1 и r2 очень велики, например, больше минимальногодиаметра классов d1 , d2
min(r1 , r2) min(d1 , d2),
то не следует относить ее к одному из данных классов [6]. В этом случае правильным является решение: точкаY представляет новый класс3 . Поэтому для принятия правильного решения по соотношениям (2.10), (2.11) вводится порог rпор для значенийr1 , r2 ,
min(r1
, r2)rпор,
Например, можно положить
rпор =min(d1 , d2), 0,5 < < 1.
5.2. Корреляционный алгоритм
Этот метод состоит в определении корреляции рассматриваемого объекта с каждым из эталонов, представляющих классы. Эталоны – векторы средних значений элементов каждого класса. Решающее правило: объект Xотносится к тому классу, для которого коэффициент корреляции наибольший.
Классы 1, 2 представлены своими обучающими выборками (2.9), изображенными на рис. 2.6.
Эталоны классов 1, 2 — их средние значения определяются по формулам:
Корреляция объектов–векторов определяется косинусом угла между ними. Косинус угла между векторами находится из их скалярного произведения:
Отсюда имеем:
(2.12)
Скалярное произведение векторов
и их модули выражаются через их координаты:
Вычислив
по формулам (2.12), переходят к их сравнению.
Если
,
то элементX относится к
классу1.
Если
,
то элементXотносится
к классу2
(рис. 2.6). Если
,
(2.13)
то элемент X можно отнести к любому из классов1,2. Уравнение (2.13) –– уравнение границы классов Г.
Решения, получаемые с помощью корреляционного метода, базируются на угловой близости точек X, μ1, μ2. Метод полезен, если каждый из углов1,2, охватывающий подмножества наблюдений из одного класса, мал по сравнению с углом между эталонами(рис. 2.6),
(2.14)
Но если хотя бы одно из соотношений (2.14) не выполняется, то корреляционный метод не применим, он может дать большие ошибки, так как часть точек из класса 1 будет отнесена к классу2(рис.2.7).
Корреляционный метод часто применяют при распознании букв машинописного текста.
5.3. Регрессионный алгоритм
Регрессионный алгоритм (РА) применяется в случае, когда обучающие выборки классов (2.9) сосредоточены вдоль некоторых линий, называемых линиями регрессий (рис. 2.3, 2.8). Если линии регрессий являются прямыми (рис. 2.8), то зависимость между координатами каждой точки из одного класса (1 и 2) можно представить в виде:
где i
–– отклонение ординаты точкиот ординаты точки
.
Аналогично,j
–– отклонение ординаты точки
от ординаты точки
(рис. 2.8).
Каждая прямая
регрессии (,
)
проходит через средние точки
соответствующего класса. Из уравнений
(2.15) имеем:
Рис. 2.8
Неизвестные коэффициенты a, b иc, dв системах (2.16 ) определяются методом наименьших квадратов (МНК), минимизирующим сумму квадратов отклонений от каждой прямой регрессии[4, 8, 9].
Для системы уравнений (2.16а) имеем
.
(2.17 a)
Для удобства введем обозначение:
.
(2.17 b)
Минимум функции
находится из необходимых условий ее
экстремума:
,
.
Продифференцировав
функцию
поa иb и приравняв
полученные выражения частных производных
к нулю, после простых алгебраических
операций получим систему нормальных
уравнений:
(2.18)
Из системы (2.18) легко находятся оценки параметров a иb, являющиеся функциями наблюдений:
,
.
Доказано,
что при значениях a иb,
определяемых из уравнений (2.18), функция
(2.17) имеет минимум[7].
Аналогично методом наименьших квадратов из уравнений (2.16b) оцениваются значения параметров с, d.
Таким образом, получаются уравнения линий регрессий, описывающих классы 1 и2,
,
Поиск уравнения
регрессии для каждого класса относится
к процессу обучения. Чтобы отнести
испытуемое наблюдение Xк одному из имеющихся классов, необходимо
вычислить расстояния от точкиX
до линий регрессийи
,r(x,
),
r(x,
)
соответственно.
Если r(X,)
< r(X,
),
то Х относится к классу1.
Если
r(X,)
< r(X,
),
то X относится к классу2.
Если
r(X,)
= r(X,
),
(2.19)
то X
можно отнести к любому из классов1,2.
Уравнение (2.19) – уравнение границы
классов1,2,
уравнение биссектрисуглов между прямыми
и
.
Если линии регрессии
и
параллельны, то границей
классов1,2
является прямая Г, параллельная
прямым
,
и равноудаленная от них.
Регрессионный алгоритм не применим, если один из классов попадает в точку пересечения линий регрессии (рис. 2.9). В этом случае РА дает большую ошибку, значительная часть точек класса2по правилу классификации относится к классу1.
При
в случае линейной регрессии имеем
систему уравнений:
,
i = 1, 2, …, n1
.
Оценки для неизвестных параметров a1, a2, …, ap находятся методом наименьших квадратов.
Одна из основных задач регрессионного анализа – задание уравнений регрессий
,
,
наиболее согласующегося с исходными наблюдениями (2.9). Проверка такой согласованности проводится по статистическим критериям [8].
В научно-практических исследованиях широко используются такие виды регрессий, как полиномиальные, экспоненциальные, логарифмические, тригонометрические и др.