Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kurs_TPR.doc
Скачиваний:
13
Добавлен:
27.09.2019
Размер:
2.06 Mб
Скачать

§ 5. Алгоритмы классификации в режиме с обучением

Задача классификации в режиме с обучением уже была сформулирована: имеется k классов

k , (2.8)

описанных своими основными признаками, новый объект X нужно отнести к одному из имеющихся классов. Дадим описание нескольких алгоритмов, по которым проводится классификация в этом режиме.

5.1. Алгоритм классификации по расстоянию

Для простоты и наглядности рассмотрим случай p = 2, k = 2. Пусть классы 1, 2 представлены своими обучающими выборками

(2.9)

n 1 – число наблюдений класса 1 , n2 – число наблюдений класса 2. Новое наблюдение X нужно отнести только к одному классу 1 или 2. На

рис. 2.5 представлена описанная ситуация.

Зададим на множестве Хn X(n) = расстояние r(Xi , Xj), Xi , Xj X(n) , n=n1+n2, и вычислим среднее расстояние от испытуемой точки X до всех точек каждого класса:

,

.

Если имеем

r1 < r2 , (2.10 a)

то наблюдаемая точка X относится к классу 1. Если

r2 < r1 , (2.10 b)

то точка Х относится к 2. Если

r2 = r1 , (2.11)

то точку X можно отнести к любому из имеющихся классов. Уравнение (2.11) есть уравнение границы классов Г. Граница Г делит пространство признаков R на два подпространства R1 и R2 , которые содержат классы,

, .

Так что, если испытуемая точка X попадает в область R1 (R2), то естественно считать, что она принадлежит классу 1 (2).

Замечание. Если для испытуемой точки Y (рис. 2.5) имеет место одно из соотношений (2.10), (2.11) но значения r1 и r2 очень велики, например больше минимального диаметра классов d1 , d2

min(r1 , r2)  min(d1 , d2),

то не следует относить ее к одному из данных классов [6]. В этом случае правильным является решение: точка Y представляет новый класс 3 . Поэтому для принятия правильного решения по соотношениям (2.10), (2.11) вводится порог rпор для значений r1 , r2 ,

min(r1 , r2) rпор ,

Например, можно положить

rпор =   min(d1 , d2), 0,5 <  < 1.

5.2. Корреляционный алгоритм

Этот метод состоит в определении корреляции рассматриваемого объекта с каждым из эталонов, представляющих классы. Эталоны – векторы средних значений элементов каждого класса. Решающее правило: объект X относится к тому классу, для которого коэффициент корреляции наибольший.

Классы 1,2 представлены своими обучающими выборками (2.9), изображенными на рис. 2.6.

Эталоны классов 1,2 — их средние значения определяются по формулам

Корреляция объектов–векторов определяется косинусом угла между ними. Косинус угла между векторами находится из их скалярного произведения:

Отсюда имеем

(2.12)

Скалярное произведение векторов

и их модули выражаются через их координаты:

Вычислив по формулам (2.12), переходят к их сравнению. Если , то элемент X относится к классу 1. Если , то элемент X относится к классу 2 (рис. 2.6). Если

, (2.13)

то элемент X можно отнести к любому из классов 1, 2. Уравне –

ние (2.13) - уравнение границы классов Г.

Решения, получаемые с помощью корреляционного метода, базируются на угловой близости точек X, μ1, μ2. Метод полезен, если каждый из углов 1, 2, охватывающий подмножества наблюдений из одного класса, мал по сравнению с углом между эталонами  (рис. 2.6),

(2.14)

Но если хотя бы одно из соотношений (2.14) не выполняется, то корреляционный метод неприменим, он может дать большие ошибки, так как часть точек из класса 1 будет отнесена к классу 2 (рис.2.7).

Корреляционный метод часто применяют при распознании букв машинописного текста.

5.3. Регрессионный алгоритм

Регрессионный алгоритм (РА) применяется в случае, когда обучающие выборки классов (2.9) сосредоточены вдоль некоторых линий, называемых линиями регрессий (рис. 2.3, 2.8). Если линии регрессий являются прямыми (рис. 2.8), то зависимость между координатами каждой точки из одного класса (1 и 2) можно представить в виде

где i –– отклонение ординаты точки от ординаты точки . Аналогично j –– отклонение ординаты точки от ординаты точки (рис. 2.8).

Каждая прямая регрессии ( , ) проходит через средние точки соответствующего класса. Из уравнений (2.15) имеем

Рис. 2.8

Неизвестные коэффициенты a, b и c, d в системах (2.16) определяются методом наименьших квадратов (МНК), минимизирующим сумму квадратов отклонений от каждой прямой регрессии [4, 8, 9].

Для системы уравнений (2.16a) имеем

. (2.17a)

Для удобства введем обозначение:

. (2.17б)

Минимум функции находится из необходимых условий ее экстремума:

, .

Продифференцировав функцию по a и b и приравняв полученные выражения частных производных к нулю, после простых алгебраических операций получим систему нормальных уравнений

(2.18)

Из системы (2.18) легко находятся оценки параметров a и b, являющиеся функциями наблюдений:

, .

Доказано, что при значениях a и b, определяемых из уравнений (2.18), функция (2.17) имеет минимум [7].

Аналогично методом наименьших квадратов из уравнений (2.16б) оцениваются значения параметров с, d.

Таким образом, получаются уравнения линий регрессий, описывающих классы 1 и 2,

,

Поиск уравнения регрессии для каждого класса относится к процессу обучения. Чтобы отнести испытуемое наблюдение X к одному из имеющихся классов, необходимо вычислить расстояния от точки X до линий регрессий и , r(x, ), r(x, ) соответственно.

Если r(X, ) < r(X, ), то Х относится к классу 1.

Если r(X, ) < r(X, ), то X относится к классу 2.

Если

r(X, ) = r(X, ), (2.19)

то X можно отнести к любому из классов 1, 2. Уравнение (2.19) – уравнение границы классов 1, 2, уравнение биссектрис углов между прямыми и . Если линии регрессии и параллельны, то границей классов 1, 2 является прямая Г, параллельная прямым , и равноудаленная от них.

Регрессионный алгоритм неприменим, если один из классов попадает в точку пересечения линий регрессии (рис. 2.9). В этом случае РА дает большую ошибку, значительная часть точек класса 2 по правилу классификации относится к классу 1.

При в случае линейной регрессии имеем систему уравнений:

, i = 1, 2, …, n1 .

Оценки для неизвестных параметров a1, a2, …, ap находятся методом наименьших квадратов.

Одна из основных задач регрессионного анализа – задание уравнения регрессии

, ,

наиболее согласующегося с исходными наблюдениями (2.9). Проверка такой согласованности проводится по статистическим критериям [8].

В научно-практических исследованиях широко используются такие виды регрессий, как полиномиальные, экспоненциальные, логарифмические, тригонометрические и др.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]