Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Распознавание образов.doc
Скачиваний:
8
Добавлен:
01.05.2025
Размер:
2.78 Mб
Скачать

3.2. Классификация образов по критерию минимума расстояния

Классификация образов с помощью функций расстояния - одна из первых идей автоматического распознавания образов. Этот простой метод классификации оказывается весьма эффективным инструментом при решении таких задач, в которых классы характеризуются степенью изменчивости, ограниченной в разумных пределах. Начнем с рассмотрения классов, которые можно охарактеризовать, выбрав по одному эталонному образу из класса. Затем полученные для этого случая результаты распространяются на случай нескольких эталонов. И, наконец, рассматриваются общие свойства этого метода классификации и определяются границы его классификационных возможностей.

1. Случай единственности эталона

В некоторых случаях образы любого из рассматриваемых классов проявляют тенденцию к тесной группировке вокруг некоторого образа, являющегося типичным или репрезентативным для соответствующего класса. Подобные ситуации возникают, если изменчивость образов невелика, а помехи легко поддаются учету. Типичным примером этого служит задача считывания банковских чеков с помощью компьютера. Символы, помещаемые на чеках, сильно стилизированы и обычно наносятся магнитной печатной краской с тем, чтобы упростить процесс снятия показаний. В ситуациях, подобных этой, векторы измерений (образы) в каждом классе будут почти идентичны, поскольку одинаковые символы на всех практически используемых чеках идентичны. В таких условиях классификаторы, действующие по принципу минимального расстояния, могут оказаться чрезвычайно эффективным средством решения задач классификации.

Рассмотрим М классов, пусть эти классы допускают представление с помощью эталонных образов . Евклидово расстояние между произвольным вектором образа х и i-м эталоном определяется следующим выражением:

. (3.1)

Классификатор, построенный по принципу минимума расстояния, вычисляет расстояние, отделяющее неклассифицированный образ х от эталона каждого класса, и зачисляет этот образ в класс, оказавшийся ближайшим к нему. Другими словами, образ х приписывается к классу , если условие выполняется при всех . Случаи равенства расстояний разрешаются произвольным образом. Формуле (3.1) можно придать более удобный вид. Возведение всех членов в квадрат дает

(3.2)

Выбор минимального значения эквивалентен выбору минимального , поскольку все расстояния величины неотрицательные. Формула (3 2), однако показывает, что выбор минимального значения эквивалентен выбору максимального значения разности , поскольку при вычислении любых , i = 1,2,...М, член х'х не зависит от значения i. Следовательно, решающие функции можно определять как

, i = 1,2,...М, (3.3)

где образ х относится к классу , если условие справедливо для всех .

Отметим, что - линейная функция, т.е. если , j=1,2,...п - компоненты вектора , причем , j=1,2,…,n,

(3.4)

то (3.3) можно представить в обычной линейной форме

, i=1,2,… M (3.5)

где .

Рис.3.3. Граница, разделяющая два класса, каждый из которых определяется

одним эталоном

На рис. 3.3 изображена разделяющая граница для примера с двумя классами, каждый из которых задавался единственным эталоном. Линейная разделяющая поверхность, обеспечивающая разделение всех пар эталонных точек и , является гиперплоскостью, которая представляет собой геометрическое место точек, равноудаленных от этих двух эталонных точек. Таким образом, классификаторы, основанные на принципе минимального расстояния, представляют собой частный случай линейного классификатора, разделяющие границы которого обладают указанным свойством. Поскольку классификатор, основанный на принципе минимального расстояния, классифицирует образы, исходя из наиболее полного совпадения образа с эталонами соответствующих классов, этот подход называется корреляцией или сопоставлением с кластером [2].