- •Раздел II. Распознавание образов Введение
- •Глава 1. Общие основы теории распознавания образов
- •1.1. Основные понятия теории распознавания образов
- •1.2. Основные задачи, возникающие при разработке систем распознавания образов
- •1.3. Основные принципы построения систем распознавания
- •1. Принцип перечисления членов класса
- •2. Принцип общности свойств
- •3. Принцип кластеризации
- •1. Эвристические методы
- •2. Математические методы
- •3. Лингвистические (синтаксические) методы
- •Глава 2. Решающие функции
- •2.1. Общие понятия
- •2.2. Линейные решающие функции
- •Глава 3. Классификаторы образов с самообучением
- •3.1. Классификация образов с помощью функций расстояния
- •3.2. Классификация образов по критерию минимума расстояния
- •1. Случай единственности эталона
- •2. Множественность эталонов
- •3.3. Обобщение принципов классификации по минимуму расстояния
- •Глава 4. Распознавание образов с помощью кластеров
- •4.1. Основные понятия кластерного анализа
- •4.2. Расстояние между образами и мера близости
- •4.3. Расстояние между кластерами
- •4.4. Функционалы качества разбиения
- •4.5. Иерархические процедуры
- •4.6. Эвристические методы и алгоритмы
- •4.7. Алгоритм k – внутригрупповых средних
- •Глава 5. Обучаемые классификаторы образов. Детерминистский подход
- •5.1. Классификация образов с помощью персептронного подхода
- •5.2. Принцип подкрепления - наказания
- •5.3. Сходимость принципа подкрепления - наказания
- •5.4. Обобщение алгоритма персептрона для классификации нескольких классов
- •Глава 6. Распознавание образов на основании метода потенциальных функций
- •6.1. Получение решающих функций
- •6 .2. Выбор потенциальных функций
- •6.3. Сходимость алгоритмов обучения
- •6.4. Обобщение алгоритма метода потенциальных функций на несколько классов
- •Глава 7. Структурное распознавание образов Введение
- •7.1. Синтаксический подход к распознаванию образов
- •7.2. Система синтаксического распознавания образов
- •7.3. Методы предварительной обработки
- •1. Кодирование и аппроксимация
- •2. Фильтрация, восстановление и улучшение
- •3. Сглаживание
- •4. Сегментация
- •7.4. Языки описания образов
- •1. Выбор непроизводных элементов
- •2 Выделение непроизводных элементов на границах
- •Задание для самостоятельной работы
- •7.5. Языки и порождающие грамматики
- •7.6. Обработка изображений
- •1. Классы изображений
- •2. Ввод изображений
- •3. Преобразование изображений
- •Литература
3.2. Классификация образов по критерию минимума расстояния
Классификация образов с помощью функций расстояния - одна из первых идей автоматического распознавания образов. Этот простой метод классификации оказывается весьма эффективным инструментом при решении таких задач, в которых классы характеризуются степенью изменчивости, ограниченной в разумных пределах. Начнем с рассмотрения классов, которые можно охарактеризовать, выбрав по одному эталонному образу из класса. Затем полученные для этого случая результаты распространяются на случай нескольких эталонов. И, наконец, рассматриваются общие свойства этого метода классификации и определяются границы его классификационных возможностей.
1. Случай единственности эталона
В некоторых случаях образы любого из рассматриваемых классов проявляют тенденцию к тесной группировке вокруг некоторого образа, являющегося типичным или репрезентативным для соответствующего класса. Подобные ситуации возникают, если изменчивость образов невелика, а помехи легко поддаются учету. Типичным примером этого служит задача считывания банковских чеков с помощью компьютера. Символы, помещаемые на чеках, сильно стилизированы и обычно наносятся магнитной печатной краской с тем, чтобы упростить процесс снятия показаний. В ситуациях, подобных этой, векторы измерений (образы) в каждом классе будут почти идентичны, поскольку одинаковые символы на всех практически используемых чеках идентичны. В таких условиях классификаторы, действующие по принципу минимального расстояния, могут оказаться чрезвычайно эффективным средством решения задач классификации.
Рассмотрим
М
классов,
пусть эти классы допускают представление
с помощью эталонных образов
.
Евклидово
расстояние между произвольным вектором
образа х
и i-м
эталоном определяется следующим
выражением:
.
(3.1)
Классификатор,
построенный по принципу минимума
расстояния, вычисляет расстояние,
отделяющее неклассифицированный образ
х
от эталона каждого класса,
и зачисляет этот образ в класс, оказавшийся
ближайшим к нему. Другими
словами, образ х
приписывается к классу
,
если
условие
выполняется
при всех
.
Случаи равенства расстояний
разрешаются
произвольным образом.
Формуле
(3.1) можно придать более удобный вид.
Возведение всех членов
в квадрат дает
(3.2)
Выбор
минимального значения
эквивалентен выбору минимального
,
поскольку все расстояния величины
неотрицательные. Формула (3 2), однако
показывает, что выбор минимального
значения
эквивалентен
выбору
максимального значения разности
,
поскольку при
вычислении
любых
,
i
= 1,2,...М,
член
х'х
не
зависит от значения i.
Следовательно, решающие функции можно
определять как
,
i
= 1,2,...М,
(3.3)
где образ х относится к классу , если условие справедливо для всех .
Отметим,
что
- линейная функция, т.е. если
,
j=1,2,...п
-
компоненты вектора
,
причем
,
j=1,2,…,n,
(3.4)
то (3.3) можно представить в обычной линейной форме
,
i=1,2,…
M
(3.5)
где
.
Рис.3.3. Граница, разделяющая два класса, каждый из которых определяется
одним эталоном
На
рис. 3.3 изображена разделяющая граница
для примера с двумя классами,
каждый из которых задавался единственным
эталоном. Линейная разделяющая
поверхность, обеспечивающая разделение
всех пар эталонных точек
и
,
является гиперплоскостью, которая
представляет собой геометрическое
место точек, равноудаленных от этих
двух эталонных точек. Таким
образом, классификаторы, основанные на
принципе минимального
расстояния, представляют собой частный
случай линейного классификатора,
разделяющие границы которого обладают
указанным свойством.
Поскольку классификатор, основанный
на принципе минимального
расстояния, классифицирует образы,
исходя из наиболее полного
совпадения образа с эталонами
соответствующих классов, этот подход
называется корреляцией
или
сопоставлением
с кластером [2].
