
- •Раздел II. Распознавание образов Введение
- •Глава 1. Общие основы теории распознавания образов
- •1.1. Основные понятия теории распознавания образов
- •1.2. Основные задачи, возникающие при разработке систем распознавания образов
- •1.3. Основные принципы построения систем распознавания
- •1. Принцип перечисления членов класса
- •2. Принцип общности свойств
- •3. Принцип кластеризации
- •1. Эвристические методы
- •2. Математические методы
- •3. Лингвистические (синтаксические) методы
- •Глава 2. Решающие функции
- •2.1. Общие понятия
- •2.2. Линейные решающие функции
- •Глава 3. Классификаторы образов с самообучением
- •3.1. Классификация образов с помощью функций расстояния
- •3.2. Классификация образов по критерию минимума расстояния
- •1. Случай единственности эталона
- •2. Множественность эталонов
- •3.3. Обобщение принципов классификации по минимуму расстояния
- •Глава 4. Распознавание образов с помощью кластеров
- •4.1. Основные понятия кластерного анализа
- •4.2. Расстояние между образами и мера близости
- •4.3. Расстояние между кластерами
- •4.4. Функционалы качества разбиения
- •4.5. Иерархические процедуры
- •4.6. Эвристические методы и алгоритмы
- •4.7. Алгоритм k – внутригрупповых средних
- •Глава 5. Обучаемые классификаторы образов. Детерминистский подход
- •5.1. Классификация образов с помощью персептронного подхода
- •5.2. Принцип подкрепления - наказания
- •5.3. Сходимость принципа подкрепления - наказания
- •5.4. Обобщение алгоритма персептрона для классификации нескольких классов
- •Глава 6. Распознавание образов на основании метода потенциальных функций
- •6.1. Получение решающих функций
- •6 .2. Выбор потенциальных функций
- •6.3. Сходимость алгоритмов обучения
- •6.4. Обобщение алгоритма метода потенциальных функций на несколько классов
- •Глава 7. Структурное распознавание образов Введение
- •7.1. Синтаксический подход к распознаванию образов
- •7.2. Система синтаксического распознавания образов
- •7.3. Методы предварительной обработки
- •1. Кодирование и аппроксимация
- •2. Фильтрация, восстановление и улучшение
- •3. Сглаживание
- •4. Сегментация
- •7.4. Языки описания образов
- •1. Выбор непроизводных элементов
- •2 Выделение непроизводных элементов на границах
- •Задание для самостоятельной работы
- •7.5. Языки и порождающие грамматики
- •7.6. Обработка изображений
- •1. Классы изображений
- •2. Ввод изображений
- •3. Преобразование изображений
- •Литература
1.3. Основные принципы построения систем распознавания
В основе идеи синтеза систем автоматического распознавания лежат способы, с помощью которых описываются и разделяются классы образов.
Когда класс характеризуется перечнем входящих в него членов, построение системы распознавания может быть основано на принципе принадлежности к этому перечню.
Когда класс характеризуется некоторыми общими свойствами, присущими всем его членам, построение системы распознавания может быть основано на принципе общности свойств.
Когда при рассмотрении класса обнаруживается тенденция к образованию кластеров в пространстве образов, построение системы распознавания может основываться на принципе кластеризации.
Под кластером понимают группу образов, образующих в пространстве описания компактную область или компактное множество. Под компактным множеством, например, изображений будем понимать множество точек в пространстве изображений со следующими свойствами:
всегда возможен плавный переход от одного изображения к другому внутри данного образа так, что все промежуточные изображения будут восприниматься как изображения этого же образа;
при малой деформации изображений в любом направлении они не выходят за пределы данного образа.
Рассмотрим эти принципы подробнее.
1. Принцип перечисления членов класса
Задание класса перечислением образов, входящих в его состав, предполагает реализацию процесса автоматического распознавания образов посредством сравнения с эталоном. Множество образов, принадлежащих одному классу, запоминается системой распознавания. При предъявлении системе незнакомых (новых) образов она последовательно сравнивает их с хранящимися в ее памяти. Система распознавания относит новый образ к тому классу, к которому принадлежал находящийся в её памяти образ, совпавший с новым. Если, например, в память системы распознавания введены литеры различных наборных шрифтов, то подход, основанный на перечислении членов класса, позволяет распознать соответствующие буквы, но только в тех случаях, когда их изображения не искажены шумом, связанным с размазыванием или плохим нанесением краски. Несмотря на то, что этот метод несложный, однако он позволяет строить недорогие системы распознавания, которые в отдельных прикладных областях вполне справляются со своими задачами. Метод перечисления классов работает удовлетворительно, если выборка образов близка к идеальной (классы состоят из большого числа элементов, и каждый элемент описывается значениями большого числа признаков).
2. Принцип общности свойств
.
Задание класса с помощью свойств, общих для всех входящих в его состав членов, предусматривает реализацию процесса автоматического распознавания путем выделения подобных признаков и работы с ними. Основное допущение в этом методе заключается в том, что образы, принадлежащие одному и тому же классу, обладают рядом общих свойств или признаков, отражающих подобие таких образов. Эти общие свойства можно, в частности, ввести в память системы распознавания. Когда системе предъявляется неклассифицированный образ, то выделяется набор описывающих его признаков, причем последние иногда кодируются, и затем они сравниваются с признаками, заложенными в память системы распознавания. В таком случае, последняя зачислит предъявленный для распознавания образ в класс, характеризующийся системой признаков, подобным признакам этого образа. Итак, при использовании данного метода основная задача заключается в выделении ряда общих свойств по конечной выборке образов, принадлежность которых искомому классу известна. Вполне очевидно, что эта концепция распознавания во многих отношениях превосходит распознавание по принципу перечисления членов класса. Для запоминания признаков класса требуется значительно меньше памяти, чем для хранения всех объектов входящих в класс. Поскольку признаки, характеризующие класс в целом, обладают инвариантностью, принцип сопоставления признаков допускает вариацию характеристик отдельных образов. Процедура сопоставления с эталоном, с другой стороны, не допускает существенных вариаций характеристик отдельных образов. Если все признаки, определяющие класс, можно найти по имеющейся выборке образов, то процесс распознавания сводится просто к сопоставлению по признакам. Исключительно трудно, если не невозможно вообще, найти для некоторого класса полный набор различающих признаков. Следовательно, обращение к этому принципу распознавания часто связано с необходимостью развития методов выбора признаков, являющихся оптимальными.