- •(Конспект лекций)
- •Содержание
- •3 Сосудистая оболочка; 4 радужная оболочка; 5 сетчатка;
- •6 Зрительный нерв; 7 центральная ямка (макула?); 8 хрусталик;
- •9 Слепое пятно; 10 зрачок; 11 стекловидное тело.
- •Квантование изображений
- •2.2. Типы представления изображений
- •2.3. Пиксели, разрешение, размер изображения
- •2.4. Цветовая глубина
- •2.5. Типы изображений
- •2.6. Размер растровых изображений
- •2.7. Форматы данных
- •Распространенные форматы файлов растровой графики
- •Файлы bmp
- •Файлы pcx
- •Файлы tiff
- •Файлы gif
- •Файлы png
- •Файлы jpeg
- •Распространенные форматы файлов растровой графики
- •3.1. Улучшение визуального качества изображений путем поэлементного преобразования
- •3.2. Линейное контрастирование изображения
- •3.3. Соляризация изображения
- •3.4. Препарирование изображения
- •3.5. Преобразование гистограмм, эквализация
- •3.6. Применение табличного метода при поэлементных преобразованиях изображений
- •4.1. Введение в Фурье-преобразование
- •4.2. Двумерное дискретное преобразование Фурье
- •5.1. Оптимальная линейная фильтрация. Уравнение Винера-Хопфа
- •5.2. Масочная (оконная) фильтрация изображений
- •Влияние размера выборки
- •5.3. Медианная фильтрация
- •Сравнение алгоритмов фильтрации
- •6.1. Сегментация изображений
- •6.1.1. Основные принципы сегментации изображений
- •6.1.2. Пороговое ограничение
- •6.1.3. Центроидное связывание
- •6.1.4. Алгоритмы слияния-расщепления
- •6.1.5. Алгоритмы разметки точек смешанного типа
- •6.1.6. Раскраска изображений
- •6.1.7. Сегментация путем выделения границ
- •6.1.8. Подавления шумов
- •6.2. Формализация задач распознавания изображений
- •6.2.1. Распознавание с помощью инвариантных признаков
- •6.2.2. Корреляционные алгоритмы распознавания
- •6.2.3. Распознавание с помощью нормализации
- •7.1. Преобразование изображений – преобразование Хока
- •7.2. Математическая морфология и обработка изображений
- •8.1. Основы цветного зрения
- •8.2. Цветовые модели
- •8.3. Основы цветной печати (цветоделение)
- •Вельтмандер п.В.Учебное пособие "Архитектуры графических систем. Машинная графика" Книга 2
- •Роуз а. Зрение человека и электронное зрение./ Перевод с английского под редакцией в.С.Вавилова. - м.: Мир, 1977
- •9.2. Методы сжатия изображений без потерь
- •9.3. Методы сжатия изображений с потерями
- •9.4. Фрактальное и вейвлетное сжатие изображений
- •9.1. Основы сжатия изображений
- •2N2n элементов, а во втором случае – нечетном косинусном преобразовании,
- •Матрицы Хаара
- •Преобразование Уолша – Адамара можно рассматривать как дискретный аналог непрерывного преобразования по базису, составленному из функций Уолша.
- •Результаты статистических исследований ортогональных преобразований
- •Информационное описание поиска и распознавания объектов
- •10.1. Управление процессами обработки и анализа изображений
- •10.2. Современная технология содержательного поиска в электронных коллекциях изображений
- •11. Обработка аудиоинформации
- •11.2. Цифровое представление звука Цифро-аналоговое и аналого-цифровое преобразование
- •11.3. Восприятие звука человеком
- •Клиппирование речевого сигнала
- •Избыточность речевого сигнала. Вокодер
- •Более сложные методы сжатия
- •Некоторые характеристики технологии mpeg
- •Алгоритм кодирования mpeg
- •Уровни mpeg
- •Intensity stereo coding – в высокочастотных подполосах кодируется суммированный из двух каналов сигнал вместо различных сигналов левого и правого каналов.
- •Технология mp3
- •TwinVq-кодирование
- •Сравнение звуковых форматов
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.5. Классификация речевых систем
- •12.6. РЕчевые технологии
- •Рекомендуемая литература Учебная и методическая литература
- •Другие виды литературы
6.2.1. Распознавание с помощью инвариантных признаков
Инвариантные отображения. Наиболее простые алгоритмы распознавания основаны на переходе из пространства изображений в пространство признаков. Распознавание с помощью признаков состоит в сравнении набора признаков, отвечающих входному изображению с набором признаков, отвечающих эталону. Сравнение происходит с помощью некоторой метрики в пространстве признаков. Для нескольких входных изображений соответствующими фиксированному эталону будут те изображения, набор признаков которых достаточно близок к эталонному набору. В этом случае приходится выбирать порог, зависящий от уровня помех. В идеальном случае отсутствия помех эквивалентным относительно действия группы изображениям должны отвечать совпадающие признаки или наборы признаков. Другими словами, признаки должны быть инвариантными относительно действия той группы геометрических и яркостных преобразований, которая обусловливает разницу между эталонами и входными изображениями.
Пусть Р – некоторое множество признаков. Отображение : M P из множества изображений называется инвариантным относительно действия группы G, если (gB) = (B) для любых элементов gG, BM, т. е. признаки изображений из одного класса эквивалентности совпадают.
Допустим, что инвариантное изображение
построено.
Выясним, можно ли им воспользоваться
для нахождения эталона, соответствующего
фиксированному входному изображению.
Пусть
– эталонные изображения, В – входное
изображение. В идеальном случае отсутствия
помех существует j
{1, ..., т}
такое, что
,
и тогда входному изображению соответствует
j-й эталон
.
Для того чтобы определить, будет ли
указанное равенство выполнено для
одного значения j
{1, ...,m}, необходимо
потребовать, чтобы признаки любых двух
эталонных изображений не совпадали:
при i
j. При наличии помех
номер искомого эталона определяется
как
,
где – метрика в признаковом множестве. Условие несовпадения признаков различных эталонов должно быть, естественно, выполнено, более того, распознавание будет надежным, если
(6.17)
при i j, где – порог, зависящий от уровня помех. При построении инвариантного отображения в конкретных условиях надо стремиться к тому, чтобы было как можно больше.
Гораздо сложнее воспользоваться инвариантным отображением для задачи нахождения входных изображений В(1) ..., В(p) эквивалентных некоторому фиксированному эталону В0. Можно ввести порог 1 и считать изображение B(s) эквивалентным В0 в том и только том случае, когда
(6.18)
Однако при этом можно только гарантировать, что изображения B(s) и В0 не эквивалентны, если условие (6.18) не выполнено. Трудность заключается в том, что признаки могут совпасть (тем более – быть близкими) и у неэквивалентных изображений. Пусть, например, G – группа смещений Gс, Р – множество действительных чисел, (В) – площадь области носителя изображения В. Равенство (В1) =(В2) не позволяет сделать вывод об эквивалентности В1 и B2. Очевидно, есть пары изображений одинаковой площади, которые неэквивалентны относительно действия группы Gc (скажем, треугольники и круги одинаковой площади).
Наличие таких ситуаций заставляет искать достаточные для распознавания инвариантные отображения, обладающие свойствами: если (В1) = (В2), то изображения B1 B2 М эквивалентны. Построение достаточных отображений возможно лишь при конечном множестве входных сигналов М или в случае, когда известно, что изображения из М имеют определенную априорно известную структуру (например, все они прямоугольники или прямоугольники с конечным числом дыр). Такие отображения определяются и группой преобразований G. Их построение является в ряде реальных ситуаций весьма сложной задачей.
Если же множество М состоит из произвольных изображений, а Р – конечномерное пространство, то достаточного инвариантного отображения вообще не существует. Такая ситуация возникает на практике в случае действия помех, когда близость признаков (В1) и (В2) свидетельствует лишь с некоторой вероятностью об эквивалентности изображений.
Можно сделать следующие выводы относительно использования инвариантных признаков:
1. Задача нахождения эталона, соответствующего фиксированному входному изображению, проще других задач распознавания (решения вопроса об эквивалентности двух входных изображжений; нахождения входных изображений, эквивалентных фиксированному эталону; разбиения набора входных изображений на классы эквивалентных изображений). Для ее решения достаточно выбрать самое простое пространство признаков (Р = R1) и инвариантное отображение : M P такое, что признаки эталонов существенно различаются.
2. Для решения более сложных задач распознавания необходимо построение инвариантного отображения в пространстве признаков, для которого признаки неэквивалентных изображений не могут совпадать. Для этого необходимо знать не только структуру группы преобразований, но и структуру множества входных изображений.
3. При априорно неизвестной структуре множества входных изображений использование инвариантных признаков эффективно для констатации факта неэквивалентности двух изображений. Утверждение об эквивалентности изображений при совпадении их признаков имеет место лишь с определенной вероятностью, зависящей от размерности признакового пространства.
Построение множества признаков и инвариантных отображений в реальных условиях должно удовлетворять ряду требований:
– множество признаков Р желательно иметь как можно более простым с точки зрения программной или аппаратной реализации, а также стоимости реализации;
– инвариантное отображение для известной структуры множества М должно быть достаточным;
– инвариантное отображение общего вида : M P, где Р = Rn при n > 1 (при неизвестной структуре множества М), строится с учетом конкретной группы преобразований и требований к вероятности правильного распознавания;
– выбор порогов в неравенствах (6.17) и (6.18) определяется уровнем и характером помех.
Существует ряд методов, позволяющих выбрать порог при априорно известном характере и уровне помех.
Анализ признаков. В зависимости от структуры признакового множества говорят о типах признаков. Основными типами признаков в робототехнике являются следующие:
метрические признаки, принимающие определенные значения на некотором числовом отрезке (площадь, средняя яркость и т. д.);
логические признаки, принимающие значения 1 или 0 (истинно или ложно данное утверждение об изображении); примерами таких утверждений служат: изображение имеет «дыры», контур изображения неодносвязен, форма изображения – прямоугольник, площадь области изображения не больше 10;
топологические признаки, как и логические, относятся к качественному характеру изображения, но могут принимать не два, а несколько значений; примерами являются число компонент связности контура изображения, число дыр в связной области объекта;
структурно-лингвистические признаки связаны с двумя близкими подходами к проблеме распознавания – структурным и лингвистическим. При структурном подходе изображение считается состоящим из частей. Частями изображения являются непроизводные элементы, которые в совокупности с правилами их соединения образуют специальный язык (грамматику). Анализ такой грамматики составляет суть лингвистического подхода к распознаванию. Грубо говоря, структурно-лингвистические методы, которые называют также синтаксическими, направлены на синтаксическую формализацию классов изображений: каждому классу соответствует грамматика с определенными правилами, каждому входному изображению – фраза. Изображение считается соответствующим данному классу, если отвечающая ему фраза удовлетворяет правилам грамматики для этого класса изображений.
Существует достаточно много публикаций, посвященных применению структурно-лингвистических признаков при распознавании образов.
На практике не всегда удается выделить простые непроизводные элементы универсального характера, поэтому структурные признаки еще мало распространены в СТЗ по сравнению с более простым способом распознавания с помощью метрических или логических признаков. В промышленной робототехнике использование структурно-лингвистического подхода часто сводится к определению логических признаков – проверке наличия заранее указанных человеком характерных фрагментов. В последнее время наметилась тенденция к практической ориентации методов структурного анализа в СТЗ роботов на основе построения проблемной среды.
Однако структурно-лингвистические методы эффективны при распознавании письменных знаков, чертежей, треков частиц в пузырьковых камерах и т. п. В последнее время они находят все большее применение при решении задач распознавания образов в медицине, геологии, других сферах.
Существуют также текстурные признаки, предназначенные для анализа сцен с периодически повторяющимися элементами, и статистические признаки, связанные с необходимостью многократных измерений ввиду их неточности, или вообще с неоднозначностью соответствия между наборами признаков и классами объектов, когда известны только плотности распределения вероятностей значений признаков для каждого класса.
Большие трудности представляет собой синтез признаков для распознавания изображений трехмерных объектов.
В задачах распознавания с помощью СТЗ роботов наиболее распространены метрические и логические признаки, часто эффективным оказывается их сочетание. Топологические и структурно-лингвистические признаки намного сложнее, кроме того, обычно их приходится применять в сочетании с признаками иного типа.
Метрические признаки можно разделить на признаки формы и признаки яркости. Простейшим признаком формы является площадь изображения – количество точек растра, находящихся в выделенной в результате сегментации области полезного изображения. Этот признак удобен своей инвариантностью к смещениям и поворотам. Он легко вычисляется и достаточно помехоустойчив. Однако такой признак не инвариантен к изменению масштаба, недостаточен для распознавания даже простых объектов промышленной робототехники (эталоны разных деталей могут иметь одинаковую площадь).
Другой метрический признак – длина контура изображения. Его вычисление гораздо сложнее и требует обычно предварительную реализацию процедуры сглаживания и скелетизации. Этот признак также устойчив к смещениям и поворотам и неустойчив к преобразованиям масштаба.
В ряде случаев набор из двух признаков (Р = R2) – площадь и длина контура – достаточен для распознавания изображений. Однако это заведомо невозможно в случае преобразований масштаба, к которым ни один из этих признаков не инвариантен. В случае возможных преобразований масштаба можно использовать отношение вида
,
где Е – область рассматриваемого изображения; S(Е) – ее площадь; l(Е) – длина контура. Очевидно, признак (E) инвариантен к смещениям, к поворотам и к изменениям масштаба.
Другие инвариантные признаки с помощью характеристик S(Е) и l(Е) получить невозможно. Инвариантны признаки
,
и т. д., однако они не являются независимыми по отношению к признаку (E): 1(E) = 2(E), 2(E) = ln(E).
Если распознавание с помощью признака (E) невозможно (т. е. существуют эталоны с областями Е'0, Е'’0 такие, что ( Е'0) = ( Е'’0), то в условиях метрических преобразований (смещения, масштаб, повороты) приходится пользоваться либо более сложными признаками формы, либо яркостными признаками.
Приведем несколько примеров признаков формы,независимых от признаков S(Е) и l(E).
Пусть точка А является геометрическим центром Е. Признаки r1 (А), r2 (А)– соответственно минимальное и максимальное расстояние от А до точек границы Е – являются инвариантными по отношению к смещениям и поворотам. Признак r(А) == r1 (А) / r1 (А) инвариантен и к изменениям масштаба.
Пусть В1 – ближайшая от геометрического центра А точка границы E, B2 – наиболее удаленная точка. Зафиксируем некоторое направление, например направление строк растра. Углы 1(Е) и 2(Е) между этим направлением и отрезками [A, В1] и [A, B2] соответственно являются признаками, инвариантными к смещению и к изменению масштаба. Признак (Е) = 1(Е) – 2(Е) инвариантен, кроме этого, и к поворотам.
3. Пусть дЕ – множество граничных
точек Е,
,
где – метрика
на растре. Метрику на растре можно ввести
соотношением
(c1, c2)
= |i1 –
i2| + |j1
– j2|,
где c1
= (i1, j1),
c2 = (i2,
j2) .
Признак d(E)
инвариантен к смещениям и поворотам.
Признак d (E)
/ l(Е) инвариантен
и к изменениям масштаба.
Список инвариантных признаков можно было бы продолжить. Отметим, что распознающая система, основанная на сравнении признаков S(E), l(Е), существенно проще системы, основанной на вычислении других указанных выше признаков.
Метрические признаки формы инвариантны к изменениям яркости. В случае отсутствия преобразований яркости или при известном законе яркостных преобразований можно использовать в качестве признаков яркостные характеристики полутоновых изображений. Основными яркостными признаками являются:
а) средняя яркость в области изображения Вср;
б) максимальная и минимальная яркость Bmах, Bmin;
в) модальное значение яркости Bmod;
г) разброс (дисперсия) значений яркости
Предположим, что возможны аддитивные изменения яркости вида В (i, j) В (i, j) + с. К таким изменениям из указанных признаков инвариантен только один – признак (В). Из других признаков легко составить инвариантные комбинации: Bmax – Bmin ; Bср – Bmod ; Bmax – Bmod.
Ни один из признаков 1 – 4 сам по себе не инвариантен к мультипликативным изменениям яркости В (i, j) kВ (i, j). Инвариантными комбинациями служат
;
;
;
и ряд других.
Несколько сложнее скомбинировать из признаков а – г характеристику, инвариантную к произвольным линейным преобразованиям яркости В (i, j) kВ (i, j) + с. Примером является инвариант
Заметим, что такой признак реально применим только к тем из изображений, для которых величина Bmax + Bmin – 2Bср не слишком мала (по модулю). Для однородных изображений и изображений, в области которых происходит линейное изменение яркости, это условие не выполняется.
При более сложных преобразованиях яркости указанные признаки неприменимы.
В условиях неизменной или линейно
меняющейся освещенности можно
комбинировать метрические признаки
формы и яркости. Укажем общую конструкцию
их построения для самого простого
случая, когда яркость эталонных
изображений не меняется. Рассмотрим
множество точек изображения с яркостью
в заданных пределах (от
до ). Обозначим
это множество Е,
для входного изображения и
для эталона. Ясно, что метрические
признаки формы Е,
и
должны быть близкими. Поэтому площадь,
длину контура и другие характеристики
Е,
можно использовать в качестве признаков
для распознавания. При этом, меняя
и , можно получить
самые разнообразные признаки. Например,
инвариантным к смещениям, поворотам и
изменениям масштаба является отношение
площадей Е1,1
и Е2,2
при любых парах 1,
1 и
2,
2.
Построение инвариантных признаков относительно геометрических преобразований, выходящих за рамки смещений, поворотов и изменений масштаба, существенно сложнее, например, в случае аффинных преобразований, допускающих, кроме названных трансформаций, косые сдвиги или неоднородные изменения масштаба. Их приходится строить в виде громоздких комбинаций моментов изображения. Некоторые авторы выделяют семь инвариантных признаков относительно аффинных преобразований, однако использующая их распознающая система является сложной. Еще хуже обстоит дело с проективными преобразованиями.
Рис. 6.16. Пример задачи распознавания:
а, б – эталонные и входные изображения; 1-4 – номер изображения
Можно сделать вывод, что при сложных геометрических преобразованиях использование метрических признаков мало эффективно (как и использование корреляционных процедур). Однако процедуру распознавания можно предварить нормализацией изображений, направленной на устранение «геометрического рассогласования» входного и эталонного изображений.
В ряде задач обработки промышленных изделий с помощью СТЗ роботов эффективны логические признаки, принимающие значение 1 в случае истинности различных утверждений типа:
а) контур области – связная область (нет «дыр»);
б) область изображения мало отличается от прямоугольника (треугольника, круга), т. е. разность площади области изображения и площади вписанного в нее прямоугольника (треугольника, круга) не превосходит (по модулю) некоторый порог;
в) площадь изображения превосходит (не превосходит) заданное число единиц.
Особенно эффективны логические признаки, инвариантные к произвольным непрерывным геометрическим трансформациям. Примером такого признака является признак а. Однако существует крайне малое число логических признаков с таким свойством, и, кроме того, их обычно недостает для распознавания. Например, в ситуации, когда ни один из эталонов не имеет «дыр», признак а для распознавания ничего не дает.
Достоинством признаков типа в является возможность их более простого вычисления (возможно, на аппаратном уровне), чем соответствующих им метрических признаков.
В ряде задач удается провести полное распознавание на основе одних логических признаков. При этом возникает вопрос о решении логических (булевых) уравнений.
Приведем пример задачи распознавания (рис. 6.16). Требуется решить задачу классификации – установить соответствие между тремя входными изображениями и четырьмя эталонами. Все изображения – бинарные, и известно, что отличие входных изображений от эталонных может быть обусловлено смещениями, поворотами и изменениями масштаба.
Заметим, что применение яркостных признаков для решения этой задачи невозможно (изображения бинарны). Корреляционные алгоритмы здесь неэффективны. Воспользуемся методом перехода в пространство признаков.
Прежде всего выявим возможность применения логических признаков, инвариантных к указанным преобразованиям. В эталонах 1, 3, 4 «дыры» отсутствуют, в эталоне 2 имеется «дыра». Определяя соответствующий логический признак для входных изображений, устанавливаем соответствие входного изображения 3 эталону 2. Для дальнейшего распознавания применим метрические признаки. Для полного решения задачи достаточно найти хотя бы один признак, различный для эталонов 1, 3, 4, и определить его для изображений 1 и 2.
Рассмотрим инвариантный признак
,
где S – площадь,
а l – периметр формы
эталона. Для эталона 4 его значение
существенно меньше, чем соответствующие
значения 1,
2 для
эталонов 1 и 3. Вычислив признак
для
изображений 1 и 2, получим значения
,
.
Возможны (логически) следующие варианты:
а) близко к 4 – тогда изображение 1 соответствует эталону 4;
б) близко к 4 – тогда изображение 2 соответствует эталону 4;
в) ни , ни не близки к 4 – тогда среди входных изображений нет такого, которое соответствует эталону 4.
В рассматриваемой ситуации реализуется вариант 6. Поэтому для полного решения задачи остается определить эталон, соответствующий входному изображению 1. Это может быть эталон либо 1, либо 3. Если значения 1 и 3 существенно различны, то задача решается сравнением чисел 1, 3, : если |1 - | = |3 - |, то изображению 1 соответствует эталон 1, в противном случае ему соответствует эталон 2. Однако эталоны 1 и 2 выбраны так, что признак принимает для них одно и то же значение (1 = 3). Поэтому для окончательного распознавания необходимо привлечь другой признак. Таким будет, например, определенный выше признак r(А) (А – геометрический центр).
Итак, задача классификации решается с помощью трех признаков – одного логического и двух метрических. Уже в этом относительно простом примере проявляются трудности алгоритмизации процесса распознавания, который с помощью зрения человека реализуется моментально.
Применение указанных метрических и логических признаков достаточно для решения большинства задач распознавания в робототехнике. Тем не менее, встречаются практические задачи, когда структура входного множества сигналов неизвестна, и высокие требования к надежности распознавания заставляют выбирать признаковое множество в виде пространства Rn при больших n (n > 3). Пусть 1, ..., m – различные классы эквивалентности относительно действия группы преобразований. Тогда признаки изображений из i можно рассматривать как множества точек M Rn. Указанные выше требования на набор признаков переформулируем в виде условий на множества М1,..., Мт: максимальный разброс точек в каждом множестве должен быть как можно меньше, в то время как расстояние между различными множествами должно быть как можно больше. Существуют общие подходы к построению признаков с такими требованиями, однако они требуют либо некоторой статистической информации, либо применимы только в случае конечности множеств Mi, i = 1, ..., т.
Эффективным аппаратом для распознавания по признакам является применение дискриминирующих функций. Пусть каждый объект характеризуется вектором признаков X = (x1,...,хт) в m-мерном пространстве. Если имеется М классов 1,..., M, то в соответствии с теорией принятия решений для распознавания требуется М дискриминирующих функций d1(X),..., dM(X), обладающих тем свойством, что для любого образа X из класса i имеют место неравенства di(X) > dj (X) для всех j = 1, ..., М, i j.
Обычно традиционно используемые признаки изображений малочувствительны к небольшим помехам. Однако в случае, когда эталон и входное (ему соответствующее) изображения могут различаться за счет геометрического преобразования, стандартные признаку становятся неинвариантными и могут принимать существенно различные значения для изображений одного и того же класса.
Необходимо сделать несколько замечаний, выделяющих ситуации, когда отсутствует необходимость применения специальных методов в случае геометрических преобразований. Во-первых, геометрические преобразования трансформируют только форму изображения, яркостные характеристики не меняются, поэтому для распознавания иногда оказывается достаточно таких признаков, как средняя яркость, мода яркости и т. д. (если только они – одни и те же для изображений одного класса, что далеко не всегда выполняется). Во-вторых, по отношению к геометрическим преобразованиям инвариантны ряд логических или топологических признаков типа наличия дыр, числа компонент связности контура. Однако часто эти признаки совпадают, если не для всех, то для части эталонных изображений, и тогда распознавание с их помощью невозможно.
Мы не останавливаемся на вероятностных системах распознавания, связанных с теорией статистических решений и особенно эффективных в задачах выделения и распознавания сигналов на фоне помех. Теория распознавания, основанная на принятии статистических решений, не приводит к ощутимым практическим результатам ее применения к проблеме распознавания изображений в условиях геометрических преобразований.
Задача распознавания изображений решается обычно после задачи сегментации, поскольку входной информацией для распознавания служат изображения отдельных объектов. Ошибки сегментации, естественно, затрудняют распознавание. Если в результате сегментации область одного из объектов была принята за фон, то этот объект уже не подлежит распознаванию, он будет «потерян». Менее опасны ошибки сегментации, при которых некоторая область фона воспринимается как объект. При последующем правильном распознавании такая ошибка будет обнаружена, поскольку ложному объекту не будет соответствовать ни один из эталонов.
Особенно опасны для распознавания ошибки сегментации посредством выделения границ, поскольку контурные характеристики (длина, число резких изгибов, направления в характерных точках) особенно чувствительны к ошибкам в выделении контуров. Кроме того, число признаков, основанных на контурных характеристиках и пригодных для распознавания, обычно невелико.
Для бинарных изображений, в отличие от полутоновых, нельзя использовать яркостные признаки. В условиях изменения яркости распознавание изображений по бинарным признакам всегда проще. Для определенных классов бинарных изображений существуют специальные методы распознавания. Важной задачей робототехники является распознавание дефектов изделий. В этом случае эталонами являются изображения объектов с тем или иным дефектом (эталон не формируется, а только задается своими признаками). Примером такой задачи является контроль качества печатных плат и микросхем.
