Скачиваний:
290
Добавлен:
04.03.2014
Размер:
4.85 Mб
Скачать

6.7. Распознавание изображений

Распознаванием называется процесс, при котором на основании набора признаков некоторого изображения объекта определяется его принадлежность к определенному классу. Следовательно, распознавание реализует функцию анализа визуального образа. В большинстве промышленных СТЗ предполагается, что этот образ формируется сегментированными объектами, т.е. объектами, разделенными друг относительно друга, или представляющими собой набор отдельных элементов. В противном случае, когда на сцене присутствует несколько неразделенных объектов, задача многократно усложняется, за исключением тех моментов, когда априорно речь идет об известных перекрывающихся объектах [ ]. Задачи такого уровня сложности требуют активного применения методов искусственного интеллекта и экспертных систем. Другое ограничение связано с тем, что распознавание должно проводиться в тех же условиях, что и формирование признаков объекта. Во всяком случае, различия в значениях признаков объекта, полученных на этапе обучения СТЗ и при распознавании, не должны быть слишком велики. Существенно, что такие же ограничения имеют место и при распознавании объектов человеком - если при распознавании признаки имеют другие численные значения, то объект может быть не опознан. (Характерным примером является детский рисунок).

Следует отметить, что хотя до настоящего времени не создано единого описания процесса распознавания изображений, существует большое количество частных методов. Обзор некоторых из них и обширная библиография приведены в [ ]. Условно все методы распознавания можно разделить на две группы: теоретические и структурные.

Теоретические методы распознавания строятся на основе сравнения текущего вектора признаков объекта с заданным с помощью некоторого решающего правила. Предполагается, что заданный вектор признаков формируется при обучении СТЗ. Рассмотрим объект, который описывается вектором признаков вида V = (v1, v2, … vn)T , где vi - i-ый признак объекта. Распознавание, как процедура отнесения заданного объекта к некоторому классу, представляет собой выбор из N классов объектов. Следовательно, при распознавании производится определение N функций p1(V), p2(V), … pN(V), таких, чтобы для каждого V*, принадлежащего классу oi выполняется неравенство вида:

pi (V*) > pj (V*), j = 1, 2, … N; ij.

Таким образом, неизвестный объект, обладающий вектором признаков V* распознается (относится к j-му классу), если при подстановке V* во все функции, pi (V*) будет иметь наибольшее значение [ ].

Строго говоря, определить реальное значение признаков объекта невозможно - они изменяются при каждом измерении. Поэтому задача распознавания ставится так: определить вероятность Pоб того, что объект принадлежит к заданному классу (Pоб А). Поскольку распознавание является вероятностной процедурой, возможны варианты, когда объект идентифицируется как принадлежащий другому классу Pлож (Pоб В) и как не принадлежащий никакому классу вообще Pпр (Pоб А, В). Вероятности Pлож и Pпр иногда называют вероятностью ложной тревоги и вероятностью пропуска цели соответственно.

Структурные методы распознавания основываются на теории формальных языков, базируемых на математических моделях грамматик. (Наиболее известной является модель американского лингвиста Н. Хомского). Идея состоит в построении описания сложного объ­екта в виде иерархической структуры более простых подобразов (образ описывается более простыми подобразами, каждый подобраз - еще более простыми подобразами и т. д).

При распознавании производится сравнение двух векторов признаков объекта - эталонного V и текущего V*. Для большинства практических задач в качестве компонент эталонного вектора используются геометрические параметры: площадь поверхности $, коэффициент формы Kф, число вершин или отверстий объекта k, комбинации центральных моментов вплоть до пятого pq, члены разложения в ряд Фурье Fj и т.п. Следовательно, эталонный вектор признаков объекта можно представить в виде: V = ($, Kф, k, pq, Fi), i = 1, … 4. Текущий вектор признаков V* формируется в результате ввода и предварительной обработки изображения: V* = ($*, Kф *, k1, pq, Fi). Тогда процедура распознавания сведется к определению расстояния V между данным изображением и эталоном: V = V* - V. Эффективность этой процедуры характеризуется величиной вектора V, и растет с уменьшением последней. Критерием эффективности алгоритма распознавания будем считать функцию: V min.

Соседние файлы в папке Учебник