Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
нир.docx
Скачиваний:
36
Добавлен:
20.03.2016
Размер:
158.28 Кб
Скачать

Глава 1 Обзор основных методов распознавания объектов в цифровых системах безопасности

Для реализации функций обнаружения и различения объектов вторжения в системах безопасности широко используются устройства, основанные на различных физических принципах формирования тревожных сигналов. Высокая надёжность принятия решения о вторжении достигается логическим объединением сигналов, поступающих с различных средств обнаружения, образующих рубежи охраны. Наиболее эффективны системы, в которых для формирования сигналов используются независимые (ортогональные) свойства нарушителя – оптические и акустические сигналы, инфракрасный и сейсмический или радиоволновый сигналы. Для повышения достоверности принятия решения о вторжении на охраняемый объект применяются различные методы комбинирования сигналов от рубежей охраны. Объединение сигналов по принципу совпадения (схема "И") позволяет снизить вероятность ложной тревоги Рл. т, а объявление тревоги по сигналу любого из рубежей (схема "ИЛИ") позволяет снизить вероятность пропуска нарушителей Рпр.

При количестве рубежей больше двух возможны более сложные комбинации, одновременно снижающие и вероятность ложной тревоги и вероятность пропуска нарушителей.

Теория обнаружения, различения и оценивания сигналов разрабатывалась применительно к радиолокации. Развитие методов обнаружения позволяет с единых позиций рассмотреть не только радиолокацию, но и оптическую локацию (телевидение, инфракрасную технику).

Вместе с тем, проектирование систем обнаружения этих классов имеет отличия не только в длине волны, но и в способе формирования информационного сигнала:

    • радиолокационные системы обнаружения в большинстве случаев являются активными;

  • системы обнаружения инфракрасного диапазона используют как активный, так и пассивный режимы обнаружения;

  • телевизионные системы видимого диапазона длин волн занимают промежуточное положение, так как в видимом диапазоне собственное излучение тел при обычных (не слишком высоких) температурах отсутствует и для наблюдения необходима подсветка – естественная (солнечная) или искусственная.

К основным принципам теории обнаружения относятся:

  • принцип оптимальности: наилучшее правило принятия решения должно обеспечивать экстремум качества по принятому критерию, исходя из априорной информации о сигналах и помехах, а также из ограничений на доступные решения;

  • принцип накопления: суммирование сигналов по пространству, времени и длине волны – единственный и достаточный метод борьбы с шумом (некоррелированной помехой);

  • принцип компенсации: вычитание оценки фона – единственный и достаточный метод борьбы с коррелированной помехой.

Эти принципы лежат в основе проектирования как систем обнаружения вообще, так и систем видеонаблюдения в частности. Например, на основе принципа оптимальности осуществляется согласование размеров элемента разложения матрицы ПЗС с кружком рассеяния объектива для обеспечения максимума отношения сигнал/шум при ограниченной освещённости. Принцип накопления реализуется интегрированием фотоэлектронов в пределах времени кадра (от 20 мс и менее), площади элемента разложения (примерно, от 4×4 до 20×20 мкм) и интервала длин волн, к которым чувствительна матрица ПЗС (от 0.4 до 1 мкм). Принцип компенсации находит своё воплощение в телевизионных детекторах движения, использующих в своей работе различные модификации алгоритма вычитания из текущего изображения оценки фона по предыдущему ТВ-кадру.

Особенностью применения теории решений при разработке ТВ-систем обеспечения безопасности является трудность формализации характеристик наблюдаемых объектов и этапов принятия решений. Априорная неопределённость изображений при вторжении нарушителей весьма высока, хотя в этом случае на экране монитора появляются образы, имеющие вполне определённый смысл. Разнообразие нештатных ситуаций (не считая разнообразия постоянного во времени фона – ограждений и сооружений охраняемого объекта) не может быть сведено к небольшому набору классифицируемых образов с простыми параметрами неопределённости (масштаб, положение, поворот). Поэтому при построении систем видеоконтроля не часто удаётся воспользоваться готовыми решениями теории распознавания образов. Редким исключением является применение телевизионно-компьютерных систем определения номерных знаков автомобиля. В этих системах, благодаря применению нейроподобных алгоритмов распознавания ограниченного числа цифр и букв, удаётся достичь вероятности правильного распознавания до 98% при захвате телевизионного кадра с номерным знаком, занимающим существенную часть поля зрения телекамеры.

Процесс принятия решения оператором ТВ-системы включает в себя четыре взаимосвязанных этапа: обнаружение, классификацию, различение и опознавание. Под обнаружением подразумевается выделение объекта на фоне и отнесение его к классам объектов, представляющим потенциальный интерес. Классификация означает отнесение обнаруженного объекта к одному из широких классов (человек, транспортное средство). Различение означает отнесение наблюдаемого объекта к более узкому подклассу (грузовой автомобиль, легковой автомобиль). Наконец, на стадии опознавания можно установить тип объекта (марка автомобиля).

Априорная неопределённость изображений нарушителей приводит к необходимости установления связи параметров ТВ-системы с вероятностными характеристиками опознавания обнаруживаемых объектов.

Детальные исследования этих связей показали, что они зависят от множества факторов:

  • характеристики обнаруживаемого объекта (отношение сигнал/шум, контраст, угловой размер, градиент яркости на краях объекта, сложность контура, место на экране монитора, форма, ориентация, перспективные искажения, скорость движения, яркость изображения);

  • характеристики сюжета (яркость фона, интенсивность шума фона, скорость движения фона);

  • характеристики наблюдателя (тренированность, мотивировка действий, утомление, получение предварительного инструктажа, возраст, индивидуальные особенности, рабочая нагрузка, метод поиска, число наблюдателей и способ связи между ними, периферическая острота зрения);

  • тактические требования (площадь зоны поиска, допустимое время поиска с момента появления объекта, освещённость в помещении охраны и т. д.).

Далее рассматривается роль главных из этих факторов – отношения сигнал/шум и размера опознаваемого объекта на экране монитора.

Под отношением сигнал/шум понимается отношение сигнала перепада между наблюдаемым объектом и фоном к среднеквадратичному значению шума.

Реальное отношение сигнал/шум для обнаруживаемого объекта меньше максимального при данной освещённости на величину контраста объекта относительно фона.

Размер объекта на экране монитора может измеряться и в сантиметрах, и в радианах, но для анализа вероятности опознавания объекта следует применить другую меру – число элементов разложения. Роль числа элементов в ТВ-изображении была подчёркнута основоположником электронного телевидения В. К. Зворыкиным, который сформулировал принцип достаточности точности при передаче видеоинформации. Согласно этому принципу, число элементов должно быть и не слишком большим, и не слишком малым. При чрезмерно большом числе элементов и ограниченной площади фотоприёмника изображение "тонет" в фотонном шуме; при слишком малом числе элементов резко сокращается число различимых образов.

В случае различения известного заранее числа сигналов число элементов разложения, приходящееся на изображение объекта, должно быть не менее числа классифицируемых объектов. При уменьшении числа элементов разложения (строк) на размер объекта необратимо теряется информация об объекте. Даже, казалось бы, простейшую задачу различения одноэлементного объекта от двухэлементного невозможно решить безошибочно. Это связано с неизбежными искажениями формы сигналов при накоплении и дискретизации оптического сигнала в матричном фотоприёмнике. Из-за таких искажений при уменьшении числа строк на объект вероятность опознавания объекта уменьшается. Конкретное значение уменьшения вероятности правильной классификации изображений при недостаточном отношении сигнал/шум и числе элементов разложения зависит от числа классифицируемых изображений и их отличий друг от друга. Примеры таких зависимостей приведены на рисунке 1.

Рисунок 1.1 – Вероятность различения классов автомобиля (а) и правильного определения типа автомобиля (б) в функции отношения сигнал/шум для различного числа строк n, укладывающихся по высоте изображения

Более высокая вероятность опознавания на рисунке 1, связана с тем, что увеличение разнообразия в наборе сигналов сопровождается увеличением различия между сигналами изображений классифицируемых объектов. Рост достоверности опознавания является следствием того, что ошибка классификации убывает с увеличением разностного сигнала от изображений двух объектов при их одинаковых масштабах и наилучшем совмещении. При плохих условиях наблюдения отличить джип от лимузина значительно легче, чем один тип джипа от другого. Вместе с тем, большая априорная неопределённость в характере нештатной ситуации не снижает требований к разрешающей способности ТВ-системы, а увеличивает их. Это связано с тем, что часто оказывается необходимым не только грубо оценить сигнал, например классифицировать как "автомобиль", но и определить марку автомобиля, его номер, число пассажиров, их особые приметы. Сложность определения требуемой чёткости связана также с зависимостью формы отклика дискретных фотоприёмников от сдвига оптического изображения. Этот эффект приводит к тому, что даже если мелкие детали изображения в одном из кадров различаются, то в другом (при сдвиге сигнала) они могут не различаться.

Априорная неопределённость в числе разрешаемых образов и неинвариантность (shift variance) отклика фотоприёмников к сдвигу изображения приводят к отсутствию универсального требования к чёткости ТВ-изображения.

В результате проектировщики ТВ-систем безопасности используют различные эмпирические правила, например критерии Джонсона, связывающие вероятность правильного решения с числом строк, приходящихся на размер объекта. Критерии Джонсона, усреднённые по всем классам объектов, имеют значения, приведённые в таблице 1.

Таблица 1

Решаемая задача

Число строк, необходимых для обеспечения 50%-й вероятности правильного решения

Обнаружение

2

Определение ориентации

3

Различение

6

Опознавание

14

Сторонникам применения критериев Джонсона свойственно стремление распространить результаты нечётко поставленных экспериментов с ограниченным набором изображений на все случаи жизни. Однако практика проектирования и эксплуатации ТВ-систем безопасности показала потребность корректировки этих критериев.

В задаче различения сигналов всегда требуется большая чёткость, чем при обнаружении. Необходимое увеличение чёткости зависит от степени неопределённости в наблюдаемом изображении. Так, если необходимо опознать личность известного оператору человека, то, по рекомендациям МВД Великобритании, его изображение должно занимать 50% растра; идентификация индивидуальных признаков неизвестной личности требует увеличения размера изображения человека до 120% растра (рисунок 1.2)

Рисунок 1.2 – Рекомендуемые размеры изображений при обнаружении и классификации

Подавляющее большинство применяемых в настоящее время охранных ТВ-систем не являются оптимальными с точки зрения теории решений, поскольку поле зрения и параметры разложения обычно задаются независимо. Число строк в растре определяется стандартом, в котором работает аппаратура. Поле зрения, как правило, выбирается из условия перекрытия определённого участка территории охраняемого объекта.

Оптимальный выбор поля зрения (место установки телекамеры и фокусное расстояние объектива) должен осуществляться, исходя из обеспечения чёткости, гарантирующей заданную вероятность правильного решения. На практике такое требование приводит к увеличению числа телекамер в контролируемой зоне по сравнению с предусмотренным в исходных требованиях на систему. Дополнительным средством увеличения качества принимаемых решений является использование телекамер, снабжённых объективами с переменным фокусным расстоянием. При этом проектировщика, руководствующегося принципом "дадим заказчику не то, что он просит, а то, что ему нужно", подстерегает опасность спроектировать систему с завышенными техническими характеристиками [3].

Рассмотрим реализацию некоторых методов распознавания объектов в среде MATLAB.

Подходы к компьютеризации распознавания образов можно разделить на две основные категории: методы, основанные на теории решений, и структурный анализ. Первая категория имеет дело с образами, которые описываются количественными дескрипторами, такими как длина, площадь, текстура и многими другими дескрипторами, рассмотренны­ми. Вторая категория методов ориентирована на образы, которые можно хорошо представить символьной информацией, например, символьными строка­ми, и которые можно описать свойствами и взаимоотношениями между этими символами. В теории распознавания образов ключевое место занимает принцип «обучаемости» при исследовании выборки объектов. Да­лее рассматриваются и иллюстрируются методы обучения, применяемые как в теории решений, так и в структурном анализе.

Под образом подразумевается упорядоченная совокупность дескрипторов, подоб­ных рассмотренным. В литературе по распознаванию образов дескрип­торы принято также называть признаками. Классом образов называется сово­купность образов, которые обладают некоторыми общими свойствами. Классы образов будут обозначаться символами гдеW — это число клас­сов. Машинное распознавание образов предполагает отнесение образов к тем или иным классам, что должно совершаться автоматически или с минимальным вме­шательством человека.

В практических задачах распространены два типа упорядоченного представ­ления признаков: в виде векторов (количественное описание) и в виде символь­ных строк (структурное описание). Образы, представление которых основано на векторах признаков, обозначаются жирными строчными буквами, например, х, у, z и они имеют вид векторов-столбцов размера n * 1

где каждая компонентапредставляет дескриптор с номеромi, а п — это общее число дескрипторов, ассоциированных с образом. Иногда в вычислениях бывает удобно представлять образы в виде векторов-строк размера 1*n, которые можно получить простым транспонированием векторов-столбцов: .

Природа компонент вектора образа х зависит от подхода, применяемого к описанию самого физического объекта. Рассмотрим, к примеру, задачу автома­тической классификации буквенно-цифровых символов. Дескрипторы, пригод­ные для метода теории решений, могут включать такие величины, как двумер­ные инварианты моментов или множество коэффициентов Фурье, описывающих внешнюю границу символов.

В некоторых приложениях характеристики образов лучше всего описывать с помощью структурных связей. Например, распознавание отпечатков пальцев основано на взаимных связях отпечатка, которые называются мелкими дета­лями. Вместе с их относительными размерами и расположением эти признаки играют роль примитивов, которые описывают свойства линий отпечатка, такие как обрывы, ветвления, слияния и несвязные сегменты. Задачи распознавания такого типа, в которых принадлежность образов определенному классу опреде­ляется не только данными количественных измерений признаков, но также и пространственным соотношениями между признаками, обычно лучше решаются с использованием структурных методов.

Последующий материал представляет собой реализацию на базе MATLAB некоторых методов распознавания образов. Основной принцип распо­знавания, особенно в приложениях теории решений, состоит в сравнении обра­зов с помощью измерения расстояния между векторами образов.

Рассмотрим векторизацию вычисления расстояний. Без использования этой оптимизирующей возможности вычисления пришлось бы вы­полнять на основе операторов цикла for или while.

Евклидовым расстоянием между двумя n-мерными векторами х и у (в виде столбцов или строк) называется число

.

Это выражение представляет собой норму разности двух векторов, поэтому его можно вычислять в MATLAB с помощью функции norm:

d = norm(x - у),

где х и у — это векторы, соответствующие х и у из предыдущей формулы для d(x, у). Часто бывает нужно вычислить множество евклидовых расстояний от вектора у до каждого вектора некоторого семейства, состоящего из р векторов размерности п, которые записаны в виде строк матрицы X размера р*п. Чтобы размерности были правильно согласованы, вектор у должен иметь размер 1*п. Тогда расстояние от каждого элемента X до у будет записано в вектор p*l

d = sqrt(sum(abs(X - repmat(у, р, 1)).~2, 2)),

где d(i) есть евклидово расстояние от у до i-ой строки матрицы X [т. е., до X(i, : )]. Обращаем ваше внимание на употребление функции repmat, которая р раз дублирует вектор-строку у и записывает результат в виде матрицы р*п для приведения ее к размерам матрицы X. Значение 2 во втором аргументе функ­ции sum означает, что следует вести вычисления вдоль второй размерности, т. е. суммировать элементы по горизонтальной размерности.

Пусть имеется два семейства векторов X и Y размерами р*п и q*n соот­ветственно. Матрицу, в которую записаны все расстояния между всеми парами строк этих семейств, можно вычислить, применив оператор

D = sqrt(sum(abs(repmat(permute(X, [13 2]), [1 q 1])...

- repmat(permute(Y, [3 1 2]), [p1 1])).~2, 3)),

где D(i, j) — это евклидово расстояние между i-ым и j-ым векторами этих семейств, т.е. между X(i, :) и Y(j, :).

Синтаксис функции permute в предыдущем выражении имеет вид

В = permute(A, order).

Эта функция перестраивает размерности массива А в соответствии с элементами вектора order (элементы в этом векторе должны быть однозначными). Напри­мер, если А является двумерным массивом, то выражение permute (А, [2 1] ) по­просту переставляет строки и столбца матрицы А, что эквивалентно присвоению матрице В результата транспонирования матрицы А. Если длина вектора order больше, чем число размерностей А, то MATLAB обрабатывает компоненты век­тора слева направо, пока не будут использованы все элементы. В предыдущем выражении для D команда permute (X, [1 3 2]) порождает массивы в третьем измерении каждый из которых является столбцом (размерности 1) из X. Посколь­ку в X имеется всего п столбцов, то создается п таких массивов, причем каждый из них имеет размерность р*1. Следовательно, команда permute (X, [1 3 2]) создает массив размерности р*1*n. Аналогично, команда permute (Y, [3 1 2]) строит массив размерности 1*q*n. Наконец, команда

repmat(permute(X, [1 3 2]), [1 q 1])

повторяет q раз каждый из п столбцов массива, порожденного командой permute, и в результате образуется массив размерности p*q*n. Аналогичным образом можно прокомментировать другие команды, в которые вовлечена матрица Y.

На самом деле, рассмотренная формула для D является векторизацией выра­жений, которые можно записать иначе с помощью «медленных» циклов for или while.

Вычислим взвешенное расстояние от вектора у до среднего вектора семей­ства mх, причем вес расстояния задается матрицей, обратной ковариационной матрице Сх этого семейства. Такая метрика, называемая расстоянием Махалан­обиса, определяется выражением

.

Операция взятия обратной матрицы является самой вычислительно затратной при реализации расстояния Махаланобиса. Эту действие можно существенно ускорить с помощью операции правого матричного деления (/), которая вво­дилась.

Пусть X обозначает семейство из р векторов размерности п, и пусть Y — это семейство из q векторов, причем в обоих матрицах векторы располагают­ся по строкам. Следующая М-функция вычисляет расстояние Махаланобиса от каждого вектора Y до

Вызов функции real в последней строке программы (приложение 1) сделан для подавления «численного шума. Если известно, что данные всегда вещественны, то для упрощения кода функции можно опустить вызовы подфункций real и conj.

Распознавание с помощью теории решений

Подход к распознаванию образов на основе методов теории решений строится с по­мощью решающих (или дискриминантных) функций. Пусть обозначаетn-мерный вектор признаков объекта. Имея W классов образов задачу распознавания в теории решений можно сформулировать следующим образом. Требуется найтиW решающих функций , которые обладают следующим свойством: если образ х принадлежит классу, то

.

Другими словами, неизвестный образ х относят к i-му классу, если при подста­новке х во все дискриминантные функции наибольшее значение имеет величи­на . Неоднозначные решения разрешаются произвольным образом.

Разделяющей поверхностью между классами и называется множество значений х, для которых или, что то же самое, множество векто­ров х, для которых

.

В теории решений принято описывать разделяющую поверхность между двумя классами единой функцией . Тогда > 0 для образов класса<0 для образов из класса .

Структурное распознавание

Техника структурного распознавания базируется на общем представлении инте­ресующих объектов в виде символьных строк, деревьев или графов определении набора дескрипторов и правил распознавания на основе выбранного представ­ления объектов. Ключевое различие между подходами теории решений и струк­турными методами заключается в том, что в теории решений количественные де­скрипторы представляются в виде числовых векторов. В отличие от этого, струк­турный метод принципиально работает лишь с информацией, представленной в символьном виде. Например, пусть границы объектов в некотором приложении представлены ломаными линиями минимальной длины. Подход теории решений мог быть основан на построении векторов, элементами которых являются вели­чины внутренних углов многоугольников, а структурный анализ может исходить из задания символов для ряда величин углов, после чего строятся строки таких символов для описания образа в целом.

Символьные строки являются самыми распространенным элементами пред­ставления объектов, которые используются в структурном распознавании, поэто­му мы сфокусируем наше внимание в этом параграфе именно на этом представ­лении данных. Как скоро станет ясно, MATLAB имеет весьма солидный набор специализированных функций для обращения со строками символов[1].

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]