
- •Глава 6. Системы технического зрения
- •6.1. Основные понятия
- •6.2. Основы формирования и передачи изображений
- •6.2.1. Понятие о видеосигнале
- •6.2.2. Принципы кодирования цвета
- •6.3. Датчики изображений
- •6.3.1. Видикон
- •6.3.2. Телекамеры на основе приборов с зарядовой связью
- •6.3.3. Фотодиодные матрицы
- •6.4. Устройства ввода и хранения изображений
- •6.4.1. Принципы хранения изображений
- •6.4.2. Кодирование видеосигнала
- •Форматы хранения изображений в стз
- •6.5.1. Структура графического файла
- •6.5.2. Сжатие изображений
- •6.5.2.1. Сжатие графических файлов
- •Ааааааааааааааа
- •6.5.2.2. Сжатие видеоизображений
- •6.6. Базовые алгоритмы обработки изображений
- •6.6.1. Предварительная обработка изображений
- •6.6.2. Сегментация
- •6.6.3. Кодирование изображений
- •6.6.4. Описание изображений
- •6.7. Распознавание изображений
- •6.7.1. Пример алгоритма распознавания
- •6.7.2. Особенности получения трехмерных изображений
- •Вопросы для самостоятельной подготовки
6.7.1. Пример алгоритма распознавания
Одно из наиболее интересных направлений распознавания образов связано с развитием систем контроля доступа. Эти системы позволяют ограничить круг пользователей, имеющих доступ как к физическим, так и виртуальным объектам, включая, например, узлы компьютерных систем.
Вкачестве примера рассмотрен алгоритм
распознавания лиц, разработанный фирмойITC,
США. Модель лица представляется в
виде набора некоторых элементов - масок.
Каждая маска характеризуется
геометрическими признаками - координатами
относительно выбранного центра
изображения. (Таким центром может быть
геометрический центр лица или середина
переносицы). В алгоритме анализируются
пять масок: правый и левый глаз, нос,
рот, правая и левая носогубная складка
и подбородок.
Элементы распознаваемого лица хранятся в виде «вырезанных» из оцифрованного растрового изображения областей прямоугольной формы. В зависимости от маски, размеры областей варьируются в пределах: от 1511 пикселей - для носогубных и до 3113 - для рта. Изображение квантуется на 256 градаций яркости.
Как и для большинства алгоритмов распознавания, программы такого рода состоят из двух частей:
предварительное обучение, на котором производится описание лица пользователя и занесение его признаков в базу данных (регистрация);
распознавание (выбор наиболее похожего изображения из базы данных).
Регистрация выполняется за несколько этапов. На первом производится традиционная предобработка регистрируемого изображения с целью удаления шумов и выделения контуров с помощью градиентного фильтра (например, фильтра Робертса размером 33). В результате, на изображении выделяется овал, определяющий форму лица. На следующем этапе осуществляется масштабирование изображения до заданного формата (составляющего 64 пикселя по горизонтали) и находится приблизительный центр лица.
Далее
производится поиск правого глаза на
изображении. С этой целью в выделенной
области осуществляется фильтрация
изображения локальным фильтром,
содержащим стандартную маску правого
глаза (рис. 6.56а). Вычисляется значение
суммы разностей приведенных яркостей
пикселей исходного изображения и
соответствующих им пикселей фильтра.
Приведенное значение яркости вычисляется
по формуле:
L = L0 (Lф/Lи),
где L0 - исходное значение яркости, Lф - суммарная яркость пикселей фильтра, Lи - суммарная яркость пикселей исходного изображения в текущей фильтруемой области.
Таким образом, результатом фильтрации является отклик :
здесь W и H - соответственно ширина и высота фильтра (маски), lij и lфij - значения яркости пикселя изображения и пикселя фильтра соответственно. Минимум соответствует левому верхнему углу области изображения размером WH, содержащему искомый элемент - правый глаз.
Далее в секторе изображения с центром в правом глазе и дугой 20 ищется левый глаз (рис. 6.56б), после чего осуществляется поворот изображения так, чтобы глаза оказались на одном уровне по горизонтали (рис. 6.57а). Изменение ориентации требует уточнения первоначального положения центра лица (как середины отрезка, соединяющего глаза), и координаты масок определяются относительно нового центра (рис. 6.57б).
На
следующих этапах выделяются области
остальных масок (рта, носа, подбородка
и носогубных складок) и осуществляется
их поиск по величине отклика.
Таким образом, в процессе регистрации,
формируется полная модель лица, которая
сохраняется в базе данных. Модель
описывается набором векторов rk,
связывающих центр лица с центрами
найденных элементов.
Алгоритм распознавания (верификации) близок к алгоритму регистрации. Текущее изображение лица сравнивается со всеми моделями из базы данных, в результате чего формируется некоторый функционал F, равный:
F = (rk* C1k; k C2k),
здесь rk* - вектора соединяющие центры k-ых элементов исходного изображения с центрами элементов верифицируемого лица, C1k, C2k - весовые коэффициенты, показывающие влияние смещения и отклика каждого элемента на результирующий счет. Параметр k = min k вычисляемый через величину откликов, определяется по всей области, в которой производилась фильтрация с помощью соответствующей маски.
В результате верификации принимается решение об идентичности сравниваемых лиц (рис. 6.58). Лица считаются идентичными при условии, что 100 - F P, где P – заранее заданный порог сравнения.