Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа

..pdf
Скачиваний:
5
Добавлен:
12.11.2023
Размер:
12.16 Mб
Скачать

11.2. Метод биометрического поиска

241

трейс-преобразование, связанное со сканированием изображений объ­ ектов по сложивш траекториям, благодаря чему в признаках полно отражаются свойства окрестностей точек пересечения сканирующей линией. Кроме того, структура триплетного признака позволяет использоватв самый разнообразный набор функционалов, чем достигается

гибкости

описания

геометрических

особенностей

изображений [48].

В частности, при

надлежащем вв1боре функционалов,

как показано

в § 6.2,

можно получить признаки,

инвариантные

по

отношению к

группе движений и линейных деформаций распознаваемых портретных изображений и фотороботов.

Предварительная обработка изображений. Поскольку в процессе поиска приходится сравнивать чёрно-белое изображение фоторобота с изображениями лиц в БД, то необходима предварительная обработка изображений лиц с целью приведения их к бинарному виду [51, 52]. Исходные цветные фотографические портреты специальной процедурой приводятся к полутоновым изображениям рис. 11.3, а (см. цветную вклейку). Затем осуществляется преобразование его к монохромати­ ческому чёрно-белому виду рис. 11.3,6 (см. цветную вклейку). Алго­ ритмы выполнения этих процедур описаны в главе 2 .

Рассмотрев физиологические основы распознавания лица человека, можно прийти к выводу, что разные фрагменты изображения лица играют разную роль при распознавании. Поэтому было предложено сегментировать портретное изображение в автоматическом или полу­ автоматическом режиме, придавая большие веса признакам, распозна­ ющим область глаз, носа, носо-губный треугольник в целом, овал лица и лобную часть головы (приведено соответственно по мере убывания весовых коэффициентов).

Следует отметить, что помимо, высокой информативности этих областей изображения лица [6, 7], они почти не поддаются маскировке (с помощью причёски, усов, бороды и т. п.).

Для выделения фрагментов лица был разработан оригинальный алгоритм (см. [57, 94]), в основу которого положен рекурсивный алгоритм заливки области заданным цветом.

Режим обучения. Путём генерации триплетных признаков для описания каждого портретного изображения, хранящегося в базе дан­ ных (БД), был построен набор поисковых триплетных признаков, число которых в данном случае достигало 1080. Эти признаки вычислялись в режиме обучения для 100 портретных изображений и для 10 образцов фотороботов, причём вычисления осуществлялись по всем вышепере­ численным областям высокой информативности.

Результаты вычислений в режиме обучения показали, что значения некоторых триплетных признаков попадают в непересекающиеся или частично пересекающиеся интервалы. Эти признаки обеспечивают наи­ более важную информацию об изучаемых изображениях, их следует использовать при построении решающей функции. Остальные призна­ ки считают малоинформативными, их влияние при принятии решения в системе снижается, а то и вовсе исключается из рассмотрения.

16 Федотов Н. Г.

11.2. Метод биометрического поиска

243

Знаком + в табл. 11.1 отмечены Т функционалы и соответствующие трейс-трансформанты, на основе которое сформированы триплетные признаки, распознающие области глаз, характерную для изображе­ ния в).

В табл. 11.2 (см. цветную вклейку) приведён пример, иллюстрирую­ щий чувствительность различных Т функционалов и соответствующих трейс-трансформант к таким анатомическим характеристикам изобра­ жений лица как высота лба (изображение а) — лоб высокий, б) — лоб низкий). Знаком + отмечены функционалы, на основе которых сформированы триплетные признаки, распознающие эти анатомические характеристики лица.

В табл. 11.3 (см. цветную вклейку) приведены примеры, иллюстри­ рующие чувствительность различных Т функционалов и соответству­ ющих трейс-трансформант к такой характеристике изображения лица, как линия роста волос (изображение а) — прямая, б) — дугообразная, в) — извилистая, в) — М-образная, г) — асимметричная). Первый, вто­ рой и четвёртый функционалы, отмеченные знаком +, применены для построения признаков, выделяющих изображения лиц с дугообразной линией роста волос (изображение б)); пятый функционал, отмеченный знаком +, — с асимметричной линией (изображение — г)).

Таким образом, в режиме «обучения» возникает задача оценить «распознающую способность» каждого признака.

Для оценки информативности пространства признаков используем подход, в основе которого лежит гипотеза компактности [14], со­ гласно которой признаки одного класса сгущаются в некоторой области признакового пространства, образуя тем самым некий кластер. Сле­ довательно, для хорошего распознавания образов желательно, чтобы расстояния между точками-признаками одного класса были малыми, а расстояния между точками-образами разных классов были бы боль­ шими [14]. Компактность (плотность) Щ образа г, представленного в

обучающей выборке то* точками

1, 2,

q,..., то*, характеризу­

ется средней длиной ребер r(f,q)

соединяющего их полного графа:

Аналогично, компактность Wj точек 1, 2, . . . , s , . .. , v , . .. , mj, пред­ ставляющих образ j, имеет вид:

Разнесенность образов в пространстве признаков можно оценивать через среднее расстояние между всеми парами точек из разных об­ разов:

■S= 1, . . . , ТОj .

16*

244 Гл. 11. Поиск биометрической информации

 

 

 

 

 

Таблица 11.4

Набор

Фоторобот

 

БД изображений

 

 

 

переменных

Ь

а\

 

( Li

адг-1

адг

 

 

а 2

 

х ,

Х\

а |

4

а,-

хаД~'

хаД

 

V

x i

 

 

ть

а |

 

 

 

 

 

*2

х\

4 2

а,-

X2n~'

 

 

х 2

Х 2

X 2 N

 

Xi

4

а\

х?

а,-

хаД -'

Хах

 

x i

x i

 

Х п-1

4 -1

а I

~а2

а,-

алг-1

~ a N

1

4 - х

Х п - 1

Х п - 1

Х п - 1

Х п ~

х п

4

Хп'

~а2

4

■ь-п

•bn

 

 

 

 

 

 

a N - \

~ a N

 

На основании сказанного информативность пространства признаков

тем больше, чем больше величина:

 

 

 

 

 

 

Т _

W (i,j )

 

 

 

 

 

 

W i + W j

 

 

 

Отметим, что в результате обучения было отобрано 78 информа­ тивных триплетных признаков для биометрического поиска. Функцио­ налы, образующие эти признаки, приведены в § 11.3. Такой подход с опорой на анализ обучающей совокупности для формирования триплет­ ных поисковых признаков рационален при объёмах баз данных порядка одной - двух тысяч изображений.

Для больших баз данных, насчитывающих десятки тысяч изоб­ ражений, целесообразно модифицировать решающее правило так, чтобы программа сама могла оценивать информативность призна­ ков по критерию J, т. е. определять компактность точек каждого образа и разнесённость образов в пространстве признаков согласно вышеприведённому алгоритму.

Режим поиска и идентификации. Процесс поиска в предложен­ ной системе основан на том, чтобы предложить эксперту для рас­ смотрения, в первую очередь, те портретные изображения, которые имеют наибольшую «степень близости» к задаваемому субъективному портрету — фотороботу. Таким образом, можно говорить о некотором процессе упорядочения изображений по критерию близости к объекту поиска. В режиме поиска и идентификации рассматривалось 1020 изоб­ ражений фотопортретов (фотоучётов) и 100 субъективных портретов (фотороботов). Каждое изображение из БД и фотороботы описывались набором из 78 триплетных информативных признаков, отобранных в режиме обучения.

Обозначим множество образов Ь, а\, ... , а»,..., адг, где b — изобра­ жение фоторобота, N — количество портретных изображений в БД (в нашем случае N = 1020), Х \ , . . . , X i , ... ,Х п — весь набор триплетных признаков, где п — количество отобранных эффективных признаков (п = 78). Получаем для каждого фоторобота таблицу данных для анализа признаков (табл. 11.4).

11.2. Метод биометрического поиска

245

Задача упорядочения изображений состоит в том, чтобы на основе анализа табл. 11.4 упорядочить множество {аД по степени близости к Ъ. Для этой цели вводится критерий и правило упорядочения объек­ тов:

П = (а*>-а*+ 1) при 1Д < 1Д+1,

где {ПД — количественный критерий, позволяющий в процентном отношении определить, насколько велико различие между а* и Ь по совокупности признаков:

П, = 100 •Е :t-cp.х,уCP- 3

где жСр j

X° j + ж“г

3= 1

 

 

Результаты тестирования работы системы биометрического по­ иска в БД изображений на основе триплетных признаков. При решении данной задачи биометрического поиска было рассмотрено 100 субъективных портретов (фотороботов) для 1020 различных изоб­ ражений (фотоучётов). Каждое изображение из БД описывается набо­ ром триплетных информативных признаков, а для каждого фоторобота, участвующего в поиске, были определены числовые характеристики ка­ ждого признака из набора информативных. Далее, применяя рассмот­ ренное решающее правило, система даёт ответ в виде списка — какое из фотоизображений наиболее схоже с представленным фотороботом.

Данные результатов сгруппированы в табл. 11.5. Совокупность изображений в БД разбита на две группы по критериям качества изображений, предъявляемым к фотоучетам. К I группе отнесены фотоучеты с хорошим качеством и высоким разрешением, ко II группе с плохим качеством и низким разрешением. Результаты применения решающего правила для упорядочивания объектов в исследуемой БД изображений приведены в табл. 11.5.

 

 

 

 

 

 

Таблица 11.5

 

Количество,

Количество

Количество событий, когда изображение,

 

составленных

сопоставляемое фотороботу, попадает

 

изображений

 

 

 

 

 

фотороботов,

в БД, шт.

на первое

 

 

 

шт.

в первую

в первую

 

 

 

 

 

место

 

 

 

десятку списка сотню списка

I

15

150

списка

11

(73%)

14 (93%)

15 (100%)

II

85

870

41 (48%)

63 (74%)

85 (100%)

Итого:

100

1020

 

52

76

100

Заметим, что, как и можно было предположить, фотоизображения с высоким качеством и высоким разрешением показывают достаточно хорошие результаты. В 73% случаях система на первое место постави­ ла искомое изображение по составленному фотороботу, и естественно при расширении круга ответов системы число правильно распознанных изображений растёт (так для изображений I типа имеем — 93%, если ограничиваемся рассмотрением первой десятки ответов системы, и 100%, если круг ответов до первой сотни).

246Гл. 11. Поиск биометрической информации

11.3.Функционалы д л я триплетных поисковы х

признаков

Трейс-функционалы:

 

 

 

t е

l П F ;

f (t ) = { 1

t е l П F.

т = {A},

A c

l П F ,

V t е A,

f (t) = 0,

Vi, j Ai П Aj

= 0,

U Ai = A, i

V A е т.

M(A)

p(A)

M A) ’

где:

F — искомое изображение;

l — сканирующая прямая линия, заданная нормальными координа­ тами р и в;

t — естественная координата сканирующей прямой линии l;

f (t) — характеристическая функция пересечения сканирующей пря­ мой линии l изображения F;

т — семейство подмножеств A;

A — множество всех отрезков прямых l, для которых f (t) = 0; p(A) — распределение множества A, порождаемое семейством под­

множеств т ;

р(A ) — лебегова мера множества A.

T i

 

f (t) dt — длина высекаемых отрезков;

 

In F

'

 

 

 

T 2

1

f (t) dt

— средняя длина высекаемого отрезка;

T5

.

 

In F

 

 

Тз =

{/ П

 

f (tk)

— средняя геометрическая длины высекаемого

отрезка;

 

k=1

 

 

1

 

 

 

Т 4

 

 

 

средняя гармоническая длины высекаемого от-

 

dt

 

 

 

 

 

резка;

I n F

т

 

 

 

 

 

 

 

 

 

число пересечений линии l(p, в) с фигурой F .

Т 5 = n(p,et)

Т б = min

 

f (t) dt

— минимальная длина высекаемых отрезков;

11.3. Функционалы Для триплетных поисковых признаков

247

T 7 = max

f

(t) dt — максимальная длина высекаемых отрезков;

 

 

A

— максимальное

значение

плотности распределения

T g = pmax(A)

множеств A.

 

 

 

 

 

 

 

 

 

 

T 9 =

m ax (A) + pm in (A));

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T 5

I1

ff 2(t) dt - f

I

f(t) dt\

 

 

T 10

 

I n F

 

 

 

MnF

 

'

 

 

 

 

 

 

T 5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T 11 =

T

1

If(t) - T2| dt;

 

 

 

 

 

 

In F

 

 

 

 

 

 

 

 

 

 

 

 

f 2(t) dt -

 

 

2

 

 

 

T 5

I

(

I (t )dt\

 

 

T 12

\

I n F

 

 

 

MnF

7

 

 

 

 

 

 

T 5

 

 

 

 

 

T 13

 

(f (t)

-

T 2)2 dt;

 

 

 

 

 

 

I n F

 

 

 

 

 

3

 

 

 

 

 

 

 

 

f

(t) -

T2

dt;

 

 

 

T 14

 

 

 

 

 

 

 

T 5

 

 

 

T11

 

 

 

 

 

 

I n F

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

f

(t) -

T2

dt —3.

 

 

T 15 =

T

 

 

 

 

 

 

 

 

T11

 

 

 

 

 

T5

I n F

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Диаметральные функционалы (Р-функционалы):

 

 

 

 

 

 

9(6, P) = T ( F П 1(6, p, t)).

 

+ 0

 

 

 

 

 

 

1

+ 0

 

 

9(6, p) dp;

P 2

 

 

(9(6, p) -

P2)2 dp.

P i

 

OO

 

P 3

OO

 

 

 

 

 

 

 

dp

00

 

g{d, p)

Круговые функционалы (©-функционалы): a(6) = P [T (F П 1(6, p, t))],

где a(6) - 2п — периодическая кривая, представляющая собой ре­ зультат применения Р-функционала для заданного 6; T — результат применения трейс-функционала над множеством F П I; P — результат применения кругового функционала над множеством значений 9(6, p) для заданного p;

 

2п

 

1

©i

 

a(6) d6; © 2

 

2п

 

о

 

dd

 

 

а{в)

 

 

 

о

248Гл. 11. Поиск биометрической информации

11.4.Выбор СУБД для системы биометрического

поиска

Одной из задач при создании системы биометрического поиска является эффективное управление большим объемом данных. Для ре­ шения этой задачи используются системы управления базами данных, далее СУБД.

На сегодняшний день существует большой выбор СУБД, отличаю­ щихся по своим возможностям, назначению, цене. Проанализируем их характеристики и выберем СУБД, наиболее подходящие для создания системы биометрического поиска.

Для начала необходимо сформулировать основные требования, предъявляемые к СУБД. Система биометрического поиска сохраняет в базе данных исходные данные — набор цветных или полутоновых изображений, результаты предобработки — бинаризированные изобра­ жения, а так же имена применяемых функционалов в составе триплет­ ных признаков и результаты их вычисления.

Рассмотрев характер хранимой информации, можно сформулиро­ вать основные требования к СУБД:

1) возможность работы с таблицами большой кардинальности и большого объема;

2) возможность работы с изображениями;

3) быстрый поиск данных по столбцам с низкой селективностью. Дополнительно, для упрощения реализации и развертывания сис­

темы биометрического поиска, к СУБД предъявляются требования: 1) многоплатформенность; 2) интеграция в систему разработки ПО.

Рассмотрим предъявляемые требования подробнее.

Большие по объему таблицы необходимы для хранения изображе­ ний. Эффективная поддержка больших таблиц позволит не делить таблицу на множество таблиц и тем самым упростить и ускорить обращение к исходным данным.

Скорость работы СУБД во многом определяет скорость работы системы биометрического поиска в целом, однако оценить данный параметр достаточно сложно по причине его изменения в зависимости от реализации каждой конкретной базы данных, размера базы данных и применяемого аппаратного обеспечения.

Быстрый поиск данных по столбцам с низкой селективностью необ­ ходим для выполнения одного из наиболее типичных запросов к базе данных — выборке значений определенного признака для всех изобра­ жений. Каждый признак характеризуется комбинацией трех функци­ оналов, и число функционалов каждого вида относительно невелико, в то время как число изображений может быть очень большим. В этих условиях может оказаться полезной поддержка СУБД масочных ин­ дексов, поскольку в противном случае может оказаться необходимым низкоэффективный полный просмотр таблицы.

11.4. Выбор СУБД для системы биометрического поиска

249

Возможность сохранять изображения в базе данных существенно упростит написание системы биометрического поиска, т. к. все мани­ пуляции с данными будут осуществляться СУБД. Отсутствие данной возможности потребует от разработчика сохранения ссылки на файл изображения или его имени, что приведет к усложнению программного обеспечения и снижению контроля за целостностью данных.

Многоплатформенность СУБД расширяет возможности по исполь­ зованию системы в самых различных аппаратно-программных средах. Отсутствие жесткой привязки СУБД к конкретной операционной сис­ теме дает возможность применения бесплатных операционных систем либо использования уже имеющихся в наличии систем вместо приоб­ ретения новых.

Интеграция в систему разработки ПО позволяет разработчику упростить процесс взаимодействия с СУБД в прикладном программном обеспечении.

Сравним основные параметры наиболее популярных СУБД. Эта информация приведена в табл. 1 1 .6, сведения о поддерживаемых опе­ рационных системах даны в табл. 11.7.

 

 

 

Таблица 11.6

 

Максимальный

Максимальный

Максимальный

 

размер БД

размер таблицы

размер числа (bit)

Firebird

32 ТБайт

32 ТБайт

64

SQL Server

524 ТБайт

524 ТБайт

64

MySQL

Неограничен

2 ТБайт

64

Oracle

Неограничен

4 ТБайт

126

PostgreSQL

Неограничен

32 ТБайт

Неограничен

Выбор какой-то конкретной СУБД основывается не только на ха­ рактере решаемой задачи, но также зависит и от размера системы (количества пользователей, интенсивности их обращения к системе, количества изображений в базе данных), и требованиям к ее масшта­ бируемости на перспективу.

 

 

 

 

Таблица 11.7

 

Windows

MAC OS

Linux

BSD

UNIX

Firebird

Да

Да

Да

Да

Да

SQL Server

Да

Нет

Нет

Нет

Нет

MySQL

Да

Да

Да

Да

Да

Oracle

Да

Да

Да

Нет

Да

PostgreSQL

Да

Да

Да

Да

Да

250 Гл. 11. Поиск биометрической информации

Рассмотрим несколько вариантов системы поиска биометрических изображений.

Небольшая система. Относительно малое количество объектов (не более 1000) и небольшое количество пользователей (10-20). Подойдет любая из представленных СУБД. С точки зрения уменьшения цены системы и упрощения её развертывания можно выбрать MySQL или Firebird. Данные СУБД распространяются бесплатно, по лицензии GPL, отличаются минимальными требованиями к аппаратному обес­ печению и простотой администрирования.

Для систем среднего уровня (количество объектов до 10000, ко­ личество пользователей до 200 человек) можно выбрать Firebird или PostgreSQL. Данные системы обладают сходными возможностями. Обе системы могут быть использованы бесплатно.

В случае создания больших систем целесообразнее использовать коммерческие СУБД, такие как Microsoft SQL Server или Oracle.

Можно найти множество противоречивых сравнений данных си­ стем. С точки зрения системы биометрического поиска можно выделить следующие важные особенности данных СУБД. Oracle является много­ платформенной, поэтому если при создании информационной системы предполагается использовать операционные системы Linux или Unix, то выбор следует сделать в пользу Oracle. Также Oracle поддержи­ вает масочные индексы и секционирование таблиц, имеет широкие возможности по хранению изображений как непосредственно в файлах данных, так и в виде внешних файлов, размещаемых на сервере.

Если же вся система будет работать под управлением операционной системы Windows, то интеграция MS SQL в наиболее популярную на сегодняшний день среду программирования MS Visual Studio и возможность применения языков C++ и C # для написания хранимых процедур может значительно ускорить процесс создания системы.