Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Отчет СКУД Вихман.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.42 Mб
Скачать
  1. Алгоритмы распознавания

Для решения задачи распознавания лиц были предложены различные методики, среди которых можно выделить подходы, основанные на нейронных сетях, на разложении Карунена – Лоэва, на алгебраических моментах, линиях одинаковой интенсивности, эластичных (деформируемые) эталонах сравнения и так далее. В разработках алгоритмов распознавания особые усилия направлены на автоматическое выделение элементов лица (глаза, нос, рот, подбородок и др.) на его различных изображениях: фас, профиль и произвольный ракурс. Далее эти геометрические характеристики используются в решении задачи распознавания. Типичным при описании этих подходов является отсутствие сравнения на статистически значимой базе данных лиц.

Можно выделить два способа распознавания лиц:

  • сравнение типа соответствия между стимулами один против одного;

  • сравнение между накопленным, репрезентативным рядом лиц.

При всём многообразии различных алгоритмов и методов распознавания изображений, типичный метод распознавания состоит из трёх компонент (рисунок 4.1):

  1. преобразование исходного изображения в начальное представление (может включать в себя как предобработку, так и математические преобразования, например вычисление главных компонент);

  2. выделение ключевых характеристик (например берётся первые n главных компонент или коэффициентов дискретного косинусного преобразования);

  3. механизм классификации (моделирования): кластерная модель, метрика, нейронная сеть и т.п.

Кроме этого, построение метода распознавания опирается на априорную информацию о предметной области (в данном случае – характеристики лица человека), и корректируется экспериментальной информацией, появляющейся по ходу разработки метода.

Рисунок 4.1 Структура методов распознавания изображений

Для создания модуля распознавания лица рассмотрим несколько известных алгоритмов распознавания лиц. Проведем их сравнительный анализ (таблица 4.1).

Таблица 4.1 Сравнительный анализ методов распознавания лиц

Название метода

Описание метода

Достоинства

Недостатки

Метод главных компонент (Principal Component Analysis, PCA)

Применяется для сжатия информации без существенных потерь информативности. Он состоит в линейном ортогональном преобразовании входного вектора X размерности N в выходной вектор Y размерности M, N < M. При этом компоненты вектора Y являются некоррелированными и общая дисперсия после преобразования остаётся неизменной. Матрица X состоит из всех примеров изображений обучающего набора.

Применение для задачи распознавания лица имеет следующий вид. Входные вектора представляют собой отцентрированные и приведённые к единому масштабу изображения лиц. Собственные вектора, вычисленные для всего набора изображений лиц, называются собственными лицами. Собственные лица имеют полезное свойство, заключающееся в том, что изображение, соответствующее каждому такому вектору имеет лицеподобную форму. С помощью вычисленных ранее матриц входное изображение разлагается на набор линейных коэффициентов, называемых главными компонентами. Сумма главных компонент, умноженных на соответствующие собственные вектора, является реконструкцией изображения. Для каждого изображения лица вычисляются его главные компоненты. Обычно берётся от 5 до 200 главных компонент. Остальные компоненты кодируют мелкие различия между лицами и шум. Процесс распознавания заключается в сравнении главных компонент неизвестного изображения с компонентами всех остальных изображений. Для этого обычно применяют какую-либо метрику (простейший случай – Евклидово расстояние). При этом предполагается, что изображения лиц, соответствующих одному человеку, сгруппированы в кластеры в собственном пространстве. Из базы данных (или тренировочного набора) выбираются изображения-кандидаты, имеющие наименьшее расстояние от входного (неизвестного) изображения. 

Хранение и поиск изображений в больших базах данных, реконструкция изображений

Высокие требования к условиям съёмки изображений.

Изображения должны быть получены в близких условиях освещённости, одинаковом ракурсе и должна быть проведена качественная предварительная обработка, приводящая изображения к стандартным условиям (масштаб, поворот, центрирование, выравнивание яркости, отсечение фона). Нежелательно наличие таких факторов, как очки, изменения в причёске, выражении лица и прочих внутриклассовых вариаций.

Линейный дискриминантный анализ (Linear Discriminant Analysis, LDA)

Выбирают проекцию пространства изображений на пространство признаков таким образом, чтобы минимизировать внутриклассовое и максимизировать межклассовое расстояние в пространстве признаков. В этих методах предполагается, что классы линейно разделимы.

Линейный дискриминант выбирает проекцию на пространство признаков таким образом, чтобы разделить разные классы. Матрица W для проецирования пространства изображения на пространство признаков выбирается из следующего условия:

где SB – матрица межклассовой дисперсии, SW – матрица внутриклассовой дисперсии.

Может существовать до с-1 векторов составляющих базис пространства признаков, где с – общее число классов. С помощью этих векторов пространство изображений переводится в пространство признаков. Так же как и собственные вектора, изображения базисных дискриминантных векторов имеют лицеподобную форму.

Высокая точность распознавания (около 96%) для широкого диапазона условий освещённости, различных выражений лица и наличия или отсутствия очков

Неясно, применим ли этот метод для поиска в больших базах данных, работает ли, когда в тренировочной выборке для некоторых лиц имеется изображение только в одних условиях освещённости.

Необходима качественная предварительная обработка, приводящая изображения к стандартным условиям.

Метод основывается на предположении о линейной разделимости классов в пространстве изображений. В общем случае такое предположение несправедливо.

Гибкие контурные модели лица

Распознавание производится на основе сравнения контуров лица. Контуры обычно извлекаются для линий головы, ушей, губ, носа, бровей и глаз. Контуры представлены ключевыми позициями, между которыми положение точек, принадлежащих контуру, вычисляются интерполированием.

Ключевые точки размещаются вручную на наборе тренировочных изображений. Затем извлекается информация об интенсивности пикселей, лежащих на линии, перпендикулярной контуру для каждой точки контура. При поиске контуров нового лица используется метод симуляции отжига с целевой функцией из двух составляющих. Как должен выглядеть типичный контур черт лица, процедура поиска узнает из тренировочных примеров.

При совместном использовании с другими методами повышается точность распознавания

Главной задачей при распознавании по контурам является правильное выделение этих контуров. В общем виде эта задача по сложности сравнима непосредственно с распознаванием изображений. Кроме того, использование этого метода самого по себе для задачи распознавания недостаточно.

Методы, основанные на геометрических характеристиках лица

Суть его заключается в выделении набора ключевых точек (или областей) лица и последующем выделении набора признаков. Каждый признак является либо расстоянием между ключевыми точками, либо отношением таких расстояний. Наборы наиболее информативных признаков выделяются экспериментально

Ключевыми точками могут быть уголки глаз, губ, кончик носа, центр глаза и т.п. В качестве ключевых областей могут быть прямоугольные области, включающие в себя: глаза, нос, рот.

В процессе распознавания сравниваются признаки неизвестного лица, с признаками, хранящимися в базе.

В общем случае этот метод не самый оптимальный, однако, для некоторых специфических задач перспективен. К таким задачам можно отнести документный контроль, когда требуется сравнить изображение лица, полученного в текущий момент с фотографией в документе. При этом других изображений этого человека не имеется, и следовательно механизмы классификации, основанные на анализе тренировочного набора, недоступны.

Трудоемкий и высокие требования к условиям съемки:

задача нахождения ключевых точек приближается к трудоёмкости непосредственно распознавания; изображение лица человека должно быть без помех, мешающих процессу поиска ключевых точек (очки, бороды, украшения, элементы причёски и макияжа). Освещение желательно равномерное и одинаковое для всех изображений. Изображение лица должно иметь фронтальный ракурс, возможно с небольшими отклонениями. Выражение лица должно быть нейтральным.

Сравнение эталонов

Заключается в выделении областей лица на изображении, и последующем сравнении этих областей для двух различных изображений. Каждая совпавшая область увеличивает меру сходства изображений. Это так же один из исторически первых методов распознавания человека по изображению лица. Для сравнения областей используются простейшие алгоритмы, вроде попиксельного сравнения.

Требует много ресурсов, как для хранения участков, так и для их сравнения. В виду того, что используется простейший алгоритм сравнения, изображения должны быть сняты в строго установленных условиях: не допускается заметных изменений ракурса, освещения, эмоционального выражения и пр.

Скрытые Марковские модели

В распознавании образов скрытые Марковские модели применяются следующим образом.

  1. Каждому классу i соответствует своя модель λi

  2. Распознаваемый образ (речевой сигнал, изображение и т.д.) представляется в виде последовательности наблюдений O.

  3. Затем для каждой модели λi  вычисляется вероятность того, что эта последовательность могла быть сгенерирована именно этой моделью. 

  4. Модель λi, получившая наибольшую вероятность, считается наиболее подходящей, и образ относят к классу j.

Позволяют учитывать непосредственно пространственно-временные характеристики сигналов

Низкие требования к качеству съемки

Не обладает различающей способностью. Т.е. алгоритм обучения только максимизирует отклик каждой модели на свои классы, но не минимизирует отклик на другие классы, и не выделяются ключевые признаки, отличающие один класс от другого.

В данной работе будем использовать СММ. Таким образом, задача распознавания делиться на две подзадачи: на этапе обучения СММ надо построить модель по набору различных изображений лица конкретного человека, хранящихся в базе данных; на этапе распознавания некоторое предложенное изображение следует отнести к одной из модели с какой-либо вероятностью.

Модуль регистрации отвечает за построение моделей, добавляемых в базу данных лиц. Модуль идентификации аналогично модулю регистрации строит модель захваченого изображения и сравнивает ее с эталоном.

Рисунок 4.1. Блок-схема укрупненного алгоритма верификации

Алгоритм модуля регистрации выглядит следующим образом:

Рисунок 4.2 Блок-схема алгоритма регистрации людей в БД

Собственно вся обработка и распознавание лица происходит в модуле идентификации. Алгоритм идентификации представлен ниже на рисунке 4.3.

Рисунок 4.3. Блок-схема алгоритма идентификации