
- •Разработка и макетирование устройства распознавания пользователей бытовой техники
- •Содержание
- •1. Сравнительный анализ и выбор принципов построения сенсорной части устройства
- •2. Разработка интерфейса взаимодействия системы распознавания с пользователями
- •3. Обзор методов биометрической идентификации личности по лицу
- •3.1 Особенности и проблемы распознавания лиц
- •3.2Методыудалениефона
- •3.3. Обзор алгоритмов обнаружения лица человека на изображении
- •3.3.1. Эмпирические методы
- •Распознавание "сверху-вниз".
- •Распознавание "снизу-вверх".
- •3.3.2. Моделирование изображения лица
- •Неадаптивные методы
- •Моделирование класса изображений лиц с помощью метода главных компонент
- •Моделирование класса изображений лиц с помощью Факторного Анализа (Factor Analysis, fa)
- •Адаптивные методы
- •Линейный Дискриминантный Анализ (Linear Discriminant Analysis, lda)
- •Метод Опорных Векторов (Support Vector Machines, svm)
- •Искусственные Нейронные Сети (Neural Networks, nn)
- •Sparse Network of Winnows (sNoW) - «Разреженная сеть просеивающих элементов».
- •Скрытые Марковские Модели (Hidden Markov Models)
- •Active Appearance Models (aam) – «Активные модели внешнего вида»
- •Алгоритм Viola-Jones
- •3.4 Обзор методов распознавания лиц
- •3.4.1. Классификация методов распознавания
- •3.4.2. Методы, основывающиеся на анализе локальных признаков
- •Контурные (эластичные) модели лица (Flexible Appearance Models)
- •Сравнение эластичных графов
- •Методы, основанные на геометрических характеристиках лица
- •Сравнение эталонов
- •Метод наиболее информативных областей (нио)
- •Скрытые марковские модели
- •Морфинговые модели
- •3.4.3. Методы, основывающиеся на анализе глобальных признаков Дискриминантные методы
- •Линейный дискриминантный анализ
- •Анализ главных компонент
- •Анализ независимых компонент
- •Топографический независимый факторный анализ
- •Оптический поток
- •3.4.4. Общие методы Фильтры Габора
- •Моменты
- •Нейронные сети
- •3.4.5. Методы классификации
- •Статистические классификаторы
- •Классификаторы на основе построения разделяющих гиперповерхностей
- •Классификаторы, основанные на принципах потенциалов
- •Классификаторы экземпляров
- •Нейросетевые классификаторы
- •4. Выбор оптимальных методов решения задачи распознавания лиц
- •5. Определение набора тестов для проверки качества работы системы распознавания
- •5.1. Тестирование подсистемы удаления фона
- •5.2. Тестирование подсистемы обнаружения лиц
- •5.3. Тестирование подсистемы распознавания лиц
- •5.4. Face Databases
- •6. Разработка алгоритмического обеспечения комплекса.
3.3.2. Моделирование изображения лица
Вторая категория методов направлена не на формализацию в явном виде процессов, происходящие в человеческом мозге, а на выявление закономерностей и свойства изображения лица, применяя методы математической статистики и машинного обучения. Опирается на инструментарий распознавания образов, рассматривая задачу обнаружения лица, как частный случай задачи распознавания.
Задача обнаружения лица обычно решается в два этапа:
поиск фрагментов- претендентов для классификации;
разделение найденных фрагментов на классы лиц и "не-лиц".
Изображению (или его фрагменту) ставится в соответствие некоторым образом вычисленный вектор признаков, который используется для классификации изображений на два класса - лицо/не лицо. Каждый пиксель изображения становится компонентом вектора признаков, превращая черно-белое изображение n×m в вектор пространства Rn×m.
Преимущества методов моделирования лиц
Высокие показатели качества обнаружения и распознавания на больших коллекциях изображений.
Возможность гибкого использования аппарата математических функций для выбора наиболее оптимального метода построения классификатора с учётом условий конкретной задачи.
полностью исключается участие человека из всей процедуры построения классификатора (включая выделение устойчивых признаков для распознавания), что снижает вероятность ошибки при построении модели изображения лица.
Недостатки методов моделирования изображения лиц:
Зависимость от ориентации и масштаба лица. Большинство классификаторов не являются инвариантными к повороту лица в плоскости изображения и изменению его размера - требуется дополнительная обработка входного изображения (масштабирование, поворот).
Потенциальная зависимость от освещения, которое преобладало в тренировочном наборе - требуется дополнительная предобработка изображения для компенсации влияния освещения.
Высокая вычислительная сложность. Это затрудняет использование некоторых методов в системах реального времени (например - отслеживании перемещения лица в видеопотоке).
Усилия по формированию тренировочных наборов изображений и обучению классификатора.
Обучение только на прямоугольных изображениях объектов
Для сокращения вычислительной сложности при построении математической модели изображения лица применяются различные методы сокращения количества рассматриваемых фрагментов:
преобразование Карунена-Лева (Karhunen-Loeve transform – анализ основных компонентов);
аппроксимация Ритца (Ritz approximation – представление на базе образцов);
представление с редкой фильтрацией (sparse-filter representation - струйные и волновые преобразования Габора);
гистограммы признаков (feature histogram);
анализ независимых компонентов.
Неадаптивные методы
Методы требуют для тренировки классификатора только наборы положительных случаев распознавания (изображений лиц), им не требуются контрпримеры (изображения без лиц).
Моделирование класса изображений лиц с помощью метода главных компонент
Метод главных компонент (МГП) применяется для снижения размерности пространства признаков, не приводя к существенной потере информативности тренировочного набора объектов (в данном случае - изображений лиц).
В приложении к задаче обнаружения лиц, МГК применяется следующим образом. После вычисления главных осей тренировочного набора изображений лиц, вектор признаков тестового изображения проецируется на подпространство, образованное главными осями. Вычисляются две величины: расстояние от проекции тестового вектора до среднего вектора тренировочного набора - Distance in Feature Space (DIFS), и расстояние от тестового вектора до его проекции в подпространство главных компонент - Distance From Feature Space (DFFS). Исходя из этих расстояний выносится решение о принадлежности тестового изображения классу изображений лиц.