
- •Алгоритм классификации человека по фотографии лица
- •Содержание
- •1 Введение
- •2 Постановка задачи
- •2.1 Формальная постановка задачи
- •2.2 Критерии качества и методы оценки
- •2.3 Цели дипломной работы
- •3 Обзор существующих методов
- •3.1 Предобработка фотографий
- •3.2 Признаки
- •3.3 Методы обучения
- •3.4 Выводы
- •4 Предложенный метод
- •4.1 Предобработка фотографий
- •4.3 Рандомизированные решающие деревья
- •5 Экспериментальные результаты
- •6 Описание практической части
- •7 Заключение
- •8 Литература
2 Постановка задачи
2.1 Формальная постановка задачи
Требуется разработать алгоритм, который бы по фотографии лица человека определял его принадлежность к различным классам. Назовем атрибутами человека такие признаки, как пол, возраст, наличие усов или бороды и тому подобные. Тогда формальная задача для алгоритма будет выглядеть следующим образом:
Входные данные:
Фотография лица человека
Координаты зрачков на фотографии
Выход алгоритма:
Набор значений атрибутов
Фотографии, подаваемые на вход, могут быть как цветными, так и черно-белыми. Предполагается, что лица на фотографиях будут расположены фронтально, но небольшие отклонения допустимы. Координаты зрачков получаются предварительно либо с использованием ручной разметки, либо некоторым автоматическим методом.
Для разрабатываемого алгоритма предлагается использование метода машинного обучения, поэтому на этапе обучения на вход дополнительно потребуется база размеченных фотографий лиц, для которых известны значения атрибутов.
2.2 Критерии качества и методы оценки
Критерием качества алгоритма классификации людей по фотографиям лиц является процент правильно классифицированных людей из тестовой выборки, т.е. процент людей, для которых значение атрибута, предсказанное алгоритмом, совпало с истинным. Этот процент вычисляется отдельно для каждого атрибута. Дополнительным критерием, позволяющим более точно оценить качество работы алгоритма в случае существенного неравенства классов по объему, является процент правильно классифицированных людей, принадлежащих определенному классу. Например, для атрибута «пол» и класса «женщины» этот критерий вычисляется следующим образом:
, (1)
где
- количество женщин в тестовой выборке,
для которых алгоритм правильно определил
значение атрибута «пол»,
- количество всех женщин в тестовой
выборке.
Для оценки качества работы алгоритма используется метод скользящего контроля. Вся база фотографий разбивается на несколько частей, процесс тестирования происходит в несколько шагов, число которых равно числу частей. На каждом шаге одна часть базы используется в качестве тестовой выборки, а все остальные – в качестве обучающей. Следует отметить, что в базе могут присутствовать несколько различных фотографий одного и того же человека. В этом случае разбиение базы производится таким образом, чтобы все фотографии одного человека попали в одну и ту же часть. Такой способ позволяет оценивать способность алгоритма классифицировать атрибуты, а не запоминать индивидуальные особенности лица конкретного человека.
2.3 Цели дипломной работы
Целями данной дипломной работы являются:
Проведение обзора существующих алгоритмов классификации людей по фотографии лица и выявление их недостатков
Разработка и реализация собственного алгоритма классификации, лишенного некоторых найденных по итогам обзора недостатков
Тестирование и оценка качества работы разработанного алгоритма
3 Обзор существующих методов
Авторы работ в области классификации людей по фотографии лица обычно концентрируются на определении какого-либо одного атрибута: пола, возраста или эмоционального состояния. Детали алгоритмов классификации различных атрибутов отличаются, но можно выделить основные три этапа, которым следует большинство разработчиков методов:
Предобработка фотографий
Вычисление признаков
Применение алгоритма машинного обучения
Далее каждый из этапов будет рассмотрен более подробно.