- •Назначение и условия применения 53
- •Введение
- •1 Постановка задачи
- •2 Аналитическая часть
- •2.1Факторы, влияющие на уникальность речи
- •2.2 Система распознавания личности
- •2.3 Образец и его предобработка
- •2.3.1 Обрабатываемый образец
- •2.3.2 Предварительная обработка
- •2.4 Извлечение признаков
- •2.4.2. Кепстральные коэффициенты, основанные на линейного предсказания
- •2.5 Обработка извлеченных признаков
- •2.6 Способы классификации моделей
- •2.6.1 Вычисление расстояний
- •2.6.2. Метод опорных векторов
- •2.6.3 Модель гауссовых смесей
- •2.6.4 Метод ближайшего соседа
- •2.7 Аналогичные программы
- •VoiceKey
- •VoiceNet
- •2.8 Недостатки большинства системы идентификации по голосу
- •2.9 Действующие национальные стандарты
- •3 Конструкторская часть
- •3.1. Функциональная схема аппаратных средств
- •3.2 Функциональная схема программного средства
- •3.3 Информационная схема программного средства
- •3.4 Алгоритм программного средства
- •7. Вычисление расстояний.
- •3.5. Язык программирования и среда разработки
- •4 Документация программного средства
- •4.1 Техническое задание
- •4.1.1 Основания для разработки
- •4.1.2 Назначение разработки
- •4.1.3 Требования к программному средству
- •4.1.4 Требования к программной документации
- •4.2 Руководство системного программиста
- •4.2.1 Общие сведения о программном средстве
- •4.2.2 Структура программного средства
- •4.3 Руководство администратора
- •4.3.1 Назначение и условия применения
- •4.4 Руководство оператора
- •4.4.1 Назначение и условия применения
- •4.4.2 Выполнение программного средства
- •5. Экспериментальная часть
- •6 Организационно - экономическая часть
- •6.1 Описание эффектов от внедрения разработки
- •6.2 Планирование процесса разработки программного средства
- •Техническое задание – 15%;
- •6.3 Смета затрат на разработку
- •6.3.1 Материальные затраты
- •6.3.2 Расходы на оплату труда
- •6.3.3 Отчисления на социальные страхования от заработной платы
- •6.3.4 Амортизационные отчисления
- •6.3.5. Прочие прямые расходы
- •6.3.6 Накладные расходы
- •7 Безопасность жизнедеятельности
- •7.1 Введение
- •7.2 Анализ опасных и вредных факторов
- •7.3 Мероприятия по нормализации и защите от вредных и опасных воздействий.
- •7.4 Возможные чрезвычайные ситуации
- •7.5 Оценка напряженности трудового процесса
- •7.6. Выводы
- •Список используемой литературы
- •Приложения
2.6.3 Модель гауссовых смесей
Модель гауссовых смесей представляет собой взвешенную сумму М компонент и может быть записана выражением:
Каждый компонент является D - мерной гауссовой функцией распределения вида:
Полностью модель гауссовой смеси определяется векторами математического ожидания, ковариационными матрицами и весами смесей для каждого компонента модели:
где i = 1,...,M.
Стоит отметить, что модель гауссовых смесей достаточно часто используется в системах распознавания человека по голосу. Чтобы данный метод работал, нам нужно найти векторы средних, веса компонентов и матрицы ковариации. Для этого используем EM - алгоритм (Expectation-maximization). На начальном этапе используются начальные значения параметров модели, но на каждом последующем шаге алгоритма осуществляется переоценка этих параметров. Чтобы найти начальные параметры используют алгоритм K-средних. Переоценка параметров осуществляется по формулам, представленным ниже:
Estimation-step (вычисление апостериорных вероятностей)
;
Maximization-step (вычисление новых параметров модели)
Все это продолжается до того момента, пока наши параметры не сойдутся.
2.6.4 Метод ближайшего соседа
Суть данного метода заключается в том, что сравниваются все векторы записанной последовательности. Это происходит с целью расчета расстояния, которое является минимальным между каждым вектором текущей последовательности и каждым вектором уже зарегистрированного "шаблона". Чтобы получить финальную оценку, эти расстояния усредняются:
.
2.7 Аналогичные программы
В настоящие время выбор систем идентификации личности по голосу не так и огромен. Данные биометрические системы появились в России в 90-х годах. Стоит отметить, что особого распространения они не получили, так как это было больше похоже на роскошь, и стоили они порядка 12000$. Сегодня же идентификация по голосу становится более актуальной, и стоимость систем с того времени упала практически в 10 раз.
Разберем две аналогичные системы идентификации личности по голосу:
VoiceKey
VoiceKey – это мультифункциональная биометрическая платформа, которая работает дистанционно [6]. VoiceKey используют для идентификации пользователей по характеристикам его голоса, а так же лица, выявления злоумышленников, защиты корпоративной информации, обеспечения безопасности передачи данных через интернет в мобильном приложении или личном кабинете на сайте.
Преимущества:
кроме поддержки голосовой биометрии, так же используется лицевая биометрия;
масштабность;
независимость от языка произношения;
настройка прав доступа.
VoiceNet
Идентификация или верификация в технологиях VoiceNet осуществляется по заданным парольным фразам [7]. Как правило, их продолжительность составляется 5 секунд и дольше. В качестве уникальных параметров используется голос человека. Изначально VoiceNet создан для работы с телефонными каналами.
Преимущества:
возможность удаленной идентификации;
близкая к невозможному имитация голоса пользователя с помощью записывающего устройства;
исключена идентификация пользователя, который находится под давлением злоумышленников, так как это влияет на его эмоциональное состояние (программа неустойчива к данным ситуациям);
возможность одновременной идентификации по голосу и распознаванию речи (произнесенный пароль).
