Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СТАРИКОВ_ ДИПЛОМ_ПЕЧАТЬ.docx
Скачиваний:
4
Добавлен:
01.07.2025
Размер:
3.42 Mб
Скачать

2.6.3 Модель гауссовых смесей

Модель гауссовых смесей представляет собой взвешенную сумму М компонент и может быть записана выражением:

Каждый компонент является D - мерной гауссовой функцией распределения вида:

Полностью модель гауссовой смеси определяется векторами математического ожидания, ковариационными матрицами и весами смесей для каждого компонента модели:

где i = 1,...,M.

Стоит отметить, что модель гауссовых смесей достаточно часто используется в системах распознавания человека по голосу. Чтобы данный метод работал, нам нужно найти векторы средних, веса компонентов и матрицы ковариации. Для этого используем EM - алгоритм (Expectation-maximization). На начальном этапе используются начальные значения параметров модели, но на каждом последующем шаге алгоритма осуществляется переоценка этих параметров. Чтобы найти начальные параметры используют алгоритм K-средних. Переоценка параметров осуществляется по формулам, представленным ниже:

  • Estimation-step (вычисление апостериорных вероятностей)

;

  • Maximization-step (вычисление новых параметров модели)

Все это продолжается до того момента, пока наши параметры не сойдутся.

2.6.4 Метод ближайшего соседа

Суть данного метода заключается в том, что сравниваются все векторы записанной последовательности. Это происходит с целью расчета расстояния, которое является минимальным между каждым вектором текущей последовательности и каждым вектором уже зарегистрированного "шаблона". Чтобы получить финальную оценку, эти расстояния усредняются:

.

2.7 Аналогичные программы

В настоящие время выбор систем идентификации личности по голосу не так и огромен. Данные биометрические системы появились в России в 90-х годах. Стоит отметить, что особого распространения они не получили, так как это было больше похоже на роскошь, и стоили они порядка 12000$. Сегодня же идентификация по голосу становится более актуальной, и стоимость систем с того времени упала практически в 10 раз.

Разберем две аналогичные системы идентификации личности по голосу:

VoiceKey

VoiceKey – это мультифункциональная биометрическая платформа, которая работает дистанционно [6]. VoiceKey используют для идентификации пользователей по характеристикам его голоса, а так же лица, выявления злоумышленников, защиты корпоративной информации, обеспечения безопасности передачи данных через интернет в мобильном приложении или личном кабинете на сайте.

Преимущества:

  • кроме поддержки голосовой биометрии, так же используется лицевая биометрия;

  • масштабность;

  • независимость от языка произношения;

  • настройка прав доступа.

VoiceNet

Идентификация или верификация в технологиях VoiceNet осуществляется по заданным парольным фразам [7]. Как правило, их продолжительность составляется 5 секунд и дольше. В качестве уникальных параметров используется голос человека. Изначально VoiceNet создан для работы с телефонными каналами.

Преимущества:

  • возможность удаленной идентификации;

  • близкая к невозможному имитация голоса пользователя с помощью записывающего устройства;

  • исключена идентификация пользователя, который находится под давлением злоумышленников, так как это влияет на его эмоциональное состояние (программа неустойчива к данным ситуациям);

  • возможность одновременной идентификации по голосу и распознаванию речи (произнесенный пароль).