УЛА
.pdfОбщие слова:
Биометрические системы идентификации и верификации — системы, использующие для удостоверения личности людей их биометрические данные. В качестве идентификатора или пароля используются индивидуальные характеристики (отпечатки пальцев, радужная оболочка и сетчатка глаза, геометрия лица и т.д.). Однако помимо перечисленных способов также можно использовать и голос человека, что непосредственно относится к задаче в области фонетики и речевых технологий.
На консультации Скрел внезапно упомянул Марусенко и задачу установления авторства текста (письменного). Но тут я не могу придумать, как это впихнуть в фонетику.
Системы, решающие эту задачу, делятся на два больших класса – системы верификации и идентификации голоса. В настоящее время они пользуются все большей популярностью во всем мире, в силу простоты их применения.
Верификация – это процедура подтверждения личности говорящего, а идентификация – определение личности из заданного, ограниченного списка людей.
Идентификация. Речь каждого человека обладает только ему присущими отличительными чертами. Связано это с тем, что в речевой системе отсутствует понятие абсолютной нормы, как на сегментном (фонетическом) уровне, так и на уровне просодических характеристик (интонация, ритмика). Индивидуальная форма образуется под влиянием целого ряда факторов в процессе обучения (овладения) речи. Это могут быть региональные или диалектные особенности произношения отдельных звуков, дефекты речи, социальные варианты произношения звуков и интонирования.
Голос человека несёт индивидуальную информацию в силу акустических особенностей речи, которые различны и уникальны по своей природе. Но, конечно, всё не так просто, т.к. до сих пор не сформулировано, какие именно харки являются уникальными.
Есть два способа идентификации (придумали криминалисты лет 10 назад):
1)экспертный (на слух);
2)математический (при помощи теорвера и матстата).
Минус экспертной оценки: человека можно легко обмануть. Минус математического подхода: высокая чувствительность к источнику звука, каналу передачи (если говорить с другого телефона, то уже не узнает); наличие помех.
Построение классической системы распознавания дикторов происходит в три этапа: этап выделения первичных признаков, этап моделирования дикторов и этап принятия решений. Блок принятия решений используется для получения результатов на основании данных, полученных из первых двух блоков. Среди распространенных моделей голоса (дикторов) можно выделить следующие: модели на основании спектральных характеристик, статистик основного тона и смесей гауссовых распределений.
Область применения систем, определяющих личность говорящего по голосу, можно разделить на два обширных блока:
1)задачи контроля прав доступа к различным системам (примером может служить «голосовой ключ» на входе в помещения с ограниченным доступом (какойнибудь завод) или обеспечение максимально быстрого доступа к личной банковской информации по телефону)
2)анализ голоса говорящего при проведении криминалистических экспертиз и розыскной деятельности
Блаблабла: При различных чрезвычайных происшествиях, например, авиационных катастрофах, на основе записей переговоров можно восстановить обстановку и картину происшествия, определить кто произносит ту или иную фразу. Более того, по голосу возможно составить приблизительный внешний
(обликовый) портрет телефонных шантажистов, террористов и других преступников. В современной юриспруденции голос может служить явной уликой в суде.