Скачиваний:
87
Добавлен:
01.05.2014
Размер:
1.92 Mб
Скачать

Лекция 15. Методы идентификации и

верификации дикторов по голосу

студент гр. 0382 Симончик К.К.

СПбГЭТУ

МО ЭВМ

Содержание

Введение, постановка задачи

Выделение речевых характеристик

Временное выравнивание речи

Принятие решения верификации

Пример работы системы

СПбГЭТУ

МО ЭВМ

Идентификация

Модели клиентов 1, 2, …,N 1 2 3 … N

Речь

Система

Личность говорящего

 

 

 

или

 

 

 

 

 

 

 

 

идентификации

«Неизвестный диктор»

 

 

 

 

 

 

 

Клиент

№1

СПбГЭТУ

МО ЭВМ

Верификация

Модели клиентов 1, 2, …,N 1 2 3 … N

Речь

 

 

«Допуск»

Допуск

 

 

Система

 

 

 

Диктор №2

 

или

 

 

 

 

 

 

 

верификации

«Отклонение»

 

 

 

 

 

 

 

 

 

 

 

СПбГЭТУ

МО ЭВМ

Критерий качества

Система

верификации

,

Коэффициент

 

K > Порог - пропуск

Сравнение с

доверия K

 

 

порогом

 

 

 

 

 

K ≤ Порог - отклонение

FRR – False Reject Rate (вероятность ошибки отклонения)

FAR – False Accept Rate(вероятность ошибки пропуска)

DCF CFR P(отклонение|клиент)P(клиент) CFAP(пропуск|злоумышленник)P(злоумышленник)

(1)

где СFR – стоимость ошибки пропуска,

 

CFA – стоимость ошибки отклонения.

 

СПбГЭТУ

МО ЭВМ

Верификация дикторов

Проблемы разработки систем верификации

Стохастичность речевых характеристик

Неравномерность произношения

Зависимость качества верификации от произношения

Этапы разработки системы верификации

Выбор речевых характеристик с индивидуальными признаками личности

Компенсация неравномерности произношения

Принятие решения о результате верификации

СПбГЭТУ

МО ЭВМ

Классификация

Системы верификации

Текстозависимые

Текстонезависимые

Динамическое

Искусственные

Скрытые

Векторное

Смешанные

Искажение

Нейронные

Марковские

Гауссовские

Квантование

Времени

Сети

Модели

Модели

 

СПбГЭТУ

МО ЭВМ

Верификация дикторов

Функциональная схема текстозависимой системы верификации

Выделение

 

 

Сегментирование

границ фразы

 

 

 

 

 

 

 

 

 

Выделение

 

Алгоритм

характеристик

 

выравнивания во

 

 

времени

 

 

 

Пропуск

Принятие решения Отклонение

СПбГЭТУ

МО ЭВМ

Речевые характеристики

Популярные речевые характеристики

Анализ банка фильтров

Коэффициенты линейного предсказания (LPC)

Кепстральные коэффициенты (FCC)

Коэффициенты отражения (LPREFC )

СПбГЭТУ

МО ЭВМ

Речевые характеристики

Анализ банка фильтров

Информативность различных частей линейного спектра неодинакова: в низкочастотной области содержится больше информации чем в высокочастотной. Поэтому для предотвращения излишнего расходования ресурсов, необходимо уменьшать число элементов, получающих информацию с высокочастотной области, или, что то же самое, сжать высокочастотную область спектра в пространстве частот. Наиболее распространенный метод – логарифмическое сжатие или приведение к mel шкале:

m 1125log 0.0016 f 1

f- частота в спектре, Гц, аm - частота в новом пространстве, mel

Mel-шкала

Банк фильтров

СПбГЭТУ

МО ЭВМ

Соседние файлы в папке Лекция15