- •Лекция 15. Методы идентификации и
- •Содержание
- •Идентификация
- •Верификация
- •Критерий качества
- •Верификация дикторов
- •Классификация
- •Верификация дикторов
- •Речевые характеристики
- •Речевые характеристики
- •Речевые характеристики
- •Речевые характеристики
- •Речевые характеристики
- •Базовые принципы ДИВ
- •Параметры ДИВ
- •Принятие решения верификации
- •Принятие решения верификации
- •Принятие решения верификации
- •Принятие решения верификации
- •Системаверификации
- •Общая схема работы системы
- •Качество работы
- •Спасибо за внимание
Лекция 15. Методы идентификации и
верификации дикторов по голосу
студент гр. 0382 Симончик К.К.
СПбГЭТУ |
МО ЭВМ |
Содержание
Введение, постановка задачи
Выделение речевых характеристик
Временное выравнивание речи
Принятие решения верификации
Пример работы системы
СПбГЭТУ |
МО ЭВМ |
Идентификация
Модели клиентов 1, 2, …,N 1 2 3 … N
Речь |
Система |
Личность говорящего |
||||
|
|
|
или |
|
|
|
|
|
|
|
|||
|
|
идентификации |
«Неизвестный диктор» |
|||
|
|
|
|
|
|
|
Клиент
№1
СПбГЭТУ |
МО ЭВМ |
Верификация
Модели клиентов 1, 2, …,N 1 2 3 … N
Речь |
|
|
«Допуск» |
Допуск |
||
|
|
Система |
|
|||
|
|
|||||
Диктор №2 |
|
или |
|
|||
|
|
|||||
|
|
|||||
|
|
верификации |
«Отклонение» |
|
||
|
|
|
||||
|
|
|
|
|
|
|
СПбГЭТУ |
МО ЭВМ |
Критерий качества
Система
верификации
,
Коэффициент |
|
K > Порог - пропуск |
|
Сравнение с |
|||
доверия K |
|||
|
|||
|
порогом |
|
|
|
|
|
|
|
K ≤ Порог - отклонение |
FRR – False Reject Rate (вероятность ошибки отклонения)
FAR – False Accept Rate(вероятность ошибки пропуска)
DCF CFR P(отклонение|клиент)P(клиент) CFAP(пропуск|злоумышленник)P(злоумышленник) |
(1) |
где СFR – стоимость ошибки пропуска, |
|
CFA – стоимость ошибки отклонения. |
|
СПбГЭТУ |
МО ЭВМ |
Верификация дикторов
Проблемы разработки систем верификации
Стохастичность речевых характеристик
Неравномерность произношения
Зависимость качества верификации от произношения
Этапы разработки системы верификации
Выбор речевых характеристик с индивидуальными признаками личности
Компенсация неравномерности произношения
Принятие решения о результате верификации
СПбГЭТУ |
МО ЭВМ |
Классификация
Системы верификации
Текстозависимые |
Текстонезависимые |
Динамическое |
Искусственные |
Скрытые |
Векторное |
Смешанные |
|
Искажение |
Нейронные |
Марковские |
Гауссовские |
||
Квантование |
|||||
Времени |
Сети |
Модели |
Модели |
||
|
СПбГЭТУ |
МО ЭВМ |
Верификация дикторов
Функциональная схема текстозависимой системы верификации
Выделение |
|
|
Сегментирование |
границ фразы |
|
|
|
|
|
|
|
|
|
|
|
Выделение |
|
Алгоритм |
характеристик |
|
выравнивания во |
|
|
времени |
|
|
|
Пропуск
Принятие решения Отклонение
СПбГЭТУ |
МО ЭВМ |
Речевые характеристики
Популярные речевые характеристики
Анализ банка фильтров
Коэффициенты линейного предсказания (LPC)
Кепстральные коэффициенты (FCC)
Коэффициенты отражения (LPREFC )
СПбГЭТУ |
МО ЭВМ |
Речевые характеристики
Анализ банка фильтров
Информативность различных частей линейного спектра неодинакова: в низкочастотной области содержится больше информации чем в высокочастотной. Поэтому для предотвращения излишнего расходования ресурсов, необходимо уменьшать число элементов, получающих информацию с высокочастотной области, или, что то же самое, сжать высокочастотную область спектра в пространстве частот. Наиболее распространенный метод – логарифмическое сжатие или приведение к mel шкале:
m 1125log 0.0016 f 1
f- частота в спектре, Гц, аm - частота в новом пространстве, mel
Mel-шкала |
Банк фильтров |
СПбГЭТУ |
МО ЭВМ |