- •Лекция 15. Методы идентификации и
- •Содержание
- •Идентификация
- •Верификация
- •Критерий качества
- •Верификация дикторов
- •Классификация
- •Верификация дикторов
- •Речевые характеристики
- •Речевые характеристики
- •Речевые характеристики
- •Речевые характеристики
- •Речевые характеристики
- •Базовые принципы ДИВ
- •Параметры ДИВ
- •Принятие решения верификации
- •Принятие решения верификации
- •Принятие решения верификации
- •Принятие решения верификации
- •Системаверификации
- •Общая схема работы системы
- •Качество работы
- •Спасибо за внимание
Речевые характеристики
где NLP
aLP
Коэффициенты линейного предсказания
NLP |
|
s(n) aLP (i) s(n i) e(n) |
|
i 1 |
|
- количество коэффициентов модели (порядок предсказания); |
|
e(n) |
- функция ошибки модели |
- коэффициенты линейного предсказания; |
Речевой сигнал звука [a]
Спектр речевого сигнала, инвертированный спектр КЛП
КЛП (порядок = 15)
СПбГЭТУ |
МО ЭВМ |
Речевые характеристики
Mel кепстральные коэффициенты
x(t) |
FFT |
MEL |
LOG |
DCT |
c(n) |
U |
|
|
|
n |
1 |
|
|
|
|
|
|||||
c n |
log |
10 |
S k cos |
|
k |
|
|
|
|
||||||
|
|
|
U |
2 |
|
||
k 1 |
|
|
|
|
|
|
- средняя спектральная |
|
- количество фильтров |
||
где |
S k мощность фильтра № k, |
U |
||||
|
||||||
|
|
Рекурсивный расчет с использованием КЛП |
||||
|
|
ci ai 1 |
i 1 |
|
|
|
|
|
( j)ai j c j ,i 1 N. |
||||
|
|
i |
j 1 |
|
|
|
где |
ai - коэффициенты линейного предсказания |
|||||
СПбГЭТУ |
|
|
|
МО ЭВМ |
Речевые характеристики
Mel кепстральные коэффициенты
МУЖСКОЙ ГОЛОС |
ЖЕНСКИЙ ГОЛОС |
25 мсек |
25 мсек |
Спектр
Кепстральные коэффициенты
СПбГЭТУ |
МО ЭВМ |
Базовые принципы ДИВ
Динамическое Искажение Времени
•Динамическое сравнение тестовой и эталонной матриц ( множество векторов характеристик)
•Вычисление расстояния тестовым и эталонным образами
•Текстозависимое сравнение Оптимальный способ
До временного Q искажения
|
M |
деформации |
|
После временного |
|
|
|
|
C |
|
искажения |
|
|
Q |
N
C
M
Две временные последовательности Q и C, длиной N и M, соответственно
0Q N
Матрица (NxM), состоящая из расстояния между последовательностями Q и C.
N
C
M
Результирующее
соотношение
СПбГЭТУ |
МО ЭВМ |
Параметры ДИВ
Глобальные ограничения
•Путь должен идти по диагонали
•Теоретически, ГО определяют как далеко от диагонали может идти путь
• Практически, ГО задают максимальное сжатие/растяжение
сигналов на больших отрезках |
Полоса Сакое-Чиба Параллелограмм Итакуры |
|
|
Допустимая область |
|
Локальные ограничения |
Диаграмма Степень переходов деформации
Не
ограниченная
Двукратная
ДП-уравнение
D(i, j 1) d (i, j)
D(i, j) min D(i 1, j 1) 2d (i, j)
D(i 1, j) d (i, j)
D(i 1, j 2) 2d (i, j 1) d (i, j)
D(i, j) min D(i 1, j 1) 2d (i, j)
D(i 2, j 1) 2d (i 1, j) d (i, j)
СПбГЭТУ |
МО ЭВМ |
Принятие решения верификации
ТЕСТ ЭТАЛОН
PCM запись голоса
Пространство
характеристик
Входные данные
Класс 1 |
- Клиент |
Классификатор
Класс 2 - Злоумышленник
СПбГЭТУ |
МО ЭВМ |
Принятие решения верификации
Методы классификации
Нейронные сети
Статистические решающие функции
Решающие деревья
Нечеткие выводы
Линейные дискриминантные функции
СПбГЭТУ |
МО ЭВМ |
Принятие решения верификации
Нейронные сети
Так как в задаче верификации решением является выдача указания на пропуск или отклонение пользователя системы, следовательно, в выходном слое нейронной сети достаточно будет одного нейрона, который в случае попытки доступа клиента выдавал бы «1», а злоумышленника «–1»
|
|
|
|
Многослойный персептрон |
|||
Слой 1 |
Слой 2 |
Слой 3 |
|
|
|||
y1 |
wijl |
|
|
Выходной вектор слоя L нейронной сети |
|||
|
|
|
S l f (W l S l 1 bl ) |
||||
∑ |
|
∑ |
|
|
|
||
y2 |
|
|
|
|
|
|
|
∑ |
|
|
∑ |
∑ |
z |
где W l |
- матрица весовых коэффициентов |
|
|
||||||
… |
|
|
|
S l |
- выходной вектор слоя l, |
||
|
|
|
|
bl |
- вектор смещения слоя l, |
||
|
|
|
|
|
|
f ( ) |
- активационная функция нейронов |
∑ |
|
∑ |
|
|
|
|
|
yn |
|
|
|
|
|
|
СПбГЭТУ |
МО ЭВМ |
Принятие решения верификации
Линейные дискриминантные функции
n
d(Y ) i yi 0
i 1
где i - набор весовых коэффициентов
Редукция пространства признаков
|
|
y |
|
|
|
|
|
T |
test |
|
ct (1) |
ex |
|
2 |
|
||
|
|
|
|
|
|
|
ct (1) |
|
|
|
|
|
|
||||
|
1 |
|
|
|
|
t 1 |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|||
Y |
... |
|
|
|
|
|
... |
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
T |
T |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
test |
|
ct (n) |
ex |
2 |
||||||||
|
yn |
|
|
|
|
|
ct (n) |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
t 1 |
|
|
|
|
|
|
|
|
|
|
где |
ct (k)ex |
- |
|
|
k -й элемент эталонного |
|
|||||||||||
|
|
|
|
|
|
вектора речевых характеристик |
|||||||||||
|
ct (k)test |
- |
k -й признак тестового |
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
вектора речевых характеристик |
СПбГЭТУ |
МО ЭВМ |
Системаверификации
Сегментирование речи на участки 25 мс с шагом 12.5 мс
Выделение 20 Mel кепстральных коэффициентов
Алгоритм ДИВ cо степенью искажения = 3
Линейная дискриминантная функция
СПбГЭТУ |
МО ЭВМ |