Скачиваний:
87
Добавлен:
01.05.2014
Размер:
1.92 Mб
Скачать

Речевые характеристики

где NLP

aLP

Коэффициенты линейного предсказания

NLP

 

s(n) aLP (i) s(n i) e(n)

i 1

 

- количество коэффициентов модели (порядок предсказания);

e(n)

- функция ошибки модели

- коэффициенты линейного предсказания;

Речевой сигнал звука [a]

Спектр речевого сигнала, инвертированный спектр КЛП

КЛП (порядок = 15)

СПбГЭТУ

МО ЭВМ

Речевые характеристики

Mel кепстральные коэффициенты

x(t)

FFT

MEL

LOG

DCT

c(n)

U

 

 

 

n

1

 

 

 

 

c n

log

10

S k cos

 

k

 

 

 

 

 

 

 

U

2

 

k 1

 

 

 

 

 

 

- средняя спектральная

 

- количество фильтров

где

S k мощность фильтра № k,

U

 

 

 

Рекурсивный расчет с использованием КЛП

 

 

ci ai 1

i 1

 

 

 

 

( j)ai j c j ,i 1 N.

 

 

i

j 1

 

 

где

ai - коэффициенты линейного предсказания

СПбГЭТУ

 

 

 

МО ЭВМ

Речевые характеристики

Mel кепстральные коэффициенты

МУЖСКОЙ ГОЛОС

ЖЕНСКИЙ ГОЛОС

25 мсек

25 мсек

Спектр

Кепстральные коэффициенты

СПбГЭТУ

МО ЭВМ

Базовые принципы ДИВ

Динамическое Искажение Времени

Динамическое сравнение тестовой и эталонной матриц ( множество векторов характеристик)

Вычисление расстояния тестовым и эталонным образами

Текстозависимое сравнение Оптимальный способ

До временного Q искажения

 

M

деформации

 

После временного

 

 

C

 

искажения

 

 

Q

N

C

M

Две временные последовательности Q и C, длиной N и M, соответственно

0Q N

Матрица (NxM), состоящая из расстояния между последовательностями Q и C.

N

C

M

Результирующее

соотношение

СПбГЭТУ

МО ЭВМ

Параметры ДИВ

Глобальные ограничения

Путь должен идти по диагонали

Теоретически, ГО определяют как далеко от диагонали может идти путь

Практически, ГО задают максимальное сжатие/растяжение

сигналов на больших отрезках

Полоса Сакое-Чиба Параллелограмм Итакуры

 

Допустимая область

Локальные ограничения

Диаграмма Степень переходов деформации

Не

ограниченная

Двукратная

ДП-уравнение

D(i, j 1) d (i, j)

D(i, j) min D(i 1, j 1) 2d (i, j)

D(i 1, j) d (i, j)

D(i 1, j 2) 2d (i, j 1) d (i, j)

D(i, j) min D(i 1, j 1) 2d (i, j)

D(i 2, j 1) 2d (i 1, j) d (i, j)

СПбГЭТУ

МО ЭВМ

Принятие решения верификации

ТЕСТ ЭТАЛОН

PCM запись голоса

Пространство

характеристик

Входные данные

Класс 1

- Клиент

Классификатор

Класс 2 - Злоумышленник

СПбГЭТУ

МО ЭВМ

Принятие решения верификации

Методы классификации

Нейронные сети

Статистические решающие функции

Решающие деревья

Нечеткие выводы

Линейные дискриминантные функции

СПбГЭТУ

МО ЭВМ

Принятие решения верификации

Нейронные сети

Так как в задаче верификации решением является выдача указания на пропуск или отклонение пользователя системы, следовательно, в выходном слое нейронной сети достаточно будет одного нейрона, который в случае попытки доступа клиента выдавал бы «1», а злоумышленника «–1»

 

 

 

 

Многослойный персептрон

Слой 1

Слой 2

Слой 3

 

 

y1

wijl

 

 

Выходной вектор слоя L нейронной сети

 

 

 

S l f (W l S l 1 bl )

 

 

 

 

y2

 

 

 

 

 

 

 

 

z

где W l

- матрица весовых коэффициентов

 

 

 

 

 

S l

- выходной вектор слоя l,

 

 

 

 

bl

- вектор смещения слоя l,

 

 

 

 

 

 

f ( )

- активационная функция нейронов

 

 

 

 

 

yn

 

 

 

 

 

 

СПбГЭТУ

МО ЭВМ

Принятие решения верификации

Линейные дискриминантные функции

n

d(Y ) i yi 0

i 1

где i - набор весовых коэффициентов

Редукция пространства признаков

 

 

y

 

 

 

 

 

T

test

 

ct (1)

ex

 

2

 

 

 

 

 

 

 

 

ct (1)

 

 

 

 

 

 

 

1

 

 

 

 

t 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

Y

...

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

test

 

ct (n)

ex

2

 

yn

 

 

 

 

 

ct (n)

 

 

 

 

 

 

 

 

 

 

 

 

t 1

 

 

 

 

 

 

 

 

 

где

ct (k)ex

-

 

 

k -й элемент эталонного

 

 

 

 

 

 

 

вектора речевых характеристик

 

ct (k)test

-

k -й признак тестового

 

 

 

 

 

 

 

 

 

 

 

 

вектора речевых характеристик

СПбГЭТУ

МО ЭВМ

Системаверификации

Сегментирование речи на участки 25 мс с шагом 12.5 мс

Выделение 20 Mel кепстральных коэффициентов

Алгоритм ДИВ cо степенью искажения = 3

Линейная дискриминантная функция

СПбГЭТУ

МО ЭВМ

Соседние файлы в папке Лекция15