Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Поволжский государственный технологический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

СТАРИКОВ_ ДИПЛОМ_ПЕЧАТЬ.docx

Скачиваний:

Добавлен:

01.07.2025

Размер:

3.42 Mб

Скачать

☆

<<< < Предыдущая 1 23 / 193 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 > Следующая >>>

2.2 Система распознавания личности

Работа систем распознавания состоит из двух этапов: - регистрация нового пользователя;

- идентификация зарегистрированного пользователя (процесс распознавания).

Каждый пользователь проходит регистрацию в системе, записав образец своего голос. Далее из образца извлекаются признаки, благодаря которым и происходит распознавание. На основе этих признаков строятся "шаблоны" пользователей. Такой "шаблон" является структурой, которая при данных признаках устанавливает степень подобия. Признаки только что записанного голоса сравниваются с признаками голоса из базы данных, после чего происходит идентификация или отказ в доступе.

Подытожив, можно выделить три основных этапа в системе распознавания личности :

Этап обработки сигналов. Здесь происходит обработка самого сигнала с целью выделить признаки, необходимые для распознавания. Речевой сигнал представлен в виде определенной последовательности векторов признаков;
Этап моделей. На данном этапе идет построение модели, так называемого шаблона, с помощью которого и высчитывается степень подобия между имеющейся моделью и признаками;
Этап принятия решений. С помощью вычисленной степени подобия и заданных порогов принимается решение.

2.3 Образец и его предобработка

2.3.1 Обрабатываемый образец

Обрабатываемым образцом, при идентификации личности по голосу, является записанный речевой сигнал. При кодировании аналоговый сигнал представляется последовательностью мгновенных измерений значений амплитуд. Для того, чтобы записать и обработать речевой сигнал, берут частоту дискретизации, которая равняется 8 или 16 кГц.

Чтобы избежать некачественное распознавание, следует избегать ряд определенных факторов, таких как:

плохая акустика в помещении;
разное расстояние от произносящего до микрофона;
несовпадение канала и др.

Например, если распознавать голос, который передается по телефону, то нельзя быть уверенным в том, что при регистрации и идентификации использовался один и тот же микрофон, а так же канал передачи. Так же следует учитывать влияние каких-либо посторонних помех.

Для того, чтобы запись была более качественной, необходимо, чтобы канал представлял собой микрофон, кабель и аналого-цифровой преобразователь.

2.3.2 Предварительная обработка

Суть предварительной обработки - обработка фильтром определенных частот, а так же удаление участков, которые не содержат речевой сигнал [3].

Чтобы на практике определить крайние точки первого слова, необходимо проделать определенные этапы предобработки.

1. Допустим, что в интервале 300мс от начала записи микрофона имеются только посторонние шумы и помехи. Разделим весь входной сигнал на 256 сегментов. Речь можно представить как:

где S - последовательность отчетов входного сигнала, t = 0,1...255.

Для первых 10 первых сегментов используем быстрое преобразование Фурье (БПФ):

где i = 0,1,...,255, а p = 0,1,...,9.

Далее идет подсчет арифметического среднего значения:

где i = 0,1,...,127 (так как наблюдается симметрия).

Среднее квадратичное отклонение считается по формуле:

Расчет порога шумов:

где , =2,33.

В итоге получим 128 значений порогов шума. Далее идет проверка каждого сегмента. Если в отдельном сегменте превышено 15 порогов, то можно с уверенностью говорить, что здесь находится начало слова. Но точность нахождения сегмента с началом слова равняется порядка 23 секунд. Чтобы определить более точное расположение начала слова, нужно разбить его на 8 отрезков, в каждом из которых будет находиться 32 отсчета. Получается, что каждый отрезок будет равен 3 мс. Все количество начальных расчетов шума следует разделить на 80 блоков, с целью вычисления модуля средней амплитуды шума:

где , =2,33.

Финальным этапом является сравнение среднего значения модуля каждого блока в сегменте, где находится слово с порогом . Если двух подряд идущих блоков выше порога , то делаем вывод, что в этом блоке находится начало слова, которое произнес пользователь при регистрации.

Ниже будут представлены блок-схемы алгоритма определения начала слова (рисунок 2.1) и алгоритма уточнения данного интервала (рисунок 2.2).

Рисунок 2.1 Блок-схема алгоритма определения начала слова

Рисунок 2.2 Блок-схема алгоритма уточнения определения начала слова

<<< < Предыдущая 1 23 / 193 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
25.11.201962.37 Кб40СС пр-ва энергии - ЛЕКЦИЯ.docx
#
01.05.20251.3 Mб11ССУ.docx
#
01.07.2025237.19 Кб6Стандарты 2.docx
#
10.07.201936.83 Кб20Становление государственности у восточных славя....docx
#
15.11.201921.32 Mб136Станок Beaver-24A Новый.doc
#
01.07.20253.42 Mб4СТАРИКОВ_ ДИПЛОМ_ПЕЧАТЬ.docx
#
03.05.2015222.29 Кб34стата 4 сем.docx
#
03.05.2015201.93 Кб70статистика 3 курс.docx
#
03.05.2015198.82 Кб17Статистика 3 курс.docx
#
19.08.2019508.42 Кб19Статистика-3 (7Р).doc
#
24.04.2019229.89 Кб8Статистич.doc