Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Одесский национальный морской университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

КИТ_лекции(2 четверть).docx

Скачиваний:

Добавлен:

01.03.2025

Размер:

66.26 Кб

Скачать

☆

1 / 71 2 3 4 5 6 7 > Следующая >>>

Лекция №1

Анализ речевых сигналов в частотной области

Основные способы формирования речевого сигнала в частотной области называются кратковременным спектральным анализом, который может быть реализован с использованием гребенки полосовых фильтров, либо с помощью ДПФ(дискретное преобразование Фурье).

Гомоморфная обработка речевых сигналов

Речевой сигнал является сверткой случайного шума и импульсной характеристики сигнала голосового тракта. Схема гомоморфной обработки речи имеет вид:

Где D{} – оператор нелинейного преобразования

T{} – соответствует линейной инвариантной системе.

Считается, что сигнал х[n] является сверткой двух последовательностей x₁[n] и x₂[n], тогда: x[z] = x₁[z]* x₂[z]. Линейная инвариантная система пропускает на выход либо x₁[z], либо x₂[z].

D^-1{} – обратное преобразование. В результате Y[n] = x₁[n], либо Y[n]=x₂[n].

Гомоморфная обработка речи разделяет входные компоненты речи x1[n] и x2[n], соединенные во входном сигнале.

Анализ речи на основе линейного предсказания.

Анализ основывается на использовании модели речевого сигнала. Основная задача анализа речи в том, чтобы для последовательности отсчетов речевого сигнала S[n] определить коэффициент a[k] цифрового фильтра указанной модели. Этот коэффициент еще называют коэффициентом линейного предиктивного кодирования ЛПК. Они определяются при нахождении частоты основного тона при кодировании речи в соответствии с адаптивной дифференциальной импульсной кодовой модуляцией в задачах распознавания синтеза речи.

Основное допущение при использовании метода в том, что речевой сигнал на выходе голосового тракта S[n] может быть представлен в виде линейной комбинации своих предыдущих значений и значений сигналов a[k]:

, где G – коэффициент усиления, p – порядок линейного предсказания.

В этом случае передаточная функция фильтра соответствует ПФ рекурсивного фильтра.

Сжатие речевых сигналов

Данный принцип используется в схемах низкочастотной передачи речи и в мультимедийных системах. Он основывается на использовании методов линейного предсказания речи. Сжатие речевых сигналов осуществляется по схеме:

УО – устройство оценивания, с его помощью определяются коэффициенты линейного инверсного фильтра;

ВОТ – выделитель основного тона;

Т-Ш – анализатор тон-шум.

Кодер используется для кодирования коэффициентов фильтра и параметров функции возбуждения.

Обработка речевых и аудио сигналов
1. Свойства речевых сигналов

1 – генератор импульсной последовательности (ГИП)

2 – генератор случайных чисел (ГСЧ)

3 – цифровой фильтр с переменными параметрами

В соответствии с моделью вокализованные (звонкие) звуки формируются с помощью ГИП. Фрикативные (шумовые) формируются с помощью ГСЧ. Период следования импульсов на выходе ГИП соответствует основному периоду звуков, возбуждаемых голосовыми связками. ГСЧ формирует шумовой сигнал с равномерной спектральной плотностью. Амплитуда входного сигнала U[n] в цифровом фильтре определяется коэффициентом усиления G. Вокализованный звук – квазипериодические сигналы. Фрикативные звуки имеют случайный характер и более широкий частотный диапазон. Вокализованные звуки имеют большую энергию

Данная модель характеризуется:

использованием классификатора вокализованного и фрикативного звуков;
периодом основного тона;
коэффициентом усиления G;
параметрами цифрового фильтра.

Выбор способов представления речевого сигнала зависит от решаемой задачи и бывает 3-х классов:

задачи анализа речи
синтез речи по тексту
анализ сжатия речевых сигналов в схеме для передачи по компьютерным сетям.

1 / 71 2 3 4 5 6 7 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
18.11.2018243.71 Кб6КАТЯ - Ramka.doc
#
11.02.2016208.9 Кб11Квадрат Вижинера.doc
#
01.03.20251.89 Mб2Квантовая +ядро 3 семестр.doc
#
01.05.20252.5 Mб5Кваша.docx
#
11.02.201672.57 Кб17киреева отчет.docx
#
01.03.202566.26 Кб2КИТ_лекции(2 четверть).docx
#
04.09.2019389.12 Кб3ККР_Ответы.doc
#
01.05.202572.7 Кб2Класифікація інформаційних систем для потреб ан...doc
#
15.11.20181.3 Mб36Классицизм.docx
#
01.03.2025360.96 Кб3КЛизинг и аренда.doc
#
06.08.201921.98 Кб6КМУ О концепции адаптации зак-ва Укр. к ЕС.docx

Лекция №1

Анализ речевых сигналов в частотной области

Гомоморфная обработка речевых сигналов

Анализ речи на основе линейного предсказания.

Сжатие речевых сигналов

Обработка речевых и аудио сигналов

Свойства речевых сигналов