Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
КИТ_лекции(2 четверть).docx
Скачиваний:
2
Добавлен:
01.03.2025
Размер:
66.26 Кб
Скачать
    1. Дискретизация и квантование речевых сигналов

Дискретизация непрерывных речевых сигналов осуществляется в соответствии с теоремой Котельникова и при этом осуществляется импульсная кодовая модуляция ИКМ. Выбор частоты дискретизации обусловлен условием задачи. Количество действий, выполняемых при обработке речевых сигналов, зависит от частоты дискретизации, которую необходимо по возможности снижать. Для этого перед дискретизацией регулируется сигнал, его предварительно обрабатывают аналоговым ФНЧ, устраняются высокочастотные составляющие речевого сигнала.

Для кодирования отсчета речевого сигнала решается задача выборки. Характеристика точности представления сигнала с помощью ИКМ называется шум квантования.

x[n] – исходная речевая последовательность

Q{x[n]} – оператор квантования

Перед квантованием речевой сигнал обрабатывается в компрессоре, а при восстановлении исходного сигнала применяется экспандер. Совокупность этих двух устройств – колепандр.

- восстановленный сигнал, отличается от x[n] на величину шума квантования разностного сигнала

Для предсказания речевого сигнала используется нерекурсивный цифровой фильтр.

    1. Анализ речевых сигналов во временной области

Одним из главных параметров речевых сигналов есть энергия.

Лекция №2

  1. Схема анализа и синтеза с обратной связью.

Д ля повышения натуральности воспроизводимой речи используется схема анализа и синтеза с обратной связью. В этой схеме формируется возбуждающая последовательность путем минимизации ошибки восстановления речевого сигнала.

^S[n] S[n]

Ф1 Ф2

Восстановление речевого сигнала формируется с помощью фильтров Ф1 и Ф2.

Ф1- функционирует с учетом квазипериода вокализованных участков речи.

Ф2- моделирует форматную структуру речи.

ФВ- генератор функции возбуждения.

W(z)- фильтр с периодической функцией позволяющий учесть особенности слухового восприятия.

Принцип работы схемы заключается в выборе функции возбуждения. ФВ минимизирует квадрат ошибки (МКО) восстановления звукового сигнала.

  1. Сжатие аудио сигналов.

В сравнении с речевыми сигналами аудио сигналы более широкий частотный диапазон от 10 -22 Гц.

Внутреннее ухо человека выполняет кратковременный спектральный анализ, который можно представить в виде механизма критических частотных полос. Если в критической частотной полосе несколько спектральных составляющих, то при этом наблюдается явление частотного маскирования. Его суть заключается в том, что спектральная составляющая с низким уровнем может не прослушиваться, если в этой же критической полосе имеется спектральная составляющая звука с более высоким уровнем, который повышает порог слышимости, и маскирует присутствие составляющих с низким уровнем.

Повышенный порог слышимости называется порогом маскирования. Все спектры составляющих сигналов, уровень которых ниже порога маскирования не прослушиваются. Зависимость порога маскирования от частоты определенных уровнем и частотой маскировочной составляющей, а также уровнем и частотами маскируемых спектральных составляющих.

Порог маскирования имеет максимальное значение на частоте маскирующей спектральной составляющей и снижает с преувеличений или уменьшений частоты.