Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЦОС, УПОиС (Витязев В.В.).doc
Скачиваний:
3
Добавлен:
01.04.2025
Размер:
6.03 Mб
Скачать

3.2. Кодеры формы речевого сигнала.

К числу основных методов кодирования формы аналоговых сигналов относят: ИКМ, ДИКМ, дельта – модуляция.

ИКМ – первый мировой стандарт кодирования формы речевого сигнала со скоростью 64 кбит/c и с логарифмическим сжатием. Используется в основном как предварительное звено низкоскоростных кодеров речи. Для систем телефонии установлено, что минимальная частота спектра передаваемого сигнала fmax = 3400 Гц, согласно теореме Котельникова: для достоверной передачи такого сигнала в цифровой форме вполне будет достаточно дискретизировать с частотой fквант. = 8 кГц, что и было закреплено в рекомендации G.711, G.721. При использовании ИКМ дискретизированный сигнал подвергается квантованию по уровню. Установлено, что для достижения приемлемого качества восприятия восстановленной речи требуется 12 разрядов двоичного представления. Число уровней при этом требуемая скорость передачи достигает 96 кбит/с. При восприятии речи в области участков больших мгновенных значений требуемое число уровней квантования может быть существенно уменьшено путем неравномерного квантования. Последнее достигается компандированием по логарифмическому закону (А и М - закону). Сжатие количества бит на отсчёт до 8 позволяет достичь заданную скорость 64 кбит/с.

3.3. Дифференциальная икм.

ДИКМ – дифференциальная ИКМ – это схема кодирования с предсказанием, в которой для понижения скорости передачи используется корреляция между соседними отсчетами входного сигнала.

В ДИКМ схеме производится оценка X(nT) значения следующего отсчета, основанные на предыдущих квантованных значениях отсчетов входного сигнала x[(n-k)T], k = 1,2,…

X(nT) = a1x((n-1)T) + a2x((n-2)T) + …

Оценки Х(nT) вычитаются из действительного отсчета: E(nT) = x(nT) – X(nT) – ошибка предсказания, которая квантуется и передается в канал. Квантованный сигнал на входе предсказателя x(nT) определяется как x(nT) + E(nT) = x(nT). Декодер на приемной стороне выполняет обратное преобразование – восстановление первоначального сигнала из квантованных ошибок предсказания. Если предсказатель адаптируется к структуре сигнала, то кодер АДИКМ, то эффективность данного кодера увеличивается.

3.4. Вокодеры.

Вокодеры представляют собой устройства, осуществляющие параметрическое сжатие речевых сигналов. Компрессия речевых сигналов на передающей стороне производится в анализаторе, выделяющем из речевого сигнала медленно меняющиеся составляющие, которые передаются по каналу связи в виде кодовых посылок. На приемной стороне с помощью местных источников сигнала, управляемых принятыми параметрами синтезируется речевой сигнал. Работа вокодера основана на моделировании человеческой речи с учетом ее характерных особенностей. При вычислении непосредственного изменения амплитуды сигнала вокодера получают параметры модели речеобразования для получения другого сигнала, максимально схожего с исходным. Таким образом осуществляется анализ для последующего синтеза речи. Подсчитанные параметры передаются по каналу связи.

Вокодеры можно разделить на 2 класса:

  1. речеэлементные,

  2. параметрические.

В РЭ вокодерах при передаче распознаются разнесенные элементы речи и передаются только их номера. На приемной стороне эти элементы создаются по правилам речеобразования или берутся из памяти устройства.

В параметрических вокодерах из речевого сигнала выделяются 2 типа параметров:

  1. параметры, характеризующие огибающую спектра речевого сигнала (фильтровую функцию).

  2. параметры, характеризующие источник речевых колебаний (генераторную функцию) – частота основного тона, ее изменение во времени, моменты появления, исчезновение основного тона или шумового сигнала.

По этим параметрам на приемной стороне синтезируется речь. По принципу определения параметров фильтровой функции вокодеры различают:

  1. полосные канальные;

  2. формантные;

  3. ортогональные;

  4. с линейным предсказанием;

  5. гомоморфные.

В полосных вокодерах спектр делится на 7-20 полос (каналов) аналоговыми или цифровыми полосовыми фильтрами. Большое число каналов в вокодере дает большую натуральность и разборчивость. С каждого полосового фильтра сигнал поступает на детектор и ФНЧ с f среза достаточной для выделения огибающей канального сигнала.

В формантных вокодерах – огибающая спектра речи описывается комбинацией формант (резонансных частот голосового тракта). Основные параметры формант – центральная частота, амплитуда и ширина полосы частот.

В ортогональных вокодерах огибающая мгновенного спектра речи раскладывается в ряд по выбранной системе ортогональных базисных функций. Вычисленные коэффициенты этого разложения передаются на приемную сторону.

Вокодеры с линейным предсказанием (LPC) – основаны на оригинальном математическом аппарате, использующем линейные модели речеобразования и адаптивную обработку.

Гомоморфная обработка позволяет разделить генераторную и фильтровую функции, образующие речевой сигнал.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]