Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1464

.pdf
Скачиваний:
3
Добавлен:
13.11.2022
Размер:
1.35 Mб
Скачать

При заданной скорости стробирования характеристика качества ДМ кодера ограничена двумя видами искажения (рис. 2.11). Одно называется перегрузкой по наклону. Оно вызывается размером шага , который слишком мал, чтобы следить за сигналом, имеющим крутой наклон. Второй тип искажений, названный шумом дробления, возникает от использования размера шага, который слишком велик для сигнала, имеющего малый наклон. Необходимость минимизации обоих видов искажений приводит к противоречивым требованиям для выбора размера шага . Решение сводится к выбору , который минимизирует сумму средних квадратов от двух видов искажений.

Рис. 2.11. Виды искажений при ДМ

В технической литературе были исследованы и описаны несколько других вариантов адаптивного кодирования ДМ. Один из них называют дельта-модуляцией с непрерывно меняющимся наклоном (ДМ НМН) (рис. 2.12). В ДМ НМН адаптивный параметр размера шага можно выразить так:

Параметры α, k1, k2 выбираются так, что 0< α ≤ 1 и k1 >> k2 .

21

Рис. 2.12. Блок-схема модифицированного одноотводного линейного предсказателя (дельта-модулятора)

Корреляцию поступающих на модулятор выборочных данных можно усилить посредством предварительной фильтрации данных интегратором и компенсацией этой фильтрации с помощью выходного фильтра - дифференциатора. Эта структура изображена на рис. 2.13, где интеграторы, дифференциатор и задержка выражены в терминах z-преобразования.

Кодер

Декодер

Рис. 2.13. Блок-схема модифицированного одноотводного линейного предсказателя на основе z-преобразования

22

Сигма-дельта-модуляция

Для получения выигрыша можно перегруппировать блоки прохождения сигнала. На вход кодера поступают сигналы с выходов двух цифровых интеграторов, которые затем суммируются и вводятся в контур квантования. Первая модификация состоит в том, чтобы использовать один цифровой интегратор, сдвигая два интегратора через суммирующее устройство в кодер. Вторая модификация состоит в том, что выходной фильтр-дифференциатор может быть сдвинут в декодер, что делает ненужным цифровой интегратор на входе в декодер. Таким образом декодер трансформируется в восстанавливающий фильтр нижних частот. Полученная упрощенная схема модифицированной системы ДИКМ, названная сигма-дельта-модулятором, содержит интегратор (сигма) и модулятор ДИКМ (дельта) (рис. 2.14).

Кодер

Декодер

Рис. 2.14. Сигма-дельта-модулятор

Предшествующая ошибка, образованная как разность между входом и выходом устройства квантования, помещается в регистр запаздывания для использования в качестве оценки следующей ошибки квантования. Схему прохождения сигнала можно нарисовать так, чтобы акцентировать внимание на двух входах (сигнал и шум квантования) и на двух контурах (включающий уст-

23

ройство квантования и не включающий его). Эта форма изображена на рис. 2.15 и является общепринятой для точного изображения участка обратной связи цифрового интегратора.

Кодер

Декодер

Рис. 2.15. Устройство квантования с обратной связью по шуму, изображенное как сигма-дельта-модулятор

Применение адаптивных методов снижает шум квантования и увеличивает динамический диапазон дельта-модуляторов. Одна из первых реализаций идеи дельта-модулятора с адаптивным изменением размера шага, выполненная в виде БИС, приведена в [2].

Спектральное кодирование сигнала. Линейное кодирование с предсказанием

Спектральное представление сигнала речи основано на разделении спектра на полосы нижних и верхних частот, а полос – на подполоски. Адаптивные предсказатели были созданы для предсказания или создания хороших оценок входного сигнала. В адаптивной форме предсказываемые коэффициенты вычисляются как побочная информация на основе периодического изучения входных данных. Затем разность между входом и предсказанием передается получателю для разрешения ошибки предсказания. Линейные кодеры с

24

предсказанием (LPC) (рис. 2.16) являются естественным расширением N-отводных кодеров с предсказанием.

Рис. 2.16. Блок-схема синтезатора сигнала (декодера источника) для ЛПК системы

Если коэффициенты фильтра периодически вычисляются с помощью оптимального алгоритма, предсказание является настолько хорошим, что информации об ошибке предсказания, которую нужно передавать приемнику, не существует. Вместо того чтобы передавать эти ошибки предсказания, система LPC передает коэффициенты фильтра и озвученное/неозвученное руководство к действию для фильтра. Таким образом, единственными данными, посланными в LPC, является высококачественная побочная информация классического адаптивного алгоритма. Модель LPC для синтеза голоса изображена на рис. 2.17. Побочная информация - коэффициенты LPC и параметры активации, соответствующие каждому интервалу 20 мс.

Кодер

 

 

Декодер

 

 

x(n)

 

 

 

 

~

 

 

 

Вычисление

N-отводный

 

+

 

xn

N-отводный

r(n)

активации

фильтр LPC

 

фильтр LPC

 

 

 

 

 

 

 

 

Коэффициенты

 

Вычисление

 

Коэффициенты

 

 

 

LPC

 

LPC

 

активации

 

 

 

 

 

 

Вычисление

 

Уплотнение

Разуплотнение

 

 

коэффициентов

 

 

 

 

 

 

 

 

Рис. 2.17. Модель LPC для синтеза голоса

25

Адаптивная дифференциальная импульсно-кодовая модуляция (АДИКМ)

Рассмотрим речевой кодек G.726, блочная диаграмма которого изображена на рис. 2.18. Этот стандарт кодирует выборку за выборкой, предсказывая значение каждой выборки из восстановленной речи предшествующих выборок, с использованием адаптивного предсказателя с обратной связью.

Рис. 2.18. Блочная диаграмма речевого кодера G.726

Он принимает качественную речь, преобразованную посредством 8-битового линейного преобразования с использованием А- или μ-закона со скоростью 64 Кбит/с, и выдает сжатую речь со

скоростью 16, 24, 32 и 40 Кбит/с. Кодер применяет декодер в контуре обратной связи для анализа и модификации параметров алгоритма с целью минимизации ошибки восстановления. Предсказатель использует фильтр шестого порядка для моделирования нулей и фильтр второго порядка для моделирования полюсов источника входного сигнала.

Адаптивная дифференциальная импульсно-кодовая модуляция с разделением на подполосы

Стандарт MKKTT G.722 является стандартом кодирования широкополосной речи. Широкополосное сжатие приводит к значительному улучшению качества телефонной речи, которое при-

26

ближается к качеству речи при радиовещании и в музыкальных сигналах. Данный кодер использует дополнительные фильтры нижних и верхних частот для отделения входной полосы частот в 7 кГц. После этого речь дискретизируется с частотой в 16 кГц в более высокую и более низкую подполосы, каждая из которых выбирается с частотой 8 кГц. Функции обоих фильтров и операция повторной дискретизации реализованы в цифровом фильтре, известном как квадратурный зеркальный фильтр. Независимые кодеры АДИКМ обрабатывают временные ряды сокращенных полос частот от двух фильтров и выдают скорости в 48 и 16 Кбит/с соответственно на выходе низкой и высокой полос. Блочная диаграмма широкополосного аудиокодера, работающего со скоростью 64 Кбит/с, изображена на рис. 2.19.

Рис. 2.19. Блочная диаграмма широкополосного аудиокодера

Эти кодеры представляют собой модифицированную версию речевых кодеров АДИКМ МККТТ G.721, которые используют фильтры с обратным предсказанием, основанные на закодированном разностном сигнале. Отбрасывание младшего бита коэффициентов предсказывающего фильтра позволяет этому кодеру работать как со скоростями 56 и 48 Кбит/с, так и с номинальной скоростью 64 Кбит/с. При сниженной скорости передачи битов система связи может присваивать неиспользованные биты вспомогательному потоку данных, который передается со скоростью

27

8 и 16 Кбит/с, если канал поддерживает фиксированную выходную скорость в 64 Кбит/с. Предсказатель использует структуру с 6 нулями и 2 полюсами.

Некоторые реализации экономичных кодеков

В вокодере с возбуждением остатком и линейным предсказанием (RELP) выделенный остаток экономично кодируется и передается. В RELP-вокодерах фильтр речевого тракта действует как механизм формирования шума для любого белого шума квантования, генерируемого при кодировании остатка. В ряде экспериментов доказано, что для получения хорошего качества связи достаточна передача только части спектра остатка (от 0 до 1000 Гц). Эта процедура раскрывается в [2, c. 57].

Речевой кодек цифровой сотовой системы стандарта США IS-54 использует специфицированный алгоритм, являющийся вариантом CELP, и называется кодированием с линейным предсказанием и возбуждением векторной суммой – VSELP. В этом алгоритме используется кодовый словарь. Кодовый словарь имеет предопределенную структуру, в границах которой требуется произвести некоторые вычисления, чтобы процесс поиска в словаре мог быть значительно сокращен.

На структурной схеме цифрового декодера речи показаны различные параметры, которые должны быть определены и закодированы речевым кодером. Речевой декодер использует два кодовых словаря VSELP возбуждения. Каждый имеет собственный коэффициент передачи. Оба сигнала возбуждения из кодовых словарей умножаются на соответствующие коэффициенты передачи и суммируются, чтобы создать возбуждение объединенного кодового словаря. Скорость передачи этого кодека f = = 7,95 Кбит/с. Основные параметры, которые должны быть определены и закодированы речевым кодером, приведены в табл. 2.2. Структурная схема цифрового декодера речи VSELP приведена в

[2, c. 63, рис. 2.3.1].

28

 

Таблица 2.2

Параметр

Значение параметра

Частота дискретизации

8 кГц

Длина кадра NF

160 отсчетов (20 мс)

Длина субкадра N

40 отсчетов (5 мс)

Порядок краткосрочного предска-

 

зателя NP

10

Число отводов для долговремен-

 

ного предсказания

1

 

 

Число бит в 1-м кодовом слове

 

(число базисных векторов) M1

7

 

 

Число бит во 2-м кодовом слове

 

(число базисных векторов) М2

7

В интервале времени, соответствующем речевому кадру (20 мс), передаются коды параметров, содержащие 159 бит, которые распределяются следующим образом (табл. 2.3).

 

Таблица 2.3

Параметр алгоритма

Значение параметра

Кратковременные коэффициенты

 

фильтра αi

38 бит на кадр

Энергия кадра R0

5 бит на кадр

Задержка L

7 бит на субкадр (28 бит на

 

кадр)

 

 

Кодовые слова I, H

(7+7) бит на субкадр (56 бит

 

на кадр)

Коэффициенты усиления

8 бит на субкадр (32 бита на

 

кадр)

 

 

Первый коэффициент отражения

6 бит

LPC1

 

 

 

29

 

Кодеки для европейских систем СТ-2 и DE CT

В качестве алгоритма кодирования речи для стандартов бесшнурового телефона второго поколения СТ-2 и цифровой европейской бесшнуровой системы связи DECT, предусматривающих унифицированный интерфейс, определен алгоритм АДИКМ, формирую щий поток со скоростью 32 кбит/с. Базовые функциональные схемы этих кодеков приведены на рис. 2.20.

а)

б)

Рис. 2.20. Кодер (а) и декодер (б) АДИКМ системы связи DECT

Кодек стандарта GSM

В стандарте GSM в системе кодирования речевых сигналов используется метод линейного предсказания с возбуждением регулярной последовательностью импульсов и долговременным предсказанием, т. е. метод RPE-LTP [5]. Схема приведена на рис. 2.21 и содержит следующие блоки.

30

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]