Добавил:
СПбГУТ * ИКСС * Программная инженерия Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Специальные книги / Матюхин А. Ю. и др. Многоканальные системы передачи.pdf
Скачиваний:
527
Добавлен:
14.09.2020
Размер:
3.21 Mб
Скачать

Из последнего соотношения следует, что при обеспечении требуемых норм по помехозащищенности в 32,5 дБ необходимо полосу частот группового сигнала ИКМ расширять минимум в 12 раз в сравнении с системами передачи с ЧРК ОБП, ФРК или ВРК АИМ.

5.2.2. ИКМ кодеки с нелинейной шкалой квантования

Аналого-цифровое преобразование сигнала в АЦП с линейной характеристикой шкалы квантования обеспечивает требуемую помехоза-

щищенность (Аз > 32,5 дБ) при числе уровней квантования М = 4096, или при числе разрядов в кодовых комбинациях m = 12. Число разрядов

вкодовых комбинациях однозначно определяет минимально возможную ширину полосы частот «оцифрованного» сигнала, она расширяется

всравнении, например, с обычной АМ ОБП или ВРК АИМ минимум

в12 раз, а практически в 1520 раз. Это приводит к ухудшению экономических показателей систем передачи. В свою очередь число разрядов кодовых комбинаций при заданных пикфакторе сигнала и требуемой помехозащищенности зависит и от динамического диапазона сигнала. Следовательно, уменьшить ширину полосы частот «оцифрованного» сигнала можно только за счет сжатия динамического диапазона.

Помехозащищенность сигнала по отношению к шумам квантования для линейной шкалы определяется в виде

AЗ =10lg(Pвх / Pкв ) =10lg(uвх2 12R / Rδ12 ) = 20lg(uвх 12 / δ1 ) .

Если потребовать постоянства помехозащищенности в заданном диапазоне входных уровней, то можно определить зависимость шага квантования δ1 от мгновенного значения кодируемого напряжения uвх

δ1 = uвх100,05 Aз 12 .

Следовательно, для выравнивания защищенности при изменении уровня сигнала в широких пределах нужно применять неравномерное квантование, при котором шаг квантования имеет минимальное значение для слабых сигналов и увеличивается с увеличением уровня сигнала.

Нелинейная шкала квантования в системах передачи, использующих АЦП в форме ИКМ, может быть реализована следующими способами: сжатием динамического диапазона сигнала перед кодированием его

171

в кодере с линейной шкалой квантования и последующим его расширением после декодирования; нелинейным кодированием и декодированием; цифровым компандированием.

Все три способа равноценны, однако они отличаются не только схемными решениями, но и эксплуатационными характеристиками. Нелинейные кодеры и цифровые компандеры обеспечивают лучшую стабильность характеристик канала. Им не свойственны недостатки, имеющие место при несогласованной работе компрессора и экспандера.

Для определения характеристики квантователя-сжимателя положим, что выходной сигнал компрессора поступает на линейный квантователь с шагом δ. Тогда амплитудная характеристика нелинейного кодера будет определяться соотношением [2]

 

 

 

 

u

 

 

 

 

 

 

 

 

 

 

 

 

ln

μ

 

 

вх

 

 

+1

 

 

 

 

 

U

 

 

 

 

 

 

 

огр

 

 

uвых =Uогр

 

 

 

 

 

sign(uвх),

 

ln(μ +1)

 

 

 

где µ − коэффициент компрессии; sign(uвх) знак входного сигнала.

Кроме такой μ-характеристики на практике применяют A -харак- теристику с аппроксимацией вида

 

 

 

Au

вх

/U

огр

, 0 <

 

uвх /U

 

<1/ A,

А= 87,6,

 

 

 

 

 

 

 

 

 

 

огр

 

 

 

 

 

 

uвых =

 

 

1+ ln A

 

 

 

 

 

 

 

 

1

+ ln(Auвх /UОГР ) sign(uвх ),

 

1/ A <

uвх /Uогр

<1.

 

 

 

1+ ln A

 

 

 

 

 

Мощность шумов квантования на выходе кодера с нелинейной шкалой квантования. Мощность шума квантования на выходе кодера с нелинейной шкалой определяется суммой мощностей в каждой зоне квантования

 

 

 

 

l =M / 2

2

 

 

 

 

 

 

 

 

σкв2 =

pl

δl

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l =−M / 2

12R

 

 

 

где δl шаг квантования в l -й зоне квантования;

pl вероятность по-

падания сигнала в l -ю зону квантования и равна

 

 

 

 

P

ln2

+1)(1+

 

 

)2

 

P

P

/ P

= огр

 

 

 

с

огр .

кв

 

 

 

3 4m μ2

 

 

 

 

 

 

 

 

 

 

172

При заданной мощности шума квантования Pкв помехозащищенность определяется соотношением

Aз.кв = 6m + 4,77 20lg[ln(μ +1)].

Если μ = 255 , то для m = 7 имеем, AЗ.кв = 31,9 дБ, а при m = 8,

AЗ.кв = 37,9 дБ.

Таким образом, введение нелинейной шкалы квантования позволяет в достаточно широком динамическом диапазоне уровней входного сигнала обеспечить требуемую помехозащищенность по шумам квантования при уменьшении числа разрядов кодовых комбинаций в полтора раза в сравнении с линейной шкалой квантования.

Соответственно этому требуемая полоса частот группового цифрового сигнала с АЦП в виде ИКМ сужается также в полтора раза, т. е. она становится равной fИКМ = 8Nfmax .

Реализация ИКМ кодеков с нелинейной шкалой квантования. Выше было показано, что уменьшить в полтора раза ширину полосы частот «оцифрованного» речевого сигнала можно путем введения нелинейной шкалы квантования с µ или А характеристиками.

Построение кодеков с нелинейной характеристикой шкалы квантования может осуществляться различными методами. Один из таких методов заключается в совместном применении компандера и линейных устройств кодирования и декодирования. Если компрессор и экспандер реализуются на аналоговой элементной базе, то компрессор включается перед кодером, а экспандер – после декодера. Такой метод применялся в первых образцах аппаратуры ЦСП.

При цифровой реализации компандера компрессор включается после кодера, а экспандер – перед декодером. Кодер с неравномерной характеристикой квантования может быть реализован как единое устройство с переменными шагами квантования.

По мере совершенствования элементной базы совершенствовались и варианты АЦП. Сейчас рынок может предоставить микросхемы, в которых реализовано сразу несколько АЦП и ЦАП. По этой причине не будем изучать различные варианты построения кодеков с нелинейной шкалой квантования, а ознакомимся лишь с идеей их построения.

173

Как при аппаратной, так и при программной реализации кодеков, плавно изменяющаяся амплитудная характеристика квантователя аппроксимируется линейно-ломаной функцией. При этом весь динамический диапазон входных напряжений от Uогр до +Uогр делится на не-

сколько отрезков-сегментов. При сжатии числа разрядов кодовых комбинаций с 12 до 8 МСЭ–Т рекомендует применять 16-сегментную характеристику компандирования. Квантующая характеристика является нечетно-симметричной. Для положительных значений входного напряжения такая характеристика приведена на рис. 5.12, а.

Uвых/Uогр

 

 

 

1

 

 

 

3/ 4

 

 

 

а)

 

 

 

1/ 2

 

 

 

1/ 4

 

 

 

 

 

 

Uвх/Uогр

1/ 8

1/ 4

1/ 2

1

64δ 128δ256δ

512δ

1024δ

2048δ

10lg(Pс/Pкв), дБ

46

40

Норма 32,5 дБ

б) 34

28

22

20lg(Uвх/Uогр), дБ

–24–18

–12

–6

0

–36 –30

Рис. 5.12. а) Амплитудная характеристика компрессора, б) зависимость помехозащищенности от входного уровня

174

Она содержит в положительной области сегменты с0, с1 ,…, с7, находящиеся между точками (узлами) 0–1, 1–2, 2–3,…,7–8. Аналогичным образом строится характеристика для отрицательной области значений входного сигнала.

Четыре центральных сегмента (два в положительной и два в отрицательной областях) объединяются в один центральный сегмент, поэтому общее число сегментов на двухполярной характеристике равно 13. Каждый из 16 сегментов характеристики содержит по 16 уровней квантования, а общее число уровней равно 256, из них 128 положительных и 128 отрицательных. Каждый сегмент начинается с определенного граничного напряжения, называемого основным эталонным напряжением или просто эталоном. Эти эталоны на рис. 5.12, а указаны в начале каждого сегмента. Шаг квантования внутри каждого сегмента равномерный, а при переходе от одного сегмента к другому изменяется в 2 раза, начиная с центрального сегмента, куда входят с0 и с1. Значения основных эталонных напряжений, шагов квантования в сегментах и значе-

ния напряжений коррекции приведены в табл. 5.2.

 

 

 

При

изменении

шага

 

 

 

Таблица 5.2

квантования изменяется кру-

 

 

 

 

 

Номер

Код номера

Значение

 

Значение

тизна характеристики. Изме-

эталона

эталона

эталона

 

поправки

нение крутизны происходит

0

000

0δ

 

0,5δ

в узлах характеристики. Четы-

 

1

001

16δ

 

0,5δ

ре центральных сегмента (два

2

010

32δ

 

1δ

в положительной и два в от-

3

011

64δ

 

2δ

рицательной областях

харак-

4

100

128δ

 

4δ

5

101

256δ

 

8δ

теристики)

имеют одинако-

6

110

512δ

 

16δ

вую крутизну и равные шаги

7

111

1024δ

 

32δ

 

 

 

 

 

квантования. При таком по-

 

 

 

 

 

строении характеристики минимальный шаг квантования δ имеют сегменты с0 и с1, а максимальный 64δ – сегмент с7.

Отношение максимального шага к минимальному приблизительно соответствует коэффициенту компрессии для µ-шкалы, или параметру А для А-шкалы.

На рис. 5.12, б приведена зависимость помехозащищенности по шумам квантования от относительного уровня сигнала на входе.

175

Как следует из этого графика, нелинейная 13-сегментная шкала квантования обеспечивает требуемую помехозащищенность 32,5 дБ в динамическом диапазоне входных уровней более 36 дБ.

Рассмотрим особенности этапов кодирования и декодирования сигналов при нелинейной характеристике квантования.

Поскольку амплитудная характеристика нелинейного квантователя нечетно-симметричная, достаточно кодировать конкретное значение отсчета в какой-либо одной области, положительной или отрицательной. На первом этапе определяется полярность кодируемого отсчета. Так же, как и при линейном кодировании, здесь положительному знаку соответствует единица в крайнем левом импульсном положении кодовой комбинации, т. е. αзн =1, а при отрицательном знаке αзн = 0.

Чтобы закодировать восемь сегментов шкалы квантования, необходимо в кодовую комбинацию включить три двоичных разряда αс2, αс1, αс0 . Они располагаются справа от знакового разряда. Номера сегментов и соответствующие им кодовые комбинации приведены в табл. 5.2. В каждом сегменте располагается по 16 уровней квантования. Эти уровни кодируются с помощью четырехразрядной группы α3, α2 , α1, α0 . Четырехразрядная группа располагается справа после сегментной группы.

Таким образом, при нелинейном кодировании кодовая комбина-

ция содержит восемь разрядов αзн, αс2, αс1, αс0, α3, α2 , α1, α0 . Кодирование осуществляется за восемь тактов и включает три эта-

па. На первом этапе определяется полярность кодируемого напряжения. На втором этапе вычисляется номер сегмента, в котором находится кодируемый отсчет. На третьем этапе определяется номер уровня квантования в выбранном сегменте.

Первый этап кодирования осуществляется за 1-й такт, второй этап – за 2–4-й такты, третий этап включает 5–8-й такты кодирования. Алгоритм определения полярности отсчета такой же, как и в линейном кодере. На втором этапе кодируется узел характеристики, определяющий начало сегмента, в котором находится значение кодируемого отсчета, например, узла 0, если отсчет находится в сегменте 0, или узла 1, если отсчет находится в сегменте 1, и т. д. Для этого выбирается алгоритм работы, обеспечивающий определение узла характеристики за три

176

такта кодирования. Алгоритм поиска узла практически совпадает с алгоритмом кодирования в кодере с линейной шкалой квантования. Диаграмма работы алгоритма поиска приведена на рис. 5.13.

Номер сегмента

Эталоны

7 1024δ

6 512δ

5 256δ

4 128δ

3 64δ

2 32δ

1 16δ

0 αЗН

Знак

 

 

 

 

 

111

сегмента

 

 

 

 

 

 

 

 

 

 

 

 

 

110

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

101

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

номера

 

 

 

 

 

 

 

 

 

 

 

 

 

 

011

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

010

Код

 

 

 

 

 

 

 

 

 

 

 

 

 

001

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

000

 

 

 

 

 

 

 

 

αс2

 

αс1

 

αс0

 

 

α3

 

α2

 

α1

 

α0

 

 

 

 

 

 

 

 

 

 

Номер

 

сегмента

 

 

Номер уровня в сегменте

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 5.13. Алгоритм поиска сегмента на амплитудной характеристике кодера

Положим, что шаг квантования в 0-м и в 1-м сегментах равен δ. После опознавания знака отсчета на 1-м тактовом интервале все ячейки эталонов выставляются в нулевое состояние. В начале 2-го такта кодирования включается эталон, соответствующий 4-му сегменту, т. е. 128δ и значение отсчета а(it) сравнивается с эталонным напряжением 128δ. Если при сравнении окажется, что а(it) >128δ, то это означает, что кодируемый отсчет находится выше 4-го сегмента, в одном из сегментов 5–8, тогда эталон 128δ отключается, а включается эталон 6-го сегмента 512δ. Если при сравнении окажется, что а(it) >128δ, это означает, что значение кодируемого отсчета находится в одном из сегментов 0–3. Таким образом происходит поэтапное движение по дереву рис. 5.13 при любом значении кодируемого отсчета. Результат представляется двоичной кодовой комбинацией αc2 , αc1, αc0 .

На третьем этапе определяется и кодируется номер уровня квантования внутри выбранного сегмента, в зоне которого находится значение кодируемого отсчета. Шаг квантования внутри каждого сегмента постоянный, а число уровней квантования равно 16.

Третий этап осуществляется за четыре такта методом линейного кодирования.

177

При декодировании осуществляется обратное цифроаналоговое преобразование. Характеристика экспандирования нелинейного декодера должна быть обратной характеристике компрессии нелинейного кодера (рис. 5.14).

Uвых/Uогр

1

1/2

1/4

1/8

1/16

Uвх/Uогр

1/4 1/2 3/4 1

Рис. 5.14. Амплитудная

характеристика экспандера

Входным сигналом декодера является 8-разрядная кодовая группа, определяющая полярность и значение отсчета (номер сегмента и номер уровня квантования).

Вначале определяется знак отсчета, а затем номер сегмента в соответствии с значениями разрядов αc2 , αc1, αc0

nс = αс222 + αс121 + αс020.

После этого определяется конкретное значение отсчета.

При декодировании в дополнение к основному эталону, определяющему начало сегмента, подключаются дополнительные поправки (см. табл. 5.2). В результате введения поправки погрешность квантования становится равной ± δ/ 2. Для нулевого сегмента значение отсчета

a(it)кв0 = δ(2αзн 1)(α3 23 + α2 22 + α1 21 + α0 20 + 0,5) .

178

Для других сегментов (nc = 1, 2, …, 7) значение отсчета определяется на основании соотношения

a(it)кв1-7 = δ(2αзн 1)[242nс 1 +1,5 2nс 13 23 + α2 22 + α1 21 + α0 20 )].

При цифровой компрессии сигнал кодируют в линейном кодере с большим числом шагов квантования (с числом шагов 4096), чем это принято при аналоговой компрессии (например, 256). Затем из полученных 4096 комбинаций выбирают только 256. Способ преобразования 12-разрядных кодовых комбинаций в 8-разрядные показан в табл. 5.3.

 

 

Таблица 5.3

 

 

 

Преобразование 12-разрядного кода в 8-разрядный

Номер

Код

Код

сегмента

до компрессии

после компрессии

 

 

 

7

S1WXYZ

S111WXYZ

6

S01WXYZ

S110WXYZ

5

S001WXYZ

S101WXYZ

4

S0001WXYZ

S100WXYZ

3

S00001WXYZ

S011WXYZ

2

S000001WXYZ

S010WXYZ

S0000001WXYZ

S001WXYZ

S0000000WXYZ

S000WXYZ

Первый символ 8-разрядного кода S так же, как и до компрессии, несет информацию о знаке отсчета. Как видно из таблицы, компрессия является симметричной для положительных и отрицательных отсчетов. Второй А, третий В и четвертый С символы кодовой комбинации после компрессии определяют номер сегмента, в котором находится кодированный отсчет (номер сегмента определяется по числу нулей, стоящих перед символами WXYZ в 12-разрядной кодовой комбинации). Сегменты 1а и 1б содержат номера шагов квантования от 0 до 32, соответствующих наименьшим значениям отсчета. Символы WXYZ в неизменном виде переносятся в кодовую комбинацию после компрессии. Во втором сегменте в кодовых комбинациях после компрессии содержатся номера только 16 шагов квантования. Эти номера получают из 32 чисел, соответствующих отсчетам с амплитудами от 32 до 64 шагов квантования

179

путем отбрасывания последнего двоичного знака. Аналогично в следующих сегментах содержатся очередные группы из 16 номеров, которые получаются при отбрасывании 2, 3, ..., 6 двоичных знаков.

Принцип цифрового экспандирования аналогичен принципу цифровой компрессии. Каждой из 256 кодовых комбинаций 8-разрядного кода ставится в соответствие кодовая комбинация 13-разрядного кода (см. табл. 5.4) таким образом, чтобы после линейного декодирования квантованные отсчеты как можно точнее аппроксимировали отсчеты сигнала до кодирования.

 

 

Таблица 5.4

 

 

 

Преобразование 8-разрядного кода в 12-разрядный

 

 

 

Номер

Код

Код

сегмента

до экспандирования

после экспандирования

 

 

 

7

S111WXYZ

S1WXYZ

6

S110WXYZ

S01WXYZ

5

S101WXYZ

S001WXYZ

4

S100WXYZ

S0001WXYZ

3

S011WXYZ

S00001WXYZ

2

S010WXYZ

S000001WXYZ

S001WXYZ

S0000001WXYZ

S000WXYZ

S0000000WXYZ

Как видно из таблицы, кодовая комбинация после экспандирования отличается от кодовой комбинации перед компрессией единицей, появляющейся непосредственно после символов WXYZ. Это происходит потому, что границы шагов квантования при кодировании приняты равными ..., –U, 0, 2U, ..., в то время как для исключения чрезмерных ошибок квантования следует при декодировании создать совокупность отсчетов размером ..., –0,5U, 0,5U, 1,5U. Единица, размещающаяся за символами WXYZ, позволяет получить эти промежуточные значения.

Избыточность 12-разрядных кодовых комбинаций столь велика, что их легко можно заменить 8-разрядными и таким образом передать речевой сигнал с достаточным отношением сигнал/шум квантования. Зависимость шума квантования от уровня модулируемого сигнала остается такой же, что и при использовании аналогового компандера.

180

5.3.Дифференциальная импульсно-кодовая модуляция

Всистемах передачи с ИКМ каждый отсчет кодируется независимо от других. Если отсчеты следуют со скоростью 8000 отсчетов/с, то между соседними отсчетами появляется сильная корреляция, поскольку основная энергия речевого сигнала сосредоточена в области частот 0,4–1,0 кГц. Следовательно, изменения амплитуды между последовательными отсчетами в среднем относительно малы. Это свойство используется на практике для более экономного кодирования речи.

Можно предложить, по крайней мере, два варианта кодирования разностей между соседними отсчетами. В первом из них разностный сигнал формируется в аналоговой форме, а во втором – после аналогоцифрового преобразования. Для обоих вариантов имеет место один существенный недостаток – большие, в сравнении с обычной ИКМ, погрешности квантования. Уменьшение искажений при ДИКМ достигается введением в схему обратной связи по демодулированному сигналу. Тогда разность будет определяться между истинным значением отсчета

y(it) y(i) и предсказанным к данному моменту значением yˆ(it) yˆ(i) .

Чтобы построить оптимальный предсказатель необходимо построить адекватную модель речевого процесса. Чем ближе модель будет соответствовать реальному речевому процессу, тем точнее можно получить оценку предсказания.

Модель речевого сигнала. Модель речевого сигнала представляет собой нестационарный нормальный случайный процесс с медленно изменяющимися дисперсией и спектральной плотностью. Менее точная модель речевого процесса представляет собой нестационарный нормальный процесс с медленно меняющейся дисперсией и постоянной средней спектральной плотностью.

Спектральная плотность мощности речевого сигнала хорошо аппроксимируется соотношением

 

 

 

 

 

1

 

 

 

 

 

 

1

 

 

G( f ) =

 

 

 

 

 

 

+

 

 

 

 

 

 

,

ρ

2

+

2

( f f0 )

2

ρ

2

+

2

( f + f0 )

2

 

 

 

 

 

 

 

 

 

где ρ ≈103 Гц; f0 400Гц.

181

С помощью преобразования Фурье спектральной плотности G( f ) определяется коэффициент корреляции B(τ) = exp(τ)cos2πf0τ. Интер-

вал корреляции

речи

(рис. 5.15)

составляет несколько

миллисекунд

 

1,5

 

 

 

 

 

(не более 10 мс), длительность

 

 

 

 

 

 

звуков речи колеблется в пре-

 

 

 

 

 

 

 

делах 25–250 мс, а средняя

 

1

 

 

 

 

 

длительность звуков составля-

Амплитуда

 

 

 

 

 

 

ет 125 мс.

 

 

0,5

 

 

 

 

 

Речевой

процесс может

 

 

 

 

 

 

 

 

 

 

 

 

быть смоделирован в виде от-

 

 

 

 

 

 

 

 

0

 

 

 

 

 

клика фильтра с коэффици-

 

 

 

 

 

 

ентом передачи, соответству-

 

 

 

 

 

 

 

ющим данной

спектральной

 

-0,5 0

1

2

3

4

5

плотности, на входной, нор-

 

 

 

Время, мс

 

 

мальный процесс типа белого

 

 

 

 

 

шума.

 

 

 

Рис. 5.15. Корреляционная функция

 

 

 

Судя

по

спектральной

 

 

речевого сигнала

 

 

 

 

 

 

плотности,

коэффициент пе-

 

 

 

 

 

 

 

редачи фильтра, моделирующего речевой процесс, должен быть дроб- но-рациональной функцией частоты, содержащей нули и полюсы.

По заданному коэффициенту передачи можно построить несколько структур моделирующих фильтров: прямая реализация; параллельная реализация; каскадная реализация. В каждом из перечисленных вариантов могут быть свои подварианты.

На рис. 5.16 приведена одна из возможных структур моделирующих фильтров.

На основе выбранной модели речевого сигнала строится кодер ДИКМ (рис. 5.17). На входе предсказателя включен фильтр нижних частот для ограничения ширины спектра кодируемого сигнала. После этого аналоговый сигнал дискретизируется с частотой 8 кГц и выборки y(i) поступают на вход предсказателя. Квантованная погрешность предсказания ε(i) в аналого-цифровом преобразователе (АЦП) кодируется последовательностью двоичных символов и передается через канал в пункт приема.

182

Вход

v(i)

β3

β2

β1

β0

x2(i+1)

x1(i+1)

x0(i+1)

Выход

t

t

t

y(i)

 

 

 

x2(i)

x1(i)

 

x0(i)

α1

α2

α3

Аналоговый

вход

y(t

Рис. 5.16. Структура моделирующего фильтра

y(i)

y(i) yˆ(i)

ε(i)

Цифровой

выход

Квантователь

АЦП

yˆ(i)

 

Та

 

 

k3

 

 

k2

 

 

 

 

k1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xˆ2 (i +1)

 

xˆ1(i +1)

 

ˆ

(i

+

1) xˆ0 (i)

 

 

 

 

 

 

 

 

 

 

 

x0

 

t

xˆ2 (i)

α1

t

xˆ1(i)

α2

t

α3

Рис. 5.17. Структурная схема кодера ДИКМ

183

На приемной стороне создается такой же предсказатель, что и на передаче (рис. 5.18). Цифровой сигнал ДИКМ в цифроаналоговом преобразователе преобразуется в квантованную погрешность предсказания ε(i) , которая, согласно алгоритму кодирования, на передаче равна

Цифровой

вход

ЦАП

ε(i) = y(i) yˆ(i) .

Аналоговый

ε(i) y(i) выход

yˆ(i)

k3

k2

k1

xˆ2 (i +1)

xˆ1(i +1)

xˆ0 (i +1)

t

t

 

t

 

 

xˆ2 (i)

xˆ

(i)

xˆ

0

(i)

 

1

 

 

 

α2 α1 α0

Рис. 5.18. Структурная схема декодера ДИКМ

На выходе предсказателя приема, также как и на передаче, формируется оценка предсказания yˆ(i) , которая затем суммируется с квантованной ошибкой предсказания, образуя квантованную последовательность отсчетов речевого сигнала y(i) . Следовательно, на выходе фильтра нижних частот получается аналоговый речевой сигнал y(t) .

184

5.4. Адаптивная дифференциальная импульсно-кодовая модуляция

При построении оптимального предсказателя для ДИКМ предполагалось, что речевой процесс является стационарным. На самом деле его дисперсия и корреляционная функция медленно меняются со временем. Эффективность и рабочие характеристики кодеров ДИКМ могут быть улучшены, если они будут адаптироваться к медленно меняющейся во времени статистике источника.

Квантователь можно сделать адаптивным различными путями. Относительно простой выход сводится к использованию равномерного квантователя, который меняет значение шага квантования в соответствии с дисперсией последних отсчетов речевого сигнала. Например, краткосрочная текущая оценка дисперсии погрешности квантования может быть рассчитана для входной последовательности {y(i)} и на основе такой оценки может быть установлен размер шага.

Поскольку речевой сигнал является квазистационарным случайным процессом, то и предсказатель в системе с ДИКМ также можно сделать адаптивным. Коэффициенты предсказателя должны изменяться во времени таким образом, чтобы отразить меняющуюся статистику речевого сигнала.

Связь предсказываемого речевого процесса yˆ(i) с ошибкой предсказания ε(i) определяется соотношением [4]

N

M

yˆ(i) = −αn yˆ(i n) + bmε(i m).

n=1

m=1

Данное соотношение для погрешности оценки предсказания речевого сигнала yˆ(i) дает возможность построить видоизмененную структуру предсказателя (рис. 5.19).

Сучетом шума квантования погрешность предсказания определим

ввиде

ˆ

N

ˆ

M

 

 

ε(i) = y(i) y(i) = y(i) + αn y(i n) bm ε(i m).

 

n=1

 

m=1

185

Аналоговый

Так y(i) y(i) yˆ(i)

ε(i)

вход

Цифровой

выход

y(t)

 

 

Квантователь

 

АЦП

 

 

 

 

 

 

 

 

 

 

yˆ(i 1)

yˆ(i 2)

yˆ(i 3)

ε(i 3)

ε(i 2)

ε(i 1)

t

t

t

 

t

t

t

 

α1

α2

α3

b3

b2

b1

 

 

 

 

yˆ(i

 

 

Рис. 5.19. Структура предсказателя

Здесь черта означает, что переменная искажена шумом квантования. При пренебрежении ошибками в цифровом тракте величина ε(i) будет иметь одно и то же значение в кодере ДИКМ на передаче и в декодере на приеме. Если на приеме создать такой же предсказатель, что и на передаче, то отсчеты речевого сигнала, искаженные шумом квантования, можно вычислить следующим образом:

N

ˆ

M

 

 

y(i) = ε(i) αn y(i n) + bmε(i m),

n=1

 

m=1

а аналоговый речевой сигнал получается путем пропускания отсчетов y(i) через интерполирующий фильтр нижних частот.

Структура предсказателя построена на основе критерия минимума среднего квадрата ошибки

CKO =< ε2 (i) >=<[y(i) yˆ(i)]2 >=< y(i) +αn yˆ(i n) bmε(i m)]2

>.

 

N

M

 

 

n=1

m=1

 

Оптимальный предсказатель речевого сигнала имеет обычную рекурсивную структуру. Оптимальные параметры предсказателя вычисляются на основе градиентного алгоритма адаптации, или же алгоритма стохастической аппроксимации градиента. Для параметров прямой связи предсказателя на передаче получаем

ˆ

ˆ

CKO

ˆ

yˆ(i)

 

m =1,..., M .

bm (i +1)

= bm (i) μb

ˆ

= bm (i) + bε(i)

 

,

ˆ

 

 

bm (i)

 

bm (i)

 

 

186