
- •Глава 12. Цифровое представление звуковых сигналов
- •12.1. Аналого-цифровое преобразование
- •12.2. Равномерное квантование
- •12.3. Неравномерное квантование
- •12.4. Предыскажения при цифровой передаче сигналов звукового вещания
- •12.5. Цифро-аналоговое преобразование
- •12.6. Цифровая обработка звуковых сигналов
- •12.7. Достоверность цифровой передачи
- •12.8. Методы обнаружения и коррекции ошибок в цифровых звуковых сигналах
- •12.9. Кодирование с плавающей запятой
- •12.10. Редукция аудиоданных, обусловленная психоакустическими особенностями
- •12.11. Форматы цифровых сигналов и организация стыков цифровых трактов
- •12.12. Изменение частоты дискретизации
- •12.13. Структура цифрового сигнала в стандарте мреg-1 iso/iес 11172-3
- •12.14. Особенности стандарта mpeg–2 iso/iec 13818
- •12.15. Структура аудиоданных в стандарте мреg-2 iso/iec 13818-3
- •12.16. Обработка сигналов в среде мультимедиа
12.3. Неравномерное квантование
Общие сведения
Наряду с равномерным (линейным) квантованием, при котором шаг квантования постоянен в пределах всего динамического диапазона изменения уровней, существует возможность согласования величины шага квантования с амплитудой сигнала. При этом для малых уровней сигнала величина шага квантования может быть малой, а для больших – соответственно более грубой. Правда, в этом случае вместе с изменением величиной сигнала и соответственно шага квантования меняется и мощность шумов квантования: она возрастает с ростом амплитуды сигнала. Неравномерное квантование позволяет обеспечить требуемое высокое отношение С/Ш для слабых сигналов и определенное его уменьшение для сильных сигналов. Очевидно, что значение Рс/Ршкв должно быть во всем диапазоне изменения уровней таким, чтобы шумы квантования оставались бы неслышимыми. Если использовать логарифмическую зависимость между выходным и входным сигналами, то можно поддерживать отношение С/Ш квантования ниже заданной границы как для малых, так и для больших сигналах. Неравномерное квантование позволяет уменьшить требуемое число разрядов в кодовом слове при кодировании отсчетов и тем самым снизить скорость передачи.
Наиболее распространены два способа формирования неравномерной шкалы квантования: мгновенное и почти мгновенное компандирование.
Мгновенное компандирование
У
стройство,
реализующее неравномерное квантование
с использованием мгновенного
компандирования (рис. 12.9), состоит из
последовательно включенных сжимателя
Сж, квантующего устройства КУ с
равномерной шкалой квантования и
расширитель Расш. Итак, для реализации
неравномерного квантования используется
уже известная нам компандерная система.
Нормализованная характеристика сжатия
В
показана на рис. 12.10,а (кривая 1).
Сигнал с выхода сжимателя подвергается
равномерному квантованию. Кривая 1
показывает, что квантованию этого
сигнала с равномерным шагом
соответствует
неравномерное квантование ЗС с
шагом
н.
Расширитель включается на приемной
стороне цифрового тракта после ЦАП.
Амплитудная характеристика расширителя
(рис. 12.10,а, кривая 2)
обратна характеристике сжимателя и
расширитель должен скомпенсировать
искажения, внесенные в сигнал сжимателем.
Иными словами, коэффициенты передачи
сжимателя
Kсж
и расширителя Kрасш
для любых входных уровней ЗС должны
быть связаны соотношением KсжKрасш
= 1. Применяемый здесь сжиматель является
безынерционным устройством мгновенного
действия.
Выигрыш, получаемый от использования сжимателя, т.е. увеличение отношения С/Ш, тем больше, чем больше наклон начального участка кривой сжатия в сравнении с прямой, проходящей под углом 45°. Поскольку кривая должна проходить через точки с координатами (0,0) и (1,1), то, очевидно, что на каком-то (начальном) участке тангенс угла наклона кривой больше 1, а на другом (конечном) – соответственно меньше единицы. Это означает, что увеличение отношения С/Ш квантования на некотором участке возможно только ценой уменьшения этого отношения на другом участке. Поскольку в случае деления всего диапазона на интервалы равной ширины отношение С/Ш квантования мало при низких уровнях сигнала и относительно велико при высоких уровнях сигнала, то кривые сжатия В, определяющие увеличение отношения С/Ш квантования, имеют наибольшую крутизну наклона вблизи нуля. Крутизна наклона постепенно убывает по мере роста уровня сигнала, что влечет за собой уменьшение отношения С/Ш квантования для сигналов с высокими уровнями (рис. 12.10,а, кривая 1).
Выигрыш от применения компандера показан на рис. 12.10,б. По оси абсцисс отложен уровень сигнала на входе, по оси ординат – отношение С/Ш квантования. Прямая 7, наклоненная под углом 45° к оси абсцисс, представляет собой отношение С/Ш квантования для случая деления всего диапазона уровней на 128 интервалов постоянной ширины и при отсутствии компандерной системы. Кривая 2 также соответствует случаю деления динамического диапазона на 128 интервалов, но с использованием компандерной системы.
Из рис. 12.10,б следует, что применение компандера дает выигрыш в отношении С/Ш для сигналов с низкими уровнями пока Nвх < Nвх1 и уменьшение этого отношения при Nвх > Nвх1. Выигрыш от компандирования (см. рис. 12.10,а) имеет место пока сигнал на входе компандерной системы изменяется в пределах 0 < х < х1, изменяясь от максимума при х = 0 до нуля при х = х1, а затем принимая отрицательные значения, т.е. вызывая уменьшение отношения С/Ш в области, где х > х1, тем больше, чем больше х.
Определим оптимальный закон сжатия D, при котором отношение С/Ш квантования будет оставаться постоянным в наибольшем диапазоне изменения входных уровней. При некотором входном сигнале и uвх шаг неравномерного квантования (рис. 12.10,в)
(12.24)
Рис. 12.10. Нормализованные амплитудные характеристики сжимателя и расширителя (а); отношение С/Ш квантования в функции от уровня сигнала на входе компандерной системы: 1 – без использования компандера, 2– с использованием компандера при 128 уровнях квантования (б); к построению оптимальной характеристики компрессии (в); характеристики компрессии для разных значений коэффициента сжатия (г)
где duвых/duвх – производная характеристики компрессии. Используя выражение (12.10), для входного уровня Nвх и соответствующего ему шага квантования н, получаем
Рс/Ршкв=12(
).
(12.25)
Из (12.25) следует, что Рс/Ршкв будет оставаться постоянным, если шаг квантования возрастает пропорционально напряжению сигнала на входе. Такая шкала квантования называется пропорциональной и для нее имеем [см. (12.24) и (12.25)]:
(12.26)
Решение полученного дифференциального уравнения дает оптимальную характеристику сжатия D вида
uвых
= сln(
uвх).
(12.27)
г
де
с и
– постоянные интегрирования. Устройство
с такой характеристикой физически
нереализуемо, поскольку при uвых
имеем uвх
0.
По
этой причине на практике используют
два других закона сжатия D, несколько
отличающиеся от оптимального, но
достаточно близкие к нему – это законы
и А.
При -законе выходное и входное напряжения сжимателя связаны зависимостью вида
(
12.28)
где ln – значение коэффициента сжатия D в соответствии с Рекомендация–ми МККТТ равно 100 при цифровом представлении речевых сигналов телефонии и 15 при кодировании ЗС радиовещания и телевидения. Форма этой характеристики для разных значений р. показана на рис. 12.10,г. Отношение максимального шага квантования к минимальному при использовании -характеристики будет
(12.29)
Различие между Дщож и Дтт тем больше, чем больше коэффициент сжатия . Поэтому выбор значения и оказывает большое влияние на отношение С/Ш квантования. Увеличение улучшает отношение Рс/Ршкв для слабых сигналов и ухудшает для сильных. Уравнение (12.28) определяет характеристику сжатия Л в первом квадранте, в третьем квадранте она строится симметрично относительно точки с координатами (0,0).
Кроме сжатия D по -закону в 3В часто применяют сжатие по А-закону вида
(12.30)
где А – число, равное 87,6 в многоканальных системах передачи. При этом сигналы, напряжение которых меньше uвх < uвхmаx/А квантуются с постоянным шагом; при uвх > uвхmаx/А сигналы квантуются неравномерно с шагом, изменяющимся по логарифмическому закону. При этом при А-законе характеристика отношения Рс/Ршкв оказывается более плоской, чем при -законе.
В настоящее время в системах кодирования ЗС отказываются от аналоговых компандеров, заменяя их цифровыми. В последних плавная характеристика сжатия D заменяется линейно-ломанной аппроксимирующей функцией. В зависимости от числа используемых сегментов (отрезков прямых линий) при аппроксимации и вида закона сжатия эту линейно-ломанную зависимость обозначают буквой и двумя цифрами. Например, запись А 87,6/11 означает, что используется аппроксимация по А-закону при А = 87,6 с 11-ю аппроксимирующими отрезками или сегментами (рис. 12.11,а).
З
апись
15/11 означает, что используется
характеристика сжатия D
по
-закону
при
=
15 с ее аппроксимацией 11-ю отрезками
прямых линий (рис. 12.11,б). В пределах
каждого сегмента шаг квантования
постоянен, но при переходе от одного
сегмента к другому возрастает в 2 раза.
Число уровней квантования в пределах
каждого сегмента постоянно.
Процедура кодирования каждого отсчета в этом случае состоит в следующем. В начале определяется полярность сигнала и в зависимости от нее формируется символ первого разряда (0 или 1) кодового слова. Затем кодируется в двоичном коде номер сегмента, в пределах которого находится уровень входного сигнала. Для кодирования номера сегмента нужны трехразрядные кодовые комбинации. Далее кодируется уровень сигнала в пределах сегмента. Если число таких уровней равно 64 (как при 11-сегментном кодировании, показанном на рис. 12.11), то для кодирования номера уровня необходима шестиразрядная кодовая комбинация. Общее число разрядов в кодовом слове при этом равно 10 и структура кодового слова выглядит так: первый разряд определяет полярность сигнала, следующие три – номер сегмента и последние шесть– номер уровня в пределах сегмента.
В качестве примера на рис. 12.12 приведена зависимость отношения Рс/Ршкв от относительного изменения уровня тонального сигнала на входе (Nс–Nстаx) при отсутствии сжатия D (прямая -1), 12-сегментной аппроксимации по А-закону(кривая 2) и 11-сегментной аппроксимации по -закону (кривая 3) характеристик компрессии. При этом равномерное квантование здесь-14-разрядное, а неравномерное 11-разрядное.
И
з
рис. 12.12 видно, что для низких входных
уровней приведенные зависимости
совпадают, поскольку шаг квантования
является постоянным и равным. Для
средних и больших уровней отношение
С/Ш квантования при сжатии D
компрессии остается примерно постоянным
(кривые 2
и 3)
и достаточно высоким. Таким образом
компрессия позволяет снизить
разрядность кодового слова с 14 до 11
(14/11) и, как следствие, понизить скорость
цифрового потока примерно на 20 % по
сравнению со случаем равномерного
квантования.
Итак, при полосе частот передаваемого ЗС, равной 15 кГц, при fд, равной 32 кГц, и т = 11 скорость цифрового потока составит 352 кбит/с для монофонической передачи и 704 кбит/с для стереофонии при использовании двух равноценных каналов. Заметим, что здесь не учтены дополнительные биты, которые обычно вводятся для обнаружения и исправления ошибок. Их наличие несколько повышает требуемую для передачи высококачественных сигналов 3В скорость цифрового потока.
Почти мгновенное компандирование. При почти мгновенном компандировании обычно используют пять различных шкал квантования с равномерным шагом внутри каждой шкалы и изменяющимся при переходе от одной шкалы к другой (рис. 12.13). Выбор той или иной шкалы определяется значением максимального уровня сигнала за время, равное 1 мс. Минимальный шаг квантования имеет шкала 5 (диапазон 0), максимальный – шкала 1 (диапазон 4). Число шагов квантования у каждой из шкал одинаково и равно 512 для одной полярности сигнала. Поэтому кодовые слова, соответствующие каждому отсчету, содержат 10 разрядов.
Процедура кодирования состоит в следующем. Сначала ЗС кодируется при минимально возможном шаге квантования с разрешающей способностью 14 бит/отсчет, при этом используется стандартная ИКМ с равномерной шкалой квантования и частотой дискретизации 32 кГц. Выборки из 32 отсчетов 14-разрядных слов, что соответствует длительности сигнала в 1 мс, запоминаются, а затем в зависимости от наибольшего значения отсчета внутри каждой выборки четыре разряда из 14 отбрасываются. Для самых малых уровней (диапазон 0, см. рис. 12.13) отбрасываются четыре старших разряда. Отбрасывание одного младшего и трех старших разрядов соответствует увеличению шага квантования в 2 раза (диапазон 1), двух младших и двух старших – в 4 раза (диа пазон 2), трех младших и одного старшего – в 8 раз (диапазон 3) и, наконец, четырех младших – в 16 раз (диапазон 4, шкала 1).
Таким образом, при почти мгновенном компандировании шаг квантования зависит не от мгновенного значения сигнала, а от его максимального значения на интервале времени, равном 1 мс.
Для правильного восстановления на приемной стороне абсолютного значения каждого отсчета каждый блок из 32 отсчетов сопровождается служебной комбинацией из 3 бит, определяющей, какая из шкал квантования использовалась при передаче всех отсчетов этого блока. При этом полная скорость передачи оказывается равной 323 кбит/с на моноканал, а отношение сигнал/шум квантования на 3 дБ лучше, чем при 11-разрядном кодировании с мгновенным компандированием.
В заключение отметим, что в соответствии с Рекомендацией 660 МККР целесообразно использовать для первоначального представления сигналов 3В стандартную ИКМ с равномерным квантованием при разрешающей способности 14 бит/отсчет с последующим цифровым компандированием, применяя при этом преобразовании либо 11-сегментное 14/11 бит мгновенное компандирование по А-закону с характеристикой компрессора, показанной на рис. 12.11,а, либо 5-диапазонное 14/10 почти мгновенное компандирование с характеристикой компандирования, изображенной на рис. 12.13.
С учетом дополнительных бит, необходимых для обнаружения и исправления ошибок, могущих возникать при цифровой передаче ЗС, общая скорость цифрового потока при передаче высококачественного ЗС с полосой частот 15 кГц и частотой дискретизации 32 кГц должна составлять 384 кбит/с (моно) и 768 кбит/с (при стереопередаче, где используются два отдельных канала).
Эта скорость может быть снижена до 320 кбит/с на один высококачественный канал (Рекомендация 719 МККР). В этом случае компандирование исходного цифрового сигнала с частотой дискретизации 32 кГц при равномерном 14-разрядном кодировании должно выполняться в три этапа:
а) почти мгновенное компандирование с 5-диапазонной характеристикой компрессии и снижением разрядности от 14 до 10 бит (см. рис. 12.13);
6) разделение отсчетов s(n) на две последовательности – нечетных s(2п + 1) и четных s(2n) отсчетов и вычисление разности (2n) по формуле
(12.31)
в)
дополнительное почти мгновенное
компандирование разностного сигнала
(2n) с 3-диапазонной характеристикой
компрессии (рис. 12.14) и сниж
ением
разрядности с 11 до 9 бит. С учетом
дополнительных бит для обнаружения и
исправления ошибок скорость цифрового
потока в этом случае составит 320 кбит/с
на один канал передачи высококачественного
сигнала 3В.
Возможна также цифровая передача ЗС по каналам связи в соответствии с Рекомендацией 718 МККР. При этом исходный цифровой сигнал при частоте дискретизации, равной 32 кГц, и разрешающей способности АЦП при равномерном квантовании, равной 16 битам, преобразуется путем компандирования в 14-битовые слова методом плавающей запятой. Длина кодового блока здесь 2 мс (64 последовательных отсчета на блок), используется восемь шкал квантования, коэффициенты масштабирования передаются 3-битовым словом. Схема метода кодирования 16/14 с плавающей запятой изложена в § 12.10. С учетом дополнительных бит для защиты от ошибок, синхронизации и передачи служебных данных полная скорость цифрового потока при передаче составляет в этом случае 496 кбит/с на моноканал. Далее будут описаны другие более совершенные методы сокращения скорости передачи цифровых сигналов 3В по каналам связи.