
- •Глава 12. Цифровое представление звуковых сигналов
- •12.1. Аналого-цифровое преобразование
- •12.2. Равномерное квантование
- •12.3. Неравномерное квантование
- •12.4. Предыскажения при цифровой передаче сигналов звукового вещания
- •12.5. Цифро-аналоговое преобразование
- •12.6. Цифровая обработка звуковых сигналов
- •12.7. Достоверность цифровой передачи
- •12.8. Методы обнаружения и коррекции ошибок в цифровых звуковых сигналах
- •12.9. Кодирование с плавающей запятой
- •12.10. Редукция аудиоданных, обусловленная психоакустическими особенностями
- •12.11. Форматы цифровых сигналов и организация стыков цифровых трактов
- •12.12. Изменение частоты дискретизации
- •12.13. Структура цифрового сигнала в стандарте мреg-1 iso/iес 11172-3
- •12.14. Особенности стандарта mpeg–2 iso/iec 13818
- •12.15. Структура аудиоданных в стандарте мреg-2 iso/iec 13818-3
- •12.16. Обработка сигналов в среде мультимедиа
Глава 12. Цифровое представление звуковых сигналов
Контрольные вопросы
Поясните принципы аналого-цифрового преобразования.
Нарисуйте спектр АИМ колебания. В каких случаях может возникнуть эффект наложения спектров?
3. Сравните равномерное и неравномерное квантования отсчетов ЗС с точки зрения скорости передачи и отношения сигнал/шум.
4. Поясните понятие натурального и симметричного кодов.
5. В чем заключаются особенности равномерного квантования?
6. Поясните достоинства кодирования ЗС при повышенной частоте дискретизации.
7. Поясните сущность неравномерного квантования ЗС.
8. Какие законы компрессии обычно применяются в 3В? Поясните их особенности и принципы реализации.
9. В чем заключается сущность предискажений при цифровой обработке сигналов ЗВ?
10. Перечислите основные трудности в реализации цифро-аналогового преобразования.
11. Перечислите виды цифровой обработки ЗС.
12. Чем определяется достоверность цифровой звукопередачи?
13. В чем состоит обнаружение и исправление ошибок при передаче цифровых ЗС? Поясните особенности каждого из применяемых методов
14. Поясните принцип кодирования с плавающей запятой.
15. Почему можно говорить о психоакустической избыточности цифровых ЗС и как можно ее уменьшить?
16. Поясните методы компрессии аудиоданных.
17. Перечислите основные особенности системы кодирования "MUSICAM".
18. Поясните основные форматы цифровых ЗС.
19. Опишите алгоритм компрессии аудиоданных, основанный на учете свойств слуха.
20. Поясните сущность процесса передискретизации.
21. Поясните особенности стандарта MPEG-2.
22. Какова структура аудиоданных в стандарте MPEG-2.
23. Поясните области использования мультимедиа.
24. Перечислите способы компрессии аудио- и видеоданных.
12.1. Аналого-цифровое преобразование
Среди методов цифрового представления ЗС наиболее известна импульсно-кодовая модуляция (ИКМ). Процедура преобразования аналогового сигнала в цифровой состоит из трех операций: дискретизации по времени, квантовании полученной совокупности отсчетов и замене квантованных значений сигнала последовательностью чисел (кодировании).
А
налоговый
сигнал при аналого-цифровом преобразовании
представляется последовательностью
чисел (цифр), которая при обратном
цифро-аналоговом преобразовании
преобразуется в исходные непрерывные
изменения напряжения во времени,
т.е. исходный аналоговый ЗС. В простейшем
случае преобразование можно представить
как результат измерения мгновенных
значений напряжения через постоянные
промежутки времени (дискретизации)
с последующим преобразованием
полученной совокупности значений
отсчетов в цифровую последовательность
чисел, каждое из которых может запоминаться
и далее подготавливаться для обработки
и передачи.
Процесс аналого-цифрового преобразования звуковых сигналов в цифровую последовательность показан на рис. 12.1. Здесь в верхней части (рис. 12.1,а) изображен исходный аналоговый ЗС, в средней части (рис. 12.1,б) – процесс дискретизации (по оси ординат отложены величины мгновенных значений дискретизированного сигнала в вольтах, а по оси абсцисс – текущее время), в нижней части (рис. 12.1,в) дан результат преобразования значений отсчетов в соответствующие им кодовые слова (процедура кодирования), представленные на этом рисунке в виде нулей и единиц. При этом строка "Передача"(или "трансмиссия")соответствует кривой изменения напряжения во времени при последовательной во времени цифровой передаче полученной последовательности чисел (кодовых слов). Естественно, при параллельной передаче каждая цифра нуждалась бы в собственной шине (линии) данных. В данном случае цифровое напряжение в каждой такой отдельной линии изменялось бы с гораздо меньшей скоростью, чем это показано на рис. 12.1,в.
В устройстве, осуществляющем ИКМ (рис. 12.2,а), входной сигнал S(t) ограничивается по полосе ФНЧ и поступает в АИМ-модулятор, где происходит его дискретизация. Выходной сигнал АИМ-модулятора представляет собой временную последовательность отсчетов (рис. 12.1.б), отстоящих один от другого на интервал времени Tд, называемый периодом дискретизации. Величина fд, обратная периоду (интервалу) дискретизации Tд (fд = 1/Tд), называется частотой дискретизации. Сигнал, показанный на рис. 12.1.б называется дискретным. Спектр такого сигнала (рис. 12.2,б) содержит низкочастотную компоненту (заштрихованная область), тождественную по форме спектру входного сигнала, и множество высокочастотных компонент, каждая из кото рых состоит из двух боковых полос модуляции, расположенных вокруг частоты дискретизации или ее гармоники. Теоретически спектр такого колебания простирается до бесконечности. В кодере (см. рис. 12.2,б) выходной сигнал АИМ-модулятора квантуется по уровню и кодируется. Квантование и кодирование, как правило, осуществляются общим функциональным блоком, однако при анализе качественных характеристик метода ИКМ удобно рассматривать эти операции раздельно. Рассмотренная схема является простейшей. Реальные ИКМ-преобразователи содержат и некоторые другие функциональные блоки, уменьшающие погрешности преобразования, что будет рассмотрено позже.
Дискретизация. Значение частоты дискретизации ограничивает разрешающую способность аналого-цифрового преобразования во времени и, следовательно, наивысшую возможную частоту на входе АЦП. Наглядной иллюстрацией этого служит рис. 12.3. Процедура дискретизации с одной и той же частотой fд представлена на рисунке одновременно для двух тональных сигналов низкой (F1 – сплошная линия) и высокой (F2 – штриховая линия) частот. В обоих случаях после дискретизации имеем идентичные временные последовательности значений отсчетов. Следовательно, сигналы этих двух частот F1 и F2 нельзя различить и после обратного преобразования правильно восстановить (реконструировать).
В соответствии с теоремой отсчетов В.А. Котельникова неискаженная передача непрерывного (аналогового) сигнала с полосой частот 0…Fтах дискретной последовательностью его отсчетов возможна только в том случае, если частота fд связана с максимальной частотой Fmах исходного сигнала соотношением
fд
2
Fтах
. (12.1)
Итак,
если требуется передать синусоидальное
колебание с частотой 20 кГц, то
требуемая частота его дискретизации
должна быть более
40
кГц, лишь в этом случае возможно точное
восстановление непрерывного сигнала.
Все
сигналы, частота которых F
>
fд/2,
при восстановлении интерпретируются
неправильно и трансформируются в
сигналы более низкой частоты.
Дискретизированный сигнал можно представить в следующих двух формах записи:
где
s(t) – исходный аналоговый сигнал;
t
– интервал (период, шаг) дискретизации,
причем Тд =
t
= const; п
=
О, 1, 2,...;
(t)
–
функция Дирака;
(т) –
функция отсчетов, причем
п – моменты появления отсчетов ЗС.
При передаче ЗС или его обработке шаг дискретизации Тд не обязан быть одним и тем же в разных трактах канала или на разных стадиях обработки
Рассмотрим теперь условия выбора частоты fд. Из рис. 12.2,б следует, что чем больше fд по сравнению с Fтах, тем дальше в спектре дискретизированного сигнала разнесены частоты Fтах и fд и тем легче в ИКМ-демодуляторе отфильтровать полезный сигнал. В то же время скорость цифрового потока при ИКМ прямо пропорциональна значению fд. С точки зрения повышения эффективности канала связи при передаче сигналов 3В желательно насколько это возможно снизить fд. Однако выбор слишком низкого значения может привести к уменьшению допустимого значения Fтах и, как следствие, к ухудшению качества передачи. Поэтому значение fд выбирают исходя из компромисса между требуемым качеством звуковоспроизведения и допустимой скоростью цифрового потока. Влияют на выбор fд и системные факторы. Поскольку в системах связи сигналы 3В кодируются и передаются совместно с другими, например с телефонными сигналами, то частота дискретизации ЗС должна быть кратна частоте дискретизации телефонного сигнала. В противном случае в общей структуре цифрового потока системы связи невозможно обеспечить передачу более широкополосных сигналов 3В вместо нескольких телефонных. С учетом этих соображений при АЦП сигналов 3В в цифровых трактах первичного и вторичного распределений программ для ЗС с Fmах = 15 кГц принято значение fд = 32 кГц. что соответствует учетверенному значению fд для сигнала в телефонном канале.
В системах телевидения при передаче цифровых сигналов звукового сопровождения во избежание биений между гармониками строчной частоты и частоты дискретизации значение fд выбирается кратной частоте строчной развертки. В трактах формирования программ при Fmax = 20 кГц принято значение fд = 48 кГц, в лазерных проигрывателях и бытовых магнитофонах fд = 44,1 кГц.
Борьба с погрешностями цифрового преобразования из-за возможной нестабильности частоты дискретизации сводится к ограничению полосы частот ЗС фильтрами с полосой пропускания от 0 до Fmax на входе АЦП и выходе ЦАП и к выполнению требования теоремы В.А. Котельникова. Предъявляются жесткие требования к крутизне спада частотных характеристик ФНЧ за пределами полосы пропускания и стабильности частоты тактовых генераторов. Выполнение этих требований сегодня не вызывает трудностей.
Квантование. При квантовании непрерывному множеству мгновенных значений отсчетов аналогового сигнала ставят в соответствие конечное множество значений – уровней квантования. Иначе говоря, каждое значение отсчета заменяется ближайшим к нему разрешенным значением.
Расстояние между соседними разрешенными уровнями квантования называют шагом квантования. Процедуру квантования можно рассматривать как результат прохождения входного сигнала через устройство с амплитудной характеристикой ступенчатой формы (рис. 12.4), которая называется характеристикой (или шкалой) квантования. Если в пределах этой характеристики шаг квантования постоянен (Xi, – Xi-1 = и Yi, – Yi-1 = ), то квантование называют равномерным (рис. 12.4.а). Этот простейший вид квантования широко используется в цифровой технике. Он удобен для начального цифрового представления ЗС с целью их последующей обработки, а также последующего сокращения избыточности цифровых сигналов при передаче их по каналам связи. Равномерное квантование часто служит также первым этапом для последующего неравномерного квантования.
Наряду с частотой дискретизации точность передачи сигнала при его цифровом представлении зависит от того, как далеко отклоняется последовательность чисел после АЦП от истинных значений исходного аналогового сигнала (рис. 12.5,а). Квантование сигналов неизбежно сопровождается погрешностью. Разность между исходными и квантованными значениями отсчетов изображена на рис. 12.5,б. Этот сигнал ошибок называют шумом квантования. Чем меньше величина шага Д при квантовании отсчетов дискретизированного сигнала, тем меньше по уровню этот шум квантования. Он возникает в результате детерминированного нелинейного преобразования входного сигнала и имеет неслучайный характер. Поэтому при квантовании правильнее говорить об искажениях, а не о шумах квантования.
Характеристика квантования (см. рис. 12.4,а) имеет две зоны: квантования при Uвх < Uогр и ограничения при Uвх > Uогр. Зона квантования является рабочей областью характеристики. В ее пределах выполняется квантование сигнала. Если мгновенное значение сигнала выйдет за пределы зоны квантования, то выходное напряжение будет оставаться неизменным и равным Uвыхmax независимо от значения Uвх. Возникающие при этом искажения имеют характер безынерционного ограничения сигнала и считаются недопустимыми. Разность между исходным и ограниченным сигналами называют шумом ограничения. Итак, квантование – это безынерционно-нелинейное преобразование сигнала, при котором (в отличие от дискретизации) сигнал нельзя передать со сколь угодно малой ошибкой ни при каком конечном шаге квантования.
Кодирование.
Этой процедурой называют представление
каждого уровня квантования Yi,
из множества {
Yi}
(или каждого квантованного значения
отсчета s(
i)
из множества {s(
i)}
соответствующей ему конечной кодовой
группой символов, называемой кодовым
словом.
Если код выбран и множество его слов
есть А,
то операция кодирования представляет
собой взаимно однозначное отображение
множества {s(
i)}
в множество A. Чаще всего кодирование
заключается в замене квантованного
отсчета, которое можно рассматривать
как некоторое число, его представлением
в двоичной системе счисления. Двоичные
кодовые слова имеют всего два кодовых
символа 0 и 1. Число у
в двоичной системе счисления представляется
в виде
(12.3)
где
т
–
число разрядов (символов) в кодовом
слове: а
–
число, принимающее значение 0 или 1.
Разрядность двоичного кода т (число
символов в кодовом слове) ставится в
зависимость от количества разрешенных
уровней квантования из множества {Yi},
которое равно Ymax.
Двоичным
m-разрядным
кодом можно представить
различных кодовых слов и каждому
числу из множества {Yi}
должно соответствовать определенное
кодовое слово. Поэтому справедливо
выражение
Ymax
(12.4)
которым пользуются для согласованного выбора пары чисел т и Ymax. Обычно в выражении (12.4) при первичном кодировании принимают знак равенства. Из общего числа элементов множества {Yi} половина отводится для передачи мгновенных значений положительных полуволн ЗС, а другая половина – для передачи отрицательных полуволн. Каждая полуволна кодируется т – 1 двоичных разрядов.
Кодовая
комбинация, соответствующая числу п,
содержит передаваемые последовательно
символы
Необходимое для кодирования число
разрядов при данном максимальном числе
уровней шкалы квантования пmах
определяется из выражения т
=
1оg2(
пmах).
Если кодовое слово содержит т
символов 0 и 1, то с помощью такого т
разрядного двоичного кода можно
закодировать числа до пmах
=
.
Так при т
= 7 имеем максимальное число разрешенных
уровней квантования, равное пmах
= 128, т
= 8 соответственно
пmах =
256 и при т
= 16 соответственно пmах
= 65536.
Двоичные
символы 0 и 1, входящие в состав кодовых
слов, называют битами.
Это слово произошло от английского
"bit", составленного из начальных и
конечной буквы словосочетания "binary
digit", что в переводе с английского
означает "двоичная цифра". Биты в
кодовом слове имеют разный вес. Наименьший
вес имеет младший бит
,
несущий информацию об одном шаге
квантования. Старший значащий бит
несет информацию о
шагах квантования и имеет наибольший
вес. Пусть, например, кодируется отсчет,
имеющий уровень квантования п
= 115, а характеристика квантователя имеет
максимальное число разрешенных уровней
квантования пmах
= 256. В этом случае кодовое слово будет
иметь число разрядов т
= 1оg 256 =
8 и кодируемый квантованный отсчет
сигнала записывается в двоичной системе
следующим образом:
и соответствующее ему кодовое слово имеет вид 01110011. Такой код называют натуральным.
В цифровых системах связи и вещания распространены так называемые симметричные коды. Они характеризуются тем, что первый разряд кодового слова определяется полярностью сигнала, а остальные разряды несут информацию об абсолютном значении (модуле) кодируемого отсчета. Если кодируется сигнал положительной полярности, то первым битом кодового слова является 1, а если отрицательной полярности, то 0. Разнополярные отсчеты, равные по абсолютному значению, в этом случае отличаются только первым символом в кодовом слове.
Последовательность m-разрядных кодовых слов является выходным сигналом аналого-цифрового преобразования. Обычно при передаче и записи к выходному сигналу АЦП добавляется дополнительная информация, служащая для повышения достоверности передачи и синхронизации. При этом кодовые слова, подвергаемые одновременной обработке, объединяются в блоки. Порядок следования кодовых слов и отдельных символов в блоке называется форматом кода.