Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Глава 12.doc
Скачиваний:
9
Добавлен:
22.11.2019
Размер:
1.68 Mб
Скачать

Глава 12. Цифровое представление звуковых сигналов

Контрольные вопросы

  1. Поясните принципы аналого-цифрового преобразования.

  2. Нарисуйте спектр АИМ колебания. В каких случаях может возникнуть эф­фект наложения спектров?

3. Сравните равномерное и неравномерное квантования отсчетов ЗС с точки зрения скорости передачи и отношения сигнал/шум.

4. Поясните понятие натурального и симметричного кодов.

5. В чем заключаются особенности равномерного квантования?

6. Поясните достоинства кодирования ЗС при повышенной частоте дискретизации.

7. Поясните сущность неравномерного квантования ЗС.

8. Какие законы компрессии обычно применяются в 3В? Поясните их осо­бен­ности и принципы реализации.

9. В чем заключается сущность предискажений при цифровой обработке сигналов ЗВ?

10. Перечислите основные трудности в реализации цифро-аналогового преобра­зования.

11. Перечислите виды цифровой обработки ЗС.

12. Чем определяется достоверность цифровой звукопередачи?

13. В чем состоит обнаружение и исправление ошибок при передаче цифровых ЗС? Поясните особенности каждого из применяемых методов

14. Поясните принцип кодирования с плавающей запятой.

15. Почему можно говорить о психоакустической избыточности цифровых ЗС и как можно ее уменьшить?

16. Поясните методы компрессии аудиоданных.

17. Перечислите основные особенности системы кодирования "MUSICAM".

18. Поясните основные форматы цифровых ЗС.

19. Опишите алгоритм компрессии аудиоданных, основанный на учете свойств слуха.

20. Поясните сущность процесса передискретизации.

21. Поясните особенности стандарта MPEG-2.

22. Какова структура аудиоданных в стандарте MPEG-2.

23. Поясните области использования мультимедиа.

24. Перечислите способы компрессии аудио- и видеоданных.

12.1. Аналого-цифровое преобразование

Среди методов цифрового представления ЗС наиболее известна им­пульсно-кодовая модуляция (ИКМ). Процедура преобразования ана­логового сигнала в цифровой состоит из трех операций: дискретиза­ции по времени, квантовании полученной совокупности отсчетов и за­мене квантованных значе­ний сигнала последовательностью чисел (ко­дировании).

А налоговый сигнал при аналого-цифровом преобразовании пред­став­ля­ется последовательностью чисел (цифр), которая при обратном цифро-аналоговом преобразовании преобразуется в исходные непрерыв­ные изменения напряже­ния во времени, т.е. исходный аналоговый ЗС. В простейшем случае преобра­зование можно представить как результат измерения мгновенных значений на­пряжения через постоянные проме­жутки времени (дискретизации) с после­дующим преобразованием полу­ченной совокупности значений отсчетов в циф­ровую последовательность чисел, каждое из которых может запоминаться и далее подготавливать­ся для обработки и передачи.

Процесс аналого-цифрового преобразования звуковых сигналов в цифровую последовательность показан на рис. 12.1. Здесь в верхней части (рис. 12.1,а) изображен исходный аналоговый ЗС, в средней ча­сти (рис. 12.1,б) – процесс дискретизации (по оси ординат отложены величины мгновенных значений дискретизированного сигнала в вольтах, а по оси абсцисс – текущее время), в нижней части (рис. 12.1,в) дан ре­зультат преобразования значений отсчетов в соответствующие им кодо­вые слова (процедура кодирования), представленные на этом рисунке в виде нулей и единиц. При этом строка "Передача"(или "трансмиссия")соответствует кривой изменения напряжения во времени при последова­тельной во времени цифровой передаче полученной последовательности чисел (кодовых слов). Естественно, при параллельной передаче каждая цифра нуждалась бы в собственной шине (линии) данных. В данном случае цифровое напряжение в каждой такой отдельной линии изменя­лось бы с гораздо меньшей скоростью, чем это показано на рис. 12.1,в.

В устройстве, осуществляющем ИКМ (рис. 12.2,а), входной сиг­нал S(t) ограничивается по полосе ФНЧ и поступает в АИМ-модулятор, где происходит его дискретизация. Выходной сигнал АИМ-модулятора представляет собой временную последовательность отсчетов (рис. 12.1.б), отстоящих один от другого на интервал времени Tд, назы­ваемый периодом дискретизации. Величина fд, обратная периоду (ин­тервалу) дискретизации Tд (fд = 1/Tд), называется частотой дискре­тизации. Сигнал, показанный на рис. 12.1.б называется дискретным. Спектр такого сигнала (рис. 12.2,б) содержит низкочастотную компонен­ту (заштрихованная область), тождественную по форме спектру входно­го сигнала, и множество высокочастотных компонент, каждая из кото рых состоит из двух боковых полос модуляции, расположенных вокруг частоты дискретизации или ее гармоники. Теоретически спектр такого колебания простирается до бесконечности. В кодере (см. рис. 12.2,б) выходной сигнал АИМ-модулятора квантуется по уровню и кодируется. Квантование и кодирование, как правило, осуществляются общим функ­циональным блоком, однако при анализе качественных характеристик метода ИКМ удобно рассматривать эти операции раздельно. Рассмо­тренная схема является простейшей. Реальные ИКМ-преобразователи содержат и некоторые другие функциональные блоки, уменьшающие по­грешности преобразования, что будет рассмотрено позже.

Дискретизация. Значение частоты дискретизации ограничивает разрешающую способность аналого-цифрового преобразования во вре­мени и, следовательно, наивысшую возможную частоту на входе АЦП. Наглядной иллюстрацией этого служит рис. 12.3. Процедура дискрети­зации с одной и той же частотой fд представлена на рисунке одновре­менно для двух тональных сигналов низкой (F1 – сплошная линия) и высокой (F2 – штриховая линия) частот. В обоих случаях после дис­кретизации имеем идентичные временные последовательности значений отсчетов. Следовательно, сигналы этих двух частот F1 и F2 нельзя различить и после обратного преобразования правильно восстановить (реконструировать).

В соответствии с теоремой отсчетов В.А. Котельникова неиска­женная передача непрерывного (аналогового) сигнала с полосой частот 0…Fтах дискретной последовательностью его отсчетов возможна толь­ко в том случае, если частота fд связана с максимальной частотой Fmах исходного сигнала соотношением

fд 2 Fтах . (12.1)

Итак, если требуется передать синусоидальное колебание с частотой 20 кГц, то требуемая частота его дискретизации должна быть более 40 кГц, лишь в этом случае возможно точное восстановление непре­рывного сигнала. Все сигналы, частота которых F > fд/2, при восста­новлении интерпретируются неправильно и трансформируются в сиг­налы более низкой частоты.

Дискретизированный сигнал можно представить в следующих двух формах записи:

где s(t) – исходный аналоговый сигнал; t – интервал (период, шаг) дискретизации, причем Тд = t = const; п = О, 1, 2,...; (t) – функция Дирака; (т) – функция отсчетов, причем

п – моменты появления отсчетов ЗС.

При передаче ЗС или его обработке шаг дискретизации Тд не обя­зан быть одним и тем же в разных трактах канала или на разных ста­диях обработки

Рассмотрим теперь условия выбора частоты fд. Из рис. 12.2,б сле­дует, что чем больше fд по сравнению с Fтах, тем дальше в спектре дискретизированного сигнала разнесены частоты Fтах и fд и тем легче в ИКМ-демодуляторе отфильтровать полезный сигнал. В то же время скорость цифрового потока при ИКМ прямо пропорциональна значе­нию fд. С точки зрения повышения эффективности канала связи при передаче сигналов 3В желательно насколько это возможно снизить fд. Однако выбор слишком низкого значения может привести к уменьше­нию допустимого значения Fтах и, как следствие, к ухудшению каче­ства передачи. Поэтому значение fд выбирают исходя из компромисса между требуемым качеством звуковоспроизведения и допустимой ско­ростью цифрового потока. Влияют на выбор fд и системные факто­ры. Поскольку в системах связи сигналы 3В кодируются и передаются совместно с другими, например с телефонными сигналами, то часто­та дискретизации ЗС должна быть кратна частоте дискретизации теле­фонного сигнала. В противном случае в общей структуре цифрового потока системы связи невозможно обеспечить передачу более широко­полосных сигналов 3В вместо нескольких телефонных. С учетом этих соображений при АЦП сигналов 3В в цифровых трактах первичного и вторичного распределений программ для ЗС с Fmах = 15 кГц принято значение fд = 32 кГц. что соответствует учетверенному значению fд для сигнала в телефонном канале.

В системах телевидения при передаче цифровых сигналов звуко­вого сопровождения во избежание биений между гармониками строч­ной частоты и частоты дискретизации значение fд выбирается кратной частоте строчной развертки. В трактах формирования программ при Fmax = 20 кГц принято значение fд = 48 кГц, в лазерных проигрыва­телях и бытовых магнитофонах fд = 44,1 кГц.

Борьба с погрешностями цифрового преобразования из-за возмож­ной нестабильности частоты дискретизации сводится к ограничению по­лосы частот ЗС фильтрами с полосой пропускания от 0 до Fmax на входе АЦП и выходе ЦАП и к выполнению требования теоремы В.А. Котельникова. Предъявляются жесткие требования к крутизне спада частотных характеристик ФНЧ за пределами полосы пропускания и стабильности частоты тактовых генераторов. Выполнение этих требований сегодня не вызывает трудностей.

Квантование. При квантовании непрерывному множеству мгно­венных значений отсчетов аналогового сигнала ставят в соответствие конечное множество значений – уровней квантования. Иначе гово­ря, каждое значение отсчета заменяется ближайшим к нему разрешен­ным значением.

Расстояние между соседними разрешенными уровня­ми квантования называют шагом квантования. Процедуру квантова­ния можно рассматривать как результат прохождения входного сигнала через устройство с амплитудной характеристикой ступенчатой формы (рис. 12.4), которая называется характеристикой (или шкалой) квантования. Если в пределах этой характеристики шаг квантования по­стоянен (Xi, – Xi-1 = и Yi, – Yi-1 = ), то квантование называют равномерным (рис. 12.4.а). Этот простейший вид квантования широко используется в цифровой технике. Он удобен для начального цифрового представления ЗС с целью их последующей обработки, а также последу­ющего сокращения избыточности цифровых сигналов при передаче их по каналам связи. Равномерное квантование часто служит также первым этапом для последующего неравномерного квантования.

Наряду с частотой дискретизации точность передачи сигнала при его цифровом представлении зависит от того, как далеко отклоняется последовательность чисел после АЦП от истинных значений исходно­го аналогового сигнала (рис. 12.5,а). Квантование сигналов неизбежно сопровождается погрешностью. Разность между исходными и кванто­ванными значениями отсчетов изображена на рис. 12.5,б. Этот сигнал ошибок называют шумом квантования. Чем меньше величина шага Д при квантовании отсчетов дискретизированного сигнала, тем меньше по уровню этот шум квантования. Он возникает в результате детер­минированного нелинейного преобразования входного сигнала и имеет неслучайный характер. Поэтому при квантовании правильнее говорить об искажениях, а не о шумах квантования.

Характеристика квантования (см. рис. 12.4,а) имеет две зоны: кван­тования при Uвх < Uогр и ограничения при Uвх > Uогр. Зона квантования является рабочей областью характеристики. В ее пределах выполняет­ся квантование сигнала. Если мгновенное значение сигнала выйдет за пределы зоны квантования, то выходное напряжение будет оставаться неизменным и равным Uвыхmax независимо от значения Uвх. Возника­ющие при этом искажения имеют характер безынерционного ограниче­ния сигнала и считаются недопустимыми. Разность между исходным и ограниченным сигналами называют шумом ограничения. Итак, кван­тование это безынерционно-нелинейное преобразование сигнала, при котором (в отличие от дискретизации) сигнал нельзя передать со сколь угодно малой ошибкой ни при каком конечном шаге квантования.

Кодирование. Этой процедурой называют представление каждого уровня квантования Yi, из множества { Yi} (или каждого квантованного значения отсчета s( i) из множества {s( i)} соответствующей ему ко­нечной кодовой группой символов, называемой кодовым словом. Если код выбран и множество его слов есть А, то операция кодирования пред­ставляет собой взаимно однозначное отображение множества {s( i)} в множество A. Чаще всего кодирование заключается в замене кванто­ванного отсчета, которое можно рассматривать как некоторое число, его представлением в двоичной системе счисления. Двоичные кодовые сло­ва имеют всего два кодовых символа 0 и 1. Число у в двоичной системе счисления представляется в виде

(12.3)

где т – число разрядов (символов) в кодовом слове: а – число, при­нимающее значение 0 или 1. Разрядность двоичного кода т (число символов в кодовом слове) ставится в зависимость от количества раз­решенных уровней квантования из множества {Yi}, которое равно Ymax. Двоичным m-разрядным кодом можно представить различных кодо­вых слов и каждому числу из множества {Yi} должно соответствовать определенное кодовое слово. Поэтому справедливо выражение

Ymax (12.4)

которым пользуются для согласованного выбора пары чисел т и Ymax. Обычно в выражении (12.4) при первичном кодировании принимают знак равенства. Из общего числа элементов множества {Yi} полови­на отводится для передачи мгновенных значений положительных полу­волн ЗС, а другая половина – для передачи отрицательных полуволн. Каждая полуволна кодируется т – 1 двоичных разрядов.

Кодовая комбинация, соответствующая числу п, содержит переда­ваемые последовательно символы Необ­ходимое для кодирования число разрядов при данном максимальном числе уровней шкалы квантования пmах определяется из выражения т = 1оg2( пmах). Если кодовое слово содержит т символов 0 и 1, то с помощью такого т разрядного двоичного кода можно закодировать числа до пmах = . Так при т = 7 имеем максимальное число разре­шенных уровней квантования, равное пmах = 128, т = 8 соответственно пmах = 256 и при т = 16 соответственно пmах = 65536.

Двоичные символы 0 и 1, входящие в состав кодовых слов, называ­ют битами. Это слово произошло от английского "bit", составленного из начальных и конечной буквы словосочетания "binary digit", что в переводе с английского означает "двоичная цифра". Биты в кодовом слове имеют разный вес. Наименьший вес имеет младший бит , несу­щий информацию об одном шаге квантования. Старший значащий бит несет информацию о шагах квантования и имеет наиболь­ший вес. Пусть, например, кодируется отсчет, имеющий уровень кван­тования п = 115, а характеристика квантователя имеет максимальное число разрешенных уровней квантования пх = 256. В этом случае кодовое слово будет иметь число разрядов т = 1оg 256 = 8 и коди­руемый квантованный отсчет сигнала записывается в двоичной систе­ме следующим образом:

и соответствующее ему кодовое слово имеет вид 01110011. Такой код называют натуральным.

В цифровых системах связи и вещания распространены так назы­ваемые симметричные коды. Они характеризуются тем, что первый разряд кодового слова определяется полярностью сигнала, а остальные разряды несут информацию об абсолютном значении (модуле) кодиру­емого отсчета. Если кодируется сигнал положительной полярности, то первым битом кодового слова является 1, а если отрицательной поляр­ности, то 0. Разнополярные отсчеты, равные по абсолютному значению, в этом случае отличаются только первым символом в кодовом слове.

Последовательность m-разрядных кодовых слов является выходным сигналом аналого-цифрового преобразования. Обычно при передаче и записи к выходному сигналу АЦП добавляется дополнительная инфор­мация, служащая для повышения достоверности передачи и синхрониза­ции. При этом кодовые слова, подвергаемые одновременной обработке, объединяются в блоки. Порядок следования кодовых слов и отдельных символов в блоке называется форматом кода.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]