Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции Максимова.doc
Скачиваний:
2
Добавлен:
01.04.2025
Размер:
20.86 Mб
Скачать

11.2. Цифровое представление звука Цифро-аналоговое и аналого-цифровое преобразование

Звуковые волны при помощи микрофона превращаются в аналоговый переменный электрический сигнал. Этот сигнал (Рис.11.8, схема 1) проходит через звуковой тракт и попадает в аналого-цифровой преобразователь (АЦП) – устройство, которое переводит сигнал в цифровую форму.

В упрощенном виде принцип работы АЦП можно описать так: он измеряет через определенные промежутки времени амплитуду сигнала и передает дальше, уже по цифровому тракту, последовательность чисел, несущих информацию об изменениях величины амплитуды (Рис. 11.8, схема 2).

Во время аналого-цифрового преобразования на самом деле никакого физического преобразования не происходит. С электрического сигнала как бы снимается отпечаток или образец, являющийся цифровой моделью колебаний напряжения в аудиотракте. На схеме 2 эта модель представлена в виде последовательности столбиков, каждый из которых соответствует определенному числовому значению. На этой схеме видно, что цифровая модель не совсем точно соответствует форме аналогового сигнала. Поэтому говорят, что цифровой сигнал по своей природе дискретен, то есть, прерывист.

Промежуток времени между двумя измерениями амплитуды аналогового сигнала называется семплом (или «отсчетом» в отечественной литературе) С английского слово Sample дословно переводится как "образец". Поэтому это слово в мультимедийной и профессиональной звуковой терминологии имеет несколько значений, для обозначения разных видов "образцов". Кроме промежутка времени семплом называют любую последовательность цифровых данных, полученных в результате аналого-цифрового преобразования, а сам процесс преобразования – семплированием или дискретизацией.

Вывод цифрового звука осуществляется при помощи цифро-аналогового преобразователя (ЦАП), который на основании поступающих цифровых данных в соответствующие моменты времени генерирует электрический сигнал необходимой амплитуды (Рис.11.8, схема 3). А в акустических системах этот сигнал преобразуется в звуковые волны, которые мы слышим.

Одним из двух ключевых параметров процесса оцифровки является частота семплирования (частота дискретизации) – количество измерений амплитуды аналогового сигнала в секунду. Так как диапазон колебаний воспринимаемых человеком звуковых волн лежит в пределах от 20 Гц до 20 кГц, то количество измерений сигнала в секунду должно быть больше, чем количество колебаний звуковой волны за тот же промежуток времени. На Рис.11.9 показано, что происходит, если частота семплирования гораздо ниже, чем частота звуковой волны: за время между измерениями амплитуда сигнала успевает несколько раз измениться, в результате чего цифровой отпечаток несет хаотичный набор данных. При цифро-аналоговом преобразовании такой семпл будет выдавать только шум, а основной сигнал передаваться не будет.

Рис 11.9. Частота семплирования гораздо ниже, чем частота звуковой волны

Поэтому для качественного преобразования применяют частоты более чем в два раза превышающие верхнюю границу звукового диапазона: 44.1 и 48 кГц. А в новом формате компакт-дисков под названием Audio DVD применяется частота семплирования 96 кГц. То есть за 1 секунду сигнал измеряется 96 тысяч раз!

В мультимедийных приложениях очень часто применяют меньшие частоты: 11, 22 и 32 кГц для экономии места на жестком диске. Но с уменьшением частоты семплирования сразу уменьшается слышимый диапазон частот, а то, что слышно, довольно сильно искажается. На Рис.11.10. представлены четыре графика, показывающие с одинаковым масштабом один и тот же звук высотой 1 кГц (этой частоте примерно соответствует нота До седьмой октавы фортепиано), но семплированный с разной частотой (нижняя часть синусоиды на всех рисунках не показана). Одно деление на горизонтальной оси, показывающей время, соответствует 10 семплам.

Рис 11.10. Частоты семплирования

Видно, что на частоте 11 кГц на каждые 50 семплов приходятся примерно 5 колебаний звуковой волны, то есть один период синусоиды отображается всего лишь при помощи 10 значений. При таком отображении ни о какой точной передаче говорить не приходится. Зато при частоте оцифровки 44 кГц на каждый период синусоиды приходится уже почти 50 семплов – такая точность отображения позволяет получить сигнал хорошего качества.

Теперь давайте разберемся с другим ключевым параметром цифрового преобразования – разрядностью семплирования. Этот параметр указывает, с какой точностью происходят измерения амплитуды аналогового сигнала.

Посмотрите еще раз на Рис.11.8. Точность, с которой при оцифровке передается значение амплитуды сигнала в каждый из моментов времени («столбики» на схеме 2), фактически определяет качество сигнала после цифро-аналогового преобразования. От этой точности зависит достоверность восстановления формы волны.

Любое цифровое устройство, в том числе и компьютер, на аппаратном уровне может оперировать только с двоичным кодом. Этот код позволяет представить любую информацию в виде нулей и единиц. Такой способ обмена информацией гораздо проще реализовать. Например, одна величина напряжения соответствует нулю, а другая величина – единице. Стоит увеличить разницу между этими двумя величинами, и вероятность ошибки практически сводится к нулю. А если бы тот же компьютер на аппаратном уровне оперировал десятичными цифрами, нам пришлось бы вводить десять значений напряжения, чтобы закодировать цифры с 0 до 9. Это уменьшает надежность системы.

Минимальной информационной единицей в двоичной системе является бит (иногда его называют «разрядом») Он может принимать два значения – 0 и 1, то есть одним битом можно представить два десятичных числа. Двумя битами – уже четыре числа (используя все возможные комбинации нолей и единиц: 00, 01, 10, 11). Тремя битами – восемь чисел и т.д.

Именно такой принцип и применяется для кодирования значения амплитуды сигнала. Обычно используется 8 или 16 битное представление значений амплитуды. Давайте остановимся на этом моменте подробней.

Если при оцифровке используется 8-битное кодирование, то измерения амплитуды аналогового сигнала будут производиться с точностью до 1/256 от динамического диапазона цифрового устройства (8 бит позволяют представить 28 чисел – 256). Такая точность недостаточна для достоверного восстановления исходного сигнала: будут велики нелинейные искажения. Поэтому 8-битное кодирование применяется преимущественно в мультимедиа-приложениях, где не требуется высокое качество звука.

Если же мы повысим разрядность представления значений амплитуды аналогового сигнала до 16 бит, то точность измерения возрастет не в два раза, а в 256. Ведь 16 бит позволяют закодировать уже 216=65536 значений амплитуды. Такая точность кодирования позволяет нелинейные искажения свести к минимуму. Именно разрядность 16 бит используется при записи компакт-дисков.

В современных же преобразователях используется 24-битное кодирование сигнала. Такая разрядность позволяет получить 224=16777216 значений амплитуды, что более чем достаточно для высококачественной оцифровки звука.

Здесь надо остановиться и поговорить об одной особенности оцифровки. Все приведенные выше данные справедливы только для сигнала, имеющего максимальный уровень 0 дБ. Если преобразуется сигнал, имеющий уровень -6 дБ с разрядностью 16 бит, то реально для кодирования его амплитуды будет оставаться 15 бит. Для сигнала с уровнем -12 дБ эта цифра будет составлять 14 бит. То есть с уменьшением уровня сигнала будет уменьшаться разрядность его оцифровки и, соответственно, увеличиваться уровень нелинейных искажений (эти искажения иногда называются шумом квантования). Уменьшение уровня на каждые 6 дБ будет "съедать" 1 бит. В результате, для кодирования амплитуды сигнала с уровнем -90 дБ у нас останется всего 1 бит.

Этот недостаток 16-битного кодирования и является основным катализатором введения нового бытового цифрового формата Audio DVD, у которого помимо частоты семплирования 96 кГц используется разрядность 24 бита. Ожидается, что через несколько лет он полностью вытеснит с рынка обычные компакт-диски.

Теперь подсчитаем, сколько места будет занимать одна минута цифрового звука на жестком диске или любом другом цифровом носителе. Если мы записываем моно сигнал с частотой 44.1 кГц, разрядностью 16 бит (2 байта), то каждую минуту аналого-цифровой преобразователь будет выдавать 44100х2х60=5292000 байт, т.е. около 5 Мб данных об амплитуде аналогового сигнала, которые в компьютере записываются на жесткий диск. Стерео сигнал уже будет занимать 10584000 байт или около 10 Мб.

Достоинства и недостатки цифрового звука

Цифровое представление звука ценно прежде всего возможностью бесконечного хранения и тиражирования без потери качества, однако преобразование из аналоговой формы в цифровую и обратно все же неизбежно приводит к частичной его потере. Наиболее неприятные на слух искажения, вносимые на этапе оцифровки – гранулярный шум, возникающий при квантовании сигнала по уровню из-за округления амплитуды до ближайшего дискретного значения. Гранулярный шум сильно коррелирован с сигналом, и представляет собой гармоники сигнала, искажения от которых наиболее заметны в верхней части спектра. Мощность гранулярного шума обратно пропорциональна количеству ступеней квантования, однако из-за логарифмической характеристики слуха при линейном квантовании (постоянная величина ступени) на тихие звуки приходится меньше ступеней квантования, чем на громкие, и в результате основная плотность нелинейных искажений приходится на область тихих звуков. Это приводит к ограничению динамического диапазона, который в идеале (без учета гармонических искажений) был бы равен соотношению сигнал/шум, однако необходимость ограничения этих искажений снижает динамический диапазон для 16-разрядного кодирования до 50–60 дБ.

При восстановлении звука из цифровой формы в аналоговую возникает проблема сглаживания ступенчатой формы сигнала и подавления гармоник, вносимых частотой дискретизации. Из-за неидеальности АЧХ фильтров может происходить либо недостаточное подавление этих помех, либо избыточное ослабление полезных высокочастотных составляющих. Плохо подавленные гармоники частоты дискретизации искажают форму аналогового сигнала (особенно в области высоких частот), что создает впечатление "шероховатого", "грязного" звука.