Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Zvukorezhissura.docx
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
105.08 Кб
Скачать

6.2. Аналоговое и цифровое представление музыкальных и речевых сигналов

Как уже отмечено выше, в современной студийной звукозаписи за последние десятилетия произошел переход от аналоговой тех­ники к цифровой. Все современные музыкальные компьютерные технологии производят только цифровую обработку сигналов. Циф­ровая запись и обработка звука имеет ряд преимуществ: обеспе­чение большого динамического диапазона, низкого уровня шумов, малых нелинейных искажений и др.; гибкость, т. е. удобство про­граммирования и перепрограммирования; повторяемость, возмож­ность быстрого дублирования, стабильность при изменении вне­шних условий; легкость выполнения целого ряда функций, которые сводятся к некоторым стандартным операциям сложения, вычита­ния, умножения (сдвига) и деления двоичных чисел; долговечность при хранении информации; огромный объем обрабатываемой ин­формации и др.

В данном разделе будут кратко приведены сведения по основ­ным операциям при переходе от аналогового к цифровому звуку (дискретизация, квантование и кодирование), необходимые для дальнейшего изложения. Подробнее с этими вопросами, а также другими видами цифровой обработки звуковых сигналов можно ознакомиться в литературе [16, 24-29].

Классификация сигналов. В технической литературе принято следующее определение сигнала: «процесс изменения во времени физического состояния какого-то объекта, в результате которого осуществляется передача энергии и информации» [16, 27]. В теории связи под сигналом понимается «варьируемая переменная, с помо­щью которой передается информация по электронным цепям» [24].

В практике работы звукорежиссера приходится иметь дело со звуковыми сигналами, которые могут быть классифицированы по различным признакам:

по способу их физического представления — на акустиче­ские сигналы (в виде вариаций звукового давления или плотности в воздушной среде) и электрические сигналы (переменное напря­жение (ток) в электрической цепи). На первом этапе звукозаписи от источника до микрофона сигнал имеет акустическое представле­ние, с выхода микрофона поступает уже электрический сигнал, с которым и производятся все виды обработок на микшерном пульте, в компьютере и т. д., затем сигнал сохраняется и переда­ется в электрической (проводные сети) или электромагнитной (сети радиовещания, телевидения и др.) форме; только на после­днем этапе сигнал с помощью громкоговорителя восстанавливает­ся в акустическом виде, в котором и поступает в слуховую систе­му (следует отметить, что внутри нее он опять конвертируется в электрическую форму — см. гл. 3);

  • по степени их предсказуемости сигналы могут быть разде­лены на детерминированные, случайные, квазислучайные. Как уже было отмечено в главе 2, музыкальные и речевые сигналы отно­сятся к квазислучайным нестационарным сигналам, поэтому для их изучения используются методы статистической теории, а также методы спектрального и корреляционного анализа [15, 28];

  • по характеру изменения значений функции, описывающей сигнал, и ее переменной (аргумента) можно выделить три клас­са сигналов:

  1. непрерывные (аналоговые), в которых значения функции и ар­гумента изменяются непрерывно и могут быть измерены в любые моменты времени. Аудиотехника работала именно с этими вида­ми сигналов на протяжении всего периода ее развития с 30-х до 90-х годов XX века;

  2. дискретные, в которых значения функции изменяются не­прерывно, а аргумент может принимать только строго фиксирован­ные значения. Дискретный звуковой сигнал можно представить в виде последовательности импульсов, амплитуда которых зави­сит от значения сигнала в данный момент времени (АИМ); можно также применять импульсы, ширина которых пропорциональна ам­плитуде сигнала (ШИМ) (рис. 6.2.1). Дискретные сигналы стали применяться в радиотехнике с 40-х годов [28];

цифровые, в которых значения функции и аргумента могут быть только дискретными. Полученные значения сигналов пред­ставляются в виде определенной последовательности чисел (рис. 6.2.2). Операции преобразования аналогового сигнала в цифровой называются; дискретизацией (сэмплированием), квантованием и кодированием [15, 16, 24-28]. Необходимо отметить при этом, что аналоговый сигнал несет полную информацию о реальном звуковом мире в любые моменты времени с любой точностью (на­пример, звучание скрипки, пение, шум и др.); цифровые сигналы передают эту информацию всегда с определенной погрешностью, т. к. в промежутках между отсчетами (сэмплами) информация теря­ется; кроме того, она неточно передается и по уровню, т. к. исполь­зуются только квантованные значения. Эти неточности заложены в природу цифрового сигнала. По мере повышения быстродействия современной компьютерной техники эти погрешности становятся все меньше и приближаются к порогам чувствительности слуха.

Следует отметить еще одно различие аналоговых и цифровых сигналов: когда в аналоговом сигнале изменяется частота, ам­плитуда или фаза в одной форме его представления, например в акустической, пропорционально изменяются эти же параметры в другой форме его представления, например электрической; при этом они в значительной степени взаимосвязаны. В цифровом сигнале изменение цифровых данных, описывающих, например, частоту, не приводит к изменению данных, описывающих ампли­туду и др., поэтому при обработке цифровых сигналов возмож­ны такие операции, как сдвиг высоты без растяжения (сжатия) сигнала по времени.

Цифровая обработка сигналов — ЦОС (Digital Signal Proces­sing — DSP) включает в себя: анализ, синтез и изменение (обра­ботку) информации, передаваемой в виде дискретной последова­тельности чисел (т. е. в виде потока электрических импульсов, несущих закодированную в двоичном коде информацию) [26, 29].

В основе всех музыкальных компьютерных программ, исполь­зуемых в практике работы со звуком, лежит цифровая обработка сигналов, включающая некоторый стандартный набор операций: дискретизацию (сэмплирование), квантование, кодирование, пре­образование Фурье (FFT) и др. Ниже будут кратко рассмотрены основные из них.

Дискретизация. Преобразование сигнала из непрерывной формы в дискретную можно представить как результат измерения мгновенных значений сигнала (например, напряжения) через по­стоянные (дискретные) промежутки времени.

Полученная совокупность отсчетов затем преобразуется в чис­ловую последовательность и передается для последующей обра­ботки, например в компьютере. Этот процесс называется дискре­тизацией, или сэмплированием (слово «сэмпл» употребляется также и в другом значении — «образец записи звучания какого- либо отрезка музыки, речи, шума и др.»). Среди методов цифро­вого представления наиболее известна импульсно-кодовая моду­ляция (ИКМ), которая реализуется в специальном устройстве АЦП. Принципиальная схема его показана на рис. 6.2.3: входной сигнал U(t) ограничивается по полосе низкочастотным фильтром (ФНЧ) и поступает в амплитудно-импульсный модулятор (АИМ), где проис­ходит его дискретизация, т. е. считывание значений с помощью гене­ратора тактовых импульсов (ГТИ). Выходной сигнал АИМ-модулятора представляет собой временную последовательность отсчетов (рис. 6.2.4), отстоящих один от другого на интервал времени Т , на­зываемый периодом дискретизации. Величина f, обратная пери­оду (интервалу) дискретизации (/д = 1/Тд), называется частотой дискретизации.

Частота дискретизации (sample rate) равна числу отсчетов сигнала в секунду. Например, если указана частота дискретизации в компьютере 48 кГц, то это означает, что в АЦП, установленном на звуковой карте, выполнено 48000 отсчетов сигнала в секунду.

Сигнал, показанный на рис. 6.2.4, называется дискретным. В кодере АЦП выходной сигнал затем квантуется по уровню и ко­дируется. Рассмотренная схема является простейшей. Реальные ИКМ-преобразователи содержат и некоторые другие функциональ­ные блоки, уменьшающие погрешности преобразования [15, 16].

Выбор частоты дискретизации является важнейшей операцией при обработке музыкальных и речевых сигналов в компьютерах и других цифровых устройствах. Для адекватного представления сиг­нала (особенно содержащего много высокочастотных составляю­щих в спектре) и его последующего восстановления в ЦАП необ­ходимо брать достаточно большое количество отсчетов (рис. 6.2.4). С другой стороны, когда выбрано слишком много отсчетов, появ­ляется много коррелированных значений сигнала, которые не оп­равдывают затрат времени на их сохранение; кроме того, большое количество отсчетов значительно увеличивает время на обработ­ку сигнала и определяется пропускными возможностями компьюте­ра и других цифровых приборов.

В соответствии с теоремой Котельникова — Найквиста: «неис­каженная передача непрерывного (аналогового) сигнала с полосой частот 0... fmax дискретной последовательностью его отсчетов воз­можна только в том случае, если частота дискретизации fR связа­на с максимальной частотой fmax исходного сигнала следующим соотношением» [28]:> 2fmax.

Например, если нужно передать музыкальный сигнал с полосой воспроизведения 30-20000 Гц, то частота дискретизации должна быть выбрана не ниже 40000 Гц.

В настоящее время в лазерных проигрывателях и бытовых маг­нитофонах принята частота дискретизации 44,1 кГц, в профессио­нальных системах звукозаписи и радиовещания — 48 кГц, в совре­менных студийных устройствах уже используются частоты 96 кГц, 192 кГц (например, в DVD-Audio).

При согласовании различной аппаратуры иногда возникает не­обходимость изменения частоты дискретизации: уменьшение час­тоты дискретизации называется децимацией, при этом задается ко­эффициент децимации (Decimation Ratio), который указывает, какое количество отсчетов сигнала должно быть взято для усред­нения и последующей замены на это усредненное значение. Уве­личение частоты дискретизации происходит с помощью процесса интерполяции, т. е. дополнения промежуточных значений сигнала; способы, которыми это может быть реализовано, приведены в ли­тературе [24-29].

Квантование. После дискретизации звуковой сигнал имеет дискретные значения аргумента (времени), но сохраняет непре­рывное изменение значений функции (напряжения). Однако из-за ограниченной разрядности элементов памяти и операционных сис­тем цифровых приборов сигналы в них могут передаваться только с ограниченной точностью. Поэтому производится операция квантова­ния. При этом непрерывное множество значений функции заменяется на некоторое конечное разрешенное число, которое определяется числом уровней квантования (рис. 6.2.2). Расстояние между со­седними разрешенными уровнями квантования называется шагом квантования. Каждое значение отсчета сигнала заменяется (округ­ляется или отбрасывается) ближайшим к нему разрешенным значе­нием. Квантование — операция нелинейная и неизбежно вызыва­ет ошибку квантования, при которой (в отличие от дискретизации) сигнал нельзя передать со сколь угодно малой ошибкой ни при ка­ком конечном шаге квантования.

Разность между исходными и квантованными значениями отсче­тов изображена на рис. 6.2.5. Эта разность, т. е. сигнал ошибок называется шумом квантования. Чем меньше величина шага Д при квантовании отсчетов дискретизиро­ванного сигнала, тем меньше по уровню этот шум квантования. Его мощность связана с величиной шага квантования следующим соотноше­нием: Рш кв = А2/ 12. Спектр шума квантования равномерный в полосе частот 0... Уд/2. Поскольку мощ­ность шума квантования зависит не от уровня входного сигнала, а толь­ко от выбранного шага квантования, то при слабых уровнях сигнала шум квантования вносит слыши­мые искажения. Для его уменьшения используются различные спо­собы неравномерного квантования [16, 24-28].

Кодирование — процесс представления квантованного отсче­та значений сигнала в двоичной системе счисления. Таким обра­зом, каждому квантованному уровню сигнала сопоставляется неко­торое число, содержащее определенное количество цифр, — так называемое кодовое слово. Двоичные кодовые слова состоят из двух цифр: 0 и 1. Любое число в двоичной системе может быть представлено в виде:

А = а 2т~1 , 2т'2 +.... ап 2°.

т-1 т-2 0

Число А в системе с основанием 2 записывается только после­довательностью коэффициентов а т1, ат 2 ап, которые могут принимать значения 0 или 1 .Число т называется разрядом слова и определяет количество цифр, из которых оно состоит. При т = 4 число А содержит четыре цифры (например, 1011) и может быть представлено как: А = 1 • 23 + 0- 22 + 1 • 2' + 1 • 2° (в десятич­ной системе это число равно 11). Приемы перевода чисел из де­сятичной системы в двоичную и наоборот даны в работах [16, 24-28].

Двоичные символы 0 и 1, входящие в состав кодовых слов, на­зывают битами. Это слово произошло от английского «bit», со­ставленного из начальных и конечной букв словосочетания «binary digit», что означает «двоичная цифра».

Выбор определенного количества бит определяет длину слова, т. е. количество цифр, которое может использоваться для каждого уровня квантования. Число возможных уровней квантования, кото­рое может быть закодировано с помощью выбранного числа бит, определяется числом перестановок из заданного количества цифр. Например, выбрав число бит равным двум, т. е. задав длину сло­ва из двух цифр, можно получить только четыре, т. е. 22 разные перестановки, и соответственно закодировать только четыре уров­ня следующими комбинациями цифр: 00, 01, 10, 11. Соответствен­но, задав произвольное число m бит, можно закодировать N уров­ней, число которых N = 2т. Например, при m = 16 бит можно закодировать число уровней 216 = 65536. Если задано число уров­ней, например, N = 256, то число бит определится как т = ln/N), т. е. будет равно т = 8.

Чем больше динамический диапазон звукового сигнала, тем больше уровней требуется для его квантования (при сохранении низкого уровня шума квантования) и тем больше требуется цифр в слове, т. е. числа бит, для их кодирования.

Динамический диапазон сигнала D связан с числом бит т сле­дующим приближенным соотношением [16J: D = 6 т. Поэтому для увеличения динамического диапазона в современной звуко-технике происходит переход на число разрядов 24 бит при уровне кван­тования 96 кГц.

Скорость передачи цифрового потока определяется как С = f х т, Где/, — частота дискретизации, т — число бит. Например, при частоте дискретизации 48 кГц и числе разрядов 16 бит скорость потока равна 768 кбит/с.

Разумеется в реальных цифровых системах процессы кванто­вания и кодирования представляют собой достаточно сложные процессы преобразования сигналов, выше приведены только основные определения [16, 23-29].

После того как звуковой сигнал прошел в АЦП операции дис­кретизации, квантования и кодирования, он в виде последователь­ности цифр вводится в цифровое устройство (например, компью­тер), где и подвергается различным видам обработки (анализу, синтезу, фильтрации и др.). Спектральный анализ сигналов (см. гл. 2) в современных компьютерах производится обычно с помощью алгоритмов быстрого преобразования Фурье — БПФ (FFT). Для цифровой фильтрации и- процессорной обработки используется большое количество различных алгоритмов. Представление о не­которых из них будет дано в разделе 6.3; более подробно с этой темой можно ознакомиться в литературе [24-29].

Затем цифровой сигнал после обработки подвергается обрат­ному преобразованию в цифро-аналоговом устройстве (ЦАП), на выходе которого получается аналоговый сигнал. Он может быть подведен к громкоговорителям или стереотелефонам для прослу­шивания. Принципы действия ЦАП можно найти в работах [15, 16, 23-29].

В настоящее время практически все системы звукозаписи, звукопередачи и звуковоспроизведения используют цифровую обра­ботку сигналов, что открывает перед ними значительно большие возможности, чем при работе с аналоговыми сигналами.