Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
EQ-Mix-Mastering / Максимайзеры.doc
Скачиваний:
38
Добавлен:
15.02.2015
Размер:
735.74 Кб
Скачать

Максимайзеры

Алексей ЗАЙЦЕВ Музыкальное Оборудование июнь 2001

Сравнительный анализ программных средств увеличения громкости.

Что такое громкость звука? Существуют три понятия, которые часто путают: интенсивность (сила) звука, его уровень и непосредственно громкость звука.

Интенсивность звука (I) является величиной абсолютной и определяется отношением приведенной акустической мощности к площади, на которую действует звук, и измеряется в ваттах на квадратный метр (Вт/м2).

Уровень звука (L) - величина относительная, определяется десятичным логарифмом отношения действующего звукового давления к звуковому давлению, определяющему порог слышимости:

L = 20 lg(p/p0), где: p - действующее звуковое давление, p0 - звуковое давление, соответствующее порогу слышимости;

или же

L = 10 lg(I/I0), где: I - интенсивность звука, I0 - интенсивность звука, определяющая порог слышимости.

Уровень звука выражается в децибелах. Логарифмический характер его выражения соответствует логарифмическому характеру нашего восприятия звука, что делает логарифмическую шкалу измерения очень удобной для использования.

Громкость звука - понятие субъективное, хотя и непосредственно связанное с понятиями, рассмотренными выше: в общем случае интенсивность звука влияет на его громкость, а единица измерения уровня громкости (Фон) является производной от единицы измерения уровня звука. Принято считать, что величина уровня громкости численно равна величине уровня звука на частоте 1 кГц. Но как раз здесь и начинаются нюансы, делающие невозможными строгое математическое выражение громкости. Вся палитра слышимых нами звуков не ограничивается синусоидальным тоном с частотой 1 кГц. Слышимые нами звуки и, в частности, музыка, состоят из множества частот, имеющих при этом разную интенсивность и разную длительность. Ухо в различной степени чувствительно к звукам разной частоты и длительности. Звук с частотой 12 кГц всегда будет казаться тише звука той же интенсивности, но с частотой 4 кГц. Звук длительностью 10 мс всегда будет тише звука с той же частотой и интенсивностью, но длительностью в одну секунду. Поэтому в повседневной жизни при оценке громкости музыки принято считать, что музыкальное произведение обладает примерно равномерным спектром. В этом случае появляется возможность каким-то образом обмануть кривые Флетчера-Мансона ("кривые равной громкости" - семейство характеристик, показывающих зависимость кажущейся громкости сигнала от звукового давления и частоты) и создать в море субъективности маленькие объективные островки, нормализовав тем самым само понятие громкости (см. таблицу 1).

Таблица 1. Соотношение интенсивности, громкости и уровня звука.

Приведенная в таблице градация является универсальной. Но с развитием технологии звукозаписи, а, вернее, с появлением совершенно разнородных носителей с разными динамическими характеристиками, появилась необходимость в ином принципе оценке громкости. Им стала арифметическая разность между пиковым (Peak) и среднеквадратичным (RMS) значением уровня звука (сигнала) - так называемый "кросс-фактор".

При сведении на аналоговую магнитную ленту эта разность составляет (примерно) 14 дБ - именно это значение и определяло долгие годы громкость той музыки, которую слушали мы, а до нас - наши родители.

Слух наш имеет одно интересное свойство, бьющее молотом субъективности прямо по музыке, вернее, по нашему ее восприятию - из нескольких произведений мы скорее обратим внимание на то, что прозвучало громче. В погоне за громкостью своих фонограмм во время FM-бума (70-80 годы) продюсеры издавали синглы на виниле на скорости в 45 оборотов в минуту и "разгоняли" их до явно слышимых искажений. Именно в том времени и берет свое начало "гонка громкостей", последствия которой мы пожинаем сегодня.

С распространением цифровых технологий записи и обработки звука "проблема громкости" получила второе рождение. Дело в том, что при сведении на цифровой носитель некомпрессированная фонограмма имеет кросс-фактор в районе 20 дБ. Это означает, что фонограмма, сведенная сразу на цифровой носитель, будет звучать на 6 дБ (в два раза!) тише, чем та же фонограмма, сведенная на аналоговую магнитную ленту с уровнем 0 дБ по индикатору VU, а потом оцифрованная с уровнем 0 dBfs по пиковому индикатору. Для компенсации двукратной потери громкости приходилось использовать довольно жесткую компрессию.

Сейчас доступность цифровых технологий обработки свела на нет проблему снижения громкости цифрового аудиоматериала. Не существует каких-либо стандартов на "громкость". В таблице 2 приведены значения кросс-фактора для некоторых фонограмм, изданных в последние годы на компакт-дисках. Для измерения отбирались самые громкие их фрагменты (как правило, припевы), чтобы получить максимально высокое значение громкости для конкретной фонограммы. Эти величины могут пригодиться в качестве ориентира при выборе громкости вашей фонограммы. Из таблицы видно, что отечественные фонограммы в среднем на одну-две единицы громче, чем западные, - вероятно, мы сейчас переживаем "бум громкостей", который западный шоу-бизнес благополучно перенес в конце 80-х.

Таблица 2. Относительная громкость звучания фонограмм (кросс-фактор), дБ.  

 

   

Методики измерения среднеквадратичного уровня разными программами отличаются друг от друга - этим объясняются разные цифры, полученные при анализе отрезка в разных программах. Во всех случаях ширина зоны измерения RMS Level (в Cool Edit Pro - RMS Power) составляла 50 мс.

Существует множество способов "разогреть" фонограмму. Те из них, которые имеют отношение к компьютерной (PC) обработке звука, и будут рассмотрены.

Предиктивные (look ahead) пиковые лимитеры

При использовании цифрового носителя максимально возможный пиковый уровень сигнала равен 0 dBfs. В этом случае самый простой способ уменьшить кросс-фактор фонограммы, скажем, на три децибела - это уменьшить на три децибела уровень пиков сигнала и после этого поднять на три децибела общий уровень фонограммы. Для этого и служат алгоритмы, известные в народе как "максимайзеры". В простейшем случае они представляют собой комбинацию цифрового пик-лимитера, имеющего нулевое время атаки, и регулятора уровня сигнала. До того момента, пока уровень сигнала на входе не превышает установленный порог срабатывания лимитера, звук проходит без изменений. В момент, когда уровень достигает порогового значения, дальнейший рост его прекращается. Имеющее место уменьшение пикового уровня фонограммы компенсируется при помощи выходного регулятора уровня. В результате кросс-фактор фонограммы уменьшается на величину установленного порога срабатывания.

Естественным ограничением применения "максимайзеров" является необходимость отсутствия в фонограмме пиков с длительностью, превышающей время восстановления лимитера (значение по умолчанию, как правило, 1 мс). Если же длительность пика больше, то в момент срабатывания лимитера возникают гармонические и, что еще неприятнее, интермодуляционные искажения очень высокого уровня и широкого спектра, принося в жертву громкости звучания акустическую прозрачность фонограммы.

Можно очень просто услышать в чистом виде артефакты, вносимые в фонограмму пик-лимитерами. Для этого нужно в любом мультитрекере создать проект, дважды импортировав один и тот же аудиофайл на разные треки. Лучше, если это будет именно тот файл, который вы в дальнейшем собираетесь максимизировать. В разрыв первого трека включите модуль пик-лимитера, а в разрыв второго - любой доступный фазоинвертор. В пик-лимитере регулятор выходного уровня установите на то же значение, на которое установлен регулятор порога срабатывания. Например, если регулятор порога установлен на -6 дБ, то и регулятор выхода тоже установите на -6 дБ. Это важно сделать, чтобы громкость обработанной и исходной инвертированной фонограммы была одинаковой.

Еще может понадобиться слегка подвигать треки один относительно другого, чтобы компенсировать задержку (от 10 до 70 семплов), которую вносят в сигнал подключаемые модули. Критерий синхронности - полное отсутствие звука при воспроизведении в этом проекте, когда регуляторы порога и выходного уровня пик-лимитера установлены на 0 дБ.

Когда файлы синхронизированы, можете послушать, что именно привносит в звучание вашего файла любимый Waves Ultramaximizer или какой-нибудь DSP-FX Optimizer. Изменяя параметры обработки (значения порога, выходного уровня и времени восстановления), можно выбрать тот режим, который оставляет в обработанном файле меньше мусора, вызванного "ложными" срабатываниями лимитера, - срабатываниями не на пик сигнала, а на более длительное превышение порога.

Все лимитеры по-разному реагируют на такое превышение. В процессе рассмотрения различные "максимайзеры" будут сравнены по количеству генерируемых искажений и по спектру этих искажений, на основании чего в дальнейшем можно будет сделать выбор в пользу применения того или иного алгоритма.

Waves L1 Ultramaximizer Патриарх мастеринговых пик-лимитеров всея Руси и прилегающих территорий (рис. 1), название которого давно стало именем нарицательным, входит в состав набора Waves Native Gold Bundle 3.01. Представляет собой классический вариант лимитера, объединенного с блоком дизеринга (фирменный алгоритм IDR, основанный на разработках легендарного Майкла Герзона, дедушки психоакустики). Органы управления модуля соответствуют приведенному выше описанию базового алгоритма лимитирования: регуляторы входного уровня (Input), регуляторы порога срабатывания (Threshold), совмещенные с пиковыми индикаторами входного уровня, регуляторы выходного уровня (Out Ceiling), совмещенные с индикатором уровня выходного сигнала, регулятор времени восстановления (Release, значение по умолчанию 1 мс) и индикатор глубины лимитирования (уровня ограничения) Atten. Чем более жесткий режим лимитирования установлен, тем большим должно быть время восстановления - вплоть до 30-100 мс.  

 

   

В правой части экрана под блоком дизеринга расположена кнопка адаптации работы алгоритма к типу носителя, на который в будущем будет производиться копирование мастера. В положении Analog фонограмма оптимизирована для дальнейшего копирования на аналоговый носитель, а в случае, когда выбран режим Digital, вполне можно изготовить цифровой мастер на CD. При этом гарантирована защита от превышения сигналом уровня 0 dBfs и возникновения цифровой "перегрузки" выходного потока.

Для проверки того, как Ultramaximizer справляется с длительным превышением порога срабатывания, воспользуемся следующим тестом: возьмем 24-разрядный файл с частотой дискретизации 48 кГц, содержащий микс двух сигналов: одного с частотой 30 Гц и амплитудой -12 дБ, второго с частотой 1000 Гц и амплитудой -6 дБ. Суммарная амплитуда микса составила -2,5 dBfs. В качестве хост-программы для тестирования подключаемых модулей формата DirectX используем Sonic Foundry Sound Forge 5.0.

Сначала установим порог срабатывания лимитера выше уровня тестового сигнала и обработаем тестовый файл. Спектрограмма показывает отсутствие каких бы то ни было "лишних" колебаний (рис. 2).

Затем органы управления L1 приведем к состоянию, показанному на рисунке 1. В этом случае глубина лимитирования составит всего 1 дБ - совсем щадящий режим. Спектрограмма полученного после такой обработки файла представлена на рис. 3. Коэффициент гармоник в этом случае составил чуть больше одной тысячной процента, а вот коэффициент интермодуляционных искажений превысил 4,5%, что очень заметно на слух. Это способно навсегда убить даже самую хорошую фонограмму. Естественно, что подобный режим эксплуатации выходит за рамки технических условий, согласно которым модуль разрабатывался, но именно реакция алгоритма на сигналы длительностью больше времени восстановления определяет количество "мусора", оставляемое при работе с музыкальным материалом.

Здесь и далее все измерения производились в программе SpectraLAB 4.32.16 от компании Sound Technology (режим Postprocess, FFT Size = 32768, по форме Ханнинга в диапазоне частот 3-20000 Гц с экспоненциальной частотной шкалой и динамическим диапазоном 150 дБ).

При снижении порога лимитирования (и, как следствие, увеличении уровня ограничения) искажения растут по обратно-экспоненциальному закону: при ограничении в 2 дБ уровень искажений удваивается, а начиная с 4 дБ и дальше рост обоих видов искажений прекращается (рис. 4). Их коэффициент остается на уровне 0,004% (гармонические) и 11,2% (интермодуляционные).

Sonic Foundry Wave Hammer Модуль входит в комплект поставки пятой версии Sound Forge, но доступен и отдельно. Функционально объединяет в себе два независимых алгоритма - традиционный "форжевский" компрессор и Volume Maximizer, представляющий собой реализацию алгоритма предиктивного пик-лимитера.

Предоставленный производителем набор органов управления аскетичен (рис. 5) - помимо индикаторов уровня сигнала и уровня лимитирования в распоряжении есть регуляторы порога срабатывания лимитера (Threshold), уровня выходного сигнала (Output level) и времени восстановления (Release time).

Из нетрадиционных элементов есть опция Use longer look-ahead. При активизации этого режима программа начинает плавно уменьшать усиление еще до того, как сигнал превысит установленный уровень порога. Этим достигается менее радикальный режим компрессии пиков, но следствием такого подхода может стать "предкомпрессия" - заметное на слух уменьшение уровня громкости еще до пика.

Wave Hammer в своей работе использует несколько иной алгоритм лимитирования, вследствие чего результаты тестирования по схеме, приведенной выше, выглядят по-другому.

Несмотря на наличие регулятора порога срабатывания, программа обращается с регулированием порога очень вольно: если уровень сигнала ниже установленного порога на 3 дБ и больше, ограничения не происходит, но с ростом уровня сигнала глубина компрессии постепенно начинает увеличиваться. Таким образом, Wave Hammer реализует некое подобие режима "мягкое колено" (soft knee). Это объясняет несоответствие между установленным порогом срабатывания и уровнем сигнала на выходе - когда при входном уровне -2,5 dBfs и пороге срабатывания -3,5 дБ уровень лимитирования составляет не 1 дБ, как у L1 Ultramaximizer, а 1,3 дБ (рис. 5). Коэффициент гармоник при этом в два с половиной раза превышает коэффициент гармоник файла, обработанного L1 с теми же установками. Коэффициент интермодуляционных искажений составляет 4,95% и растет равномерно с ростом уровня лимитирования вплоть до компрессии в 7 дБ. Начиная с этого уровня компрессии, рост искажений прекращается, и их уровень останавливается на отметке 0,08% для гармонических и 11,43% для интермодуляционных (рис. 6).

За счет более высокого уровня гармоник спектр паразитных колебаний значительно шире в средне- и высокочастотной областях (рис. 7), чем у L1 Ultramaximizer, что обуславливает и большую их заметность.

Все вышесказанное позволяет отнести Wave Hammer не к мастеринговым алгоритмам, а, скорее, к обычным эффектам динамической обработки.

Timeworks Mastering Compressor Еще один клон L1 Ultramaximizer (рис. 8), на этот раз от Sonic Timeworks L.L.P. На первый взгляд, его интерфейс полностью повторяет интерфейс L1, даже есть блок дизеринга - сразу хочется сделать вывод об их функциональной идентичности. Но при внимательном рассмотрении обнаруживаются отличия, позволяющие модулю претендовать на персональную нишу среди приборов финальной динамической обработки.  

 

   

При тестировании реакции алгоритма на постоянное превышение порогового уровня на 1 дБ сразу же выявилось несоответствие показаний индикатора компрессии ее реальному уровню. В ситуации, проиллюстрированной рисунком 8, явно слышно ограничение уровня, а индикатор компрессии этого не показывает. По этой причине прямое сравнение коэффициентов гармоник и интермодуляционных искажений Timeworks Mastering Compressor с предыдущими алгоритмами затруднено. Но в данном случае оно и не столь важно, потому что само поведение этого лимитера при понижении порога срабатывания отличается от ранее рассмотренных схем. Сначала при понижении порога лимитера коэффициенты искажений равномерно растут от 2,5% (гармоники) и 3% (интермодуляционные) при компрессии в 1 дБ до 9% и 9,5% соответственно при компрессии 7 дБ. При дальнейшем снижении порога коэффициент искажений также равномерно начинает уменьшаться, достигая сотых долей процента при уровне лимитирования, равном 12 дБ (рис. 9). На слух это выглядит так, как будто перед регулятором порога включен компрессор со временем атаки порядка 500 миллисекунд, который и "сбрасывает" уровень сигнала на входе лимитера до значения с низким уровнем искажений. Радиокнопка Hard/Soft как раз и регулирует время реакции лимитера на "перекомпрессию". В режиме Soft, кстати, модуль потребляет ресурсов приблизительно в десять раз больше, чем в режиме Hard.

За счет высокого уровня гармоник спектр появившихся колебаний значительно шире, чем даже у Wave Hammer (рис. 10).

Это, вероятно, сделано не случайно, а мы имеем дело с программной реализацией идеи спектрального компрессора, аналогичного известной модели DL 251 от Drawmer. Суть которой в следующем.

Любой широкополосный компрессор имеет тенденцию к подавлению высокочастотных составляющих спектра сигнала. Происходит это потому, что практически в любой фонограмме уровень низкочастотной части спектра выше, чем высокочастотной, и компрессор, срабатывая от низкочастотного сигнала, уменьшает усиление во всем спектре частот, в том числе и в высокочастотной его части, что воспринимается ухом как заметное "приглушение" фонограммы. Чтобы компенсировать потерю высокочастотных гармоник, после компрессора включают прибор, заново генерирующий утраченные в процессе компрессии гармоники и делающий это не постоянно, а только в момент срабатывания компрессора, причем уровень генерируемых гармоник определяется глубиной компрессии. Так, в случае с Timeworks Mastering Compressor, это позволяет сохранить не только "легкость" звучания фонограммы, но и где-то даже иллюзию ее прозрачности.

Таким образом, работа с Mastering Compressor несколько отличается от работы с аналогичными устройствами. При высоких уровнях лимитирования здесь не растут искажения, а просто звук приобретает явно слышимую характерную "перекачанную" структуру. Другими словами, используя этот модуль, фонограмму испортить сложней, чем при помощи какого-либо другого алгоритма лимитирования - не потому, кстати, что он чем-то лучше других, а просто артефакты, вносимые им в звук при высоких уровнях компрессии, лучше заметны на слух и их идентификация не представляет труда даже для неподготовленного слушателя.

DSP-FX Optimizer 24-разрядное детище компании Power Technology из обоймы DSP-FX Virtual Pack 6.2a. Так же, как другие представители семейства максимайзеров, содержит встроенные алгоритмы дизеринга и нойс-шейпинга. Этот модуль интересен лишь тем, что может работать автономно, без хост-программы. В остальном он ничем не примечателен. Органы управления традиционны (рис. 11) - регуляторы порога Gain Boost (Threshold), выходного уровня Max Output и времени восстановления Release Time. Правее расположены органы управления дизерингом.  

 

   

Стандартный набор индикаторов, причем индикатор уровня лимитирования очень схематичен - шарик, бегающий по графику динамической характеристики и отмечающий положение пика сигнала.

Исследование спектра обработанного модулем тестового файла показало следующее: при уровне сигнала ниже порога срабатывания программа передает сигнал на выход без изменений. Далее, с понижением порога в спектре появляются заметные искажения - как гармонические, так и интермодуляционные. При уровне лимитирования 1 дБ коэффициент гармоник составил 0,76%, а интермодуляционные искажения превысили 2,5% (рис. 12).

Искажения равномерно растут до тех пор, пока уровень компрессии не достигнет значения 7 дБ. Рост гармоник останавливается на отметке 2,07%, а рост интермодуляционных искажений - на 12,04% (рис. 13).

Иными словами - имеем тот же L1 Ultramaximizer, только немного хуже. Паразитные колебания уходят далеко в средне- и высокочастотную область спектра, засоряя спектр сигнала непроходимым частоколом гармоник, но для реализации спектрального компрессора их явно недостаточно. В результате прозрачность фонограммы, обработанной этим алгоритмом, заметно теряется даже при небольших уровнях лимитирования.