Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Sbornik_statey_po_teorii_zvuka.pdf
Скачиваний:
198
Добавлен:
22.05.2015
Размер:
4.96 Mб
Скачать

фазовые искажения. Сигнал 440 Гц, хоть и не изменяя своей амплитуды, приобрел фазовый сдвиг, да такой здоровый, что его уже можно называть задержкой. Проблема в том, что этот фазовый сдвиг разный для разных частот - если бы в сигнале была частота 100 Гц, она бы почти не сдвинулась во времени. Фазовые искажения - большой и почти единственный серьезный минус IIR фильтров.

Чего ни в коем случае не нужно делать:

Без нужды использовать IIR фильтры высокого порядка. Фазовые искажения такого масштаба - очень неприятная штука.

Во многих программах, например в SoundForge, надо быть особо осторожным - там не задается порядок фильтра, а задается лишь желаемая резкость перехода. Если вы скажете ему в параметрическом эквалайзере что-то вроде того, что хотите уменьшить частоты от 49 до 51 Гц на 60 дБ, при этом не трогая частоты уже 48 и 52 Гц - он вам вломит фильтр такого огромного порядка, что вы потом свой звук вообще не узнаете.

[примечание: в версиях, начиная с 4.0, в SoundForge в этом месте (да и практически везде) начали применяться другие фильтры - так называемые windowed-sinc фильтры - частный случай FIR фильтров, которые уже не вносят фазовых искажений (см. далее). Сейчас встретить IIR фильтры в чистом виде можно, в основном, только в программах, ориентированных на обработку звука в реальном времени - они очень быстры)]

Для чего они нужны:

Слабые фильтры (с порядком 2 - 3) - хорошее средство для уменьшения высоких или низких частот с определенной частоты. Что и применяется в параграфических эквалайзерах (high-shelf и lowshelf).

В принципе, с помощью этих фильтров не очень высокого порядка можно слегка (на пару дБ) вырезать определенные частоты. Стоит разобраться, какие искажения вам более предпочтительны - фазовые задержки (IIR) или временные (FFT фильтрация).

Для фильтрации частот вне слышимой области (или в не очень важной области). Фазовые искажения на далеком расстоянии от границы фильтрации минимальны, поэтому если вы работаете с файлом в 192 кГц и хотите убрать все частоты выше 57 кГц (ну хочется вам.. :) - можете смело использовать там IIR фильтр 30-го порядка.

В виде слабых фильтров второго порядка (параграфические эквалайзеры) - изменять тональную окраску звука там, где требуется точность по частоте (эти фильтры можно настроить очень точно даже в области низких частот).

Ими удобно, например, гасить резонансы чего-то с чем-то. Или убирать DTFM частоты (специальные Notch фильтры) - обычно для этого используется фильтры с порядками 2 - 6.

В любом случае - фильтры порядка более 4 не следует использовать с большим энтузиазмом. Не нужно без нужды вносить фазовые искажения. Фильтры малых порядков - довольно безобидная штука, но они имеют плавные границы воздействий и сравнительно слабый эффект в несколько дБ (этого, однако, почти всегда достаточно при правильной постановке задачи). IIR фильтры всегда так или иначе вносят фазовые искажения, но при правильном применении эти искажения незаметны - искажения фазы (задержки) до сотен градусов ухо не замечает.

FIR фильтры

От Finite Impulse Response - 'конечная отдача импульса'. Эти фильтры реализованы через процесс, называемый сверткой (convolution): есть таблица размера n, которая комбинирует (складывает) последние n точек функции в одну выходную точку, умножая каждую из них на определенное число - весовой коэффициент. Таблица свертки строится один раз в начале по требуемому частотному воздействию.

[На самом деле влоб делать свертку очень медленно. Применяется другой процесс, для больших сверток в сотни раз более быстрый, но полностью аналогичный этому - FFT, умножение в частотном пространстве, обратный синтез].

Эти фильтры обычно применяются в диалогах типа эквалайзера. Иногда каждому движку (регулятору усиления определенной частоты) соответствует свой фильтр, воздействующий на

определенные частоты, иногда - синтезируется таблица свертки на основе всех движков сразу, то есть применяется один сложный фильтр.

FIR фильтры - то, ради чего стоило вообще придумывать цифровую фильтрацию. Это наиболее безопасный и надежный из всех процессов, имеющий лишь одно слабое место - трудно управляемые параметры фильтрации. Сделать фильтр именно до мелочей такой, какой нам нужно, особенно в области низких частот, может оказаться излишне трудоемким, что приведет к очень медленной обработке. Для этого придется использовать слишком большие размеры свертки, а это замедлит до трудно терпимой скорости даже в сотни раз ускоренный процесс. Однако сверхсильная точность не всегда нужна, а очень хорошую точность обработки за приемлемое время он всё же обеспечивает.

Кроме слабой управляемости к недостаткам можно отнести невысокую скорость работы фильтров с большой сверткой (более точных фильтров). В принципе, сделав огромную свертку, мы получим именно такой фильтр, как мы хотим, но фильтровать он будет почти вечно. В этом, а не в чем либо другом, кроется причина того, что эти фильтры используются лишь в эквалайзерах - там не нужна особая точность, важны лишь общие тенденции, которые неплохо соблюдаются и с маленькими свертками.

Исходный сигнал

После FIR фильтра

Можно убедится в том, что фильтр совершенно не затронул те сигналы, которые не должен был затрагивать. Правильно сконструированный FIR фильтр не влияет на фазу. В общем можно сказать так: эти фильтры делают именно то, что должны делать, и ничего более.

О точности FIR фильтров:

Во многих программах есть параметр 'точность' (accuracy), иногда она даже напрямую измеряется в точках (points) - числе элементов свертки, или convolution length (size). Этот параметр влияет только на точность фильтра. Это не качество, это то, с какой точностью фильтр выполняет ваш заказ.

Если вы воздействуете на глубокий бас (около 40-50 Гц) - вам потребуются большие свертки (около 4000 точек) или самое качественное значение. Если вы работаете лишь с частотами выше 5 кГц - вам хватит свертки в 500 точек, которая будет работать значительно быстрее. Если вы хотите влиять на басы и поставите свертку 200 точек - единственное, что пойдет не так - фильтр просто не будет

воздействовать на басы должным образом, вот и всё. Потери качества обработки не будет, будет лишь потеря смысла.

Для чего они нужны:

Ответ очень простой. Если вы можете сделать то, что вам нужно, с помощью FIR фильтра - делайте это. Более корректного отношения к необрабатываемым сигналам другими фильтрами не добиться.

Целесообразно действовать так: сначала с помощью любых фильтров понять, что вам нужно, а потом попытаться воплотить это с помощью FIR фильтров. Это наиболее качественная и корректная настраиваемая фильтрация из всех возможных. Именно на таких фильтрах работают качественные цифровые эквалайзеры, тогда как аналоговые - на IIR, единственных фильтрах, которые можно реализовать в аналоговой схеме.

Единственное что - не пытайтесь применить FIR фильтры для точной фильтрации. Они могут это делать, так же идеально как и обычную обработку, но слишком медленно. Для работы с конкретными заданными частотами приходится использовать FFT или IIR фильтрацию.

Введение

Несмотря на то, что MP3 остается форматом de facto сжатия музыки на компьютере, существует большое количество других, менее известных стандартов сжатия. Часть из них устарела и практически не используется, некоторые появились недавно и еще не успели занять свою нишу. Здесь я остановлюсь лишь на форматах, использующих сжатие с потерями (lossy compression), как позволяющих добиться наибольшей степени компрессии аудиоданных.

Что значит "сжатие с потерями"? Лишь то, что файл, кодированный данным способом, а затем снова декодированный в wave файл будет бинарно отличаться от первоначального файла (т.е. содержимое файлов будет различным), хотя разница может быть малозаметна или совершенно незаметна на слух. Каким же образом удается добиться подобного результата? На эти вопросы отвечает психоакустика (см. например, подборку статей журнала «Звукорежиссер» за 1999-2000 г.г.), относительно новая наука, занимающаяся изучением того, как человеческий мозг воспринимает звук. Дело в том, что далеко не всякая звуковая информация воспринимается нами. Например, мы можем достаточно отчетливо слышать шаги по асфальтовой дорожке в отсутствие посторонних звуков, но те же самые шаги совершенно неслышны, если рядом проезжает легковой автомобиль. Это так называемый эффект маскировки: тихий звук становится совершенно неслышим, если рядом расположен источник громкого звука. Данный эффект, наряду с некоторыми другими используется в психоакустических моделях современных кодеков. Сочетание обычных методов компрессии данных и знания того, какая информация воспринимается нашим мозгом, а какая нет, позволяет добиться степени сжатия музыки 1:10 при приемлемом качестве звучания.

Ниже я привел краткое описание наиболее распространенных и известных форматов сжатия музыкальных файлов, которые могли бы быть использованы для создания домашней музыкальной коллекции.

Wave файл с компрессией ADPCM

Кодек Microsoft ADPCM (Adaptive Differential Pulse Code Modulation, адаптивная дифференциальная импульсно-кодовая модуляция), некогда популярный у пиратов, не желавших тратить время на кодирование музыки в MP3 - далеко не образец качества. Для уменьшения объема файла приходилось создавать восьми или даже четырехбитные wave файлы с частотой дискретизации 22Кгц, что давало весьма слабый результат. И если MP3 файл с фиксированным битрейтом 128Кб/с

звучит более-менее сносно (а для некоторых слушателей - идеально), то аналогичного размера wave файл, сжатый кодеком ADPCM звучит просто ужасно.

ADPCM использует очень простой алгоритм сжатия, который обеспечивает высокую скорость кодирования на слабых компьютерах, но абсолютно неприменим для хранения музыки. Крайне низкое качество звучания при приемлемой степени сжатия привели к тому, что в данный момент для сжатия музыки данный кодек почти не используется. Исключением являются компьютерные игры, создатели которых нередко используют ADPCM WAV файлы для хранения саундтреков.

MP3

MPEG (от Motion Picture Expert Group – группа экспертов по движущимся изображениям) 1 Layer III (реже MPEG 2 Layer III), также иногда именуемый людьми некомпетентными MPEG 3 (такого формата не существует) уже долгие годы является для многих пользователей единственной ассоциацией со словосочетанием "компьютерная музыка". Разработанный в конце 80х годов, нетребовательный к ресурсам (воспроизведение MP3 файлов возможно даже на компьютерах с процессорами 486) формат, позволявший сжимать музыку до 10 раз без катастрофических потерь качества быстро прижился на домашних компьютерах. Хотя еще недавно большинство кодировщиков были платными, сейчас несложно найти проигрыватели и кодировщики, распространяемые по лицензии freeware. Через некоторое время стало ясно, что "CD качество" при битрейте в 128 Кб/с невозможно, по крайней мере с данным стандартом, так как с оснащением компьютеров более совершенными звуковыми картами и акустическими

системами позволяло выявить недостатки подобного кодирования. Вполне закономерным стало повышение битрейта и совершенствование кодеков: технологии VBR и Joint Stereo (комбинированное стерео) позволяли значительно сократить размер файла при повышении качества. Современные кодировщики позволяют достичь качества звучания, на слух неотличимого от компакт диска на битрейтах в диапазоне 192-256 Кб/с даже на высококачественной аппаратуре. Тем не менее, в некоторых редких случаях (при наличии хорошего слуха и аппаратуры) даже битрейта 320Кб/с бывает недостаточно. Трудность заключается в том, что сам по себе формат MP3 имеет недостатки, от которых практически невозможно избавиться. Одним из них является так называемый эффект преэхо, из-за которого кодирование определенных сигналов сопряжено со значительными трудностями. На практике же использование постоянного битрейта 320Кб/с зачастую оказывается избыточным и чаще всего приводит к бессмысленной трате места.

Качество звучания MP3 файла может сильно зависеть от выбранных кодировщика и проигрывателя. Для создания MP3 файлов идеально подходит бесплатный LAME (кодировщики Fraunhofer являются платными и позволяют достичь сравнимого с LAME качества, а кодеры Xing, Blade и большинство других не заслуживают внимания), а для воспроизведения – одна из последних версий Winamp 2.

MP3pro

Данный формат был создан вовсе не для того, чтобы "убить" или "заменить" MP3, позволяя лишь добиться приемлемого качества звучания на низких битрейтах. Если "классический" битрейт в 128 Кб/с некоторыми слушателями и воспринимается, как дающий качество, близкое к идеальному, то даже незначительное его понижение вызывает появление большого количества отчетливо слышимых искажений. Для передачи музыки в интернет используются обычно именно низкие битрейты, которые являются далеко не сильной стороной "обычного" MP3. Здесь MP3pro и проявляет себя с лучшей стороны: частичная совместимость с MP3 (то есть MP3pro файлы, будут проигрываться и обычными MP3 плеерами, не поддерживающими нового формата, но со значительным ухудшением качества) и новая технология SBR, восстанавливающая высокие частоты способны в немалой степени посодействовать продвижению нового формата на просторах глобальной сети. Для хранения музыки высокого качества MP3pro совершенно не годится: даже при использовании максимально доступного для большинства кодеков битрейта 96 Кб/с слышны искажения, хотя по сравнению со многими другими форматами, поддерживающими низкие битрейты результаты работы кодека MP3pro заметно лучше. При повышении битрейта качество файлов падает по сравнению с остальными форматами и уже при битрейтах 128Кб/с разумнее использовать

MP3 или OGG Vorbis.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]