Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Цифра.doc
Скачиваний:
3
Добавлен:
01.05.2025
Размер:
758.78 Кб
Скачать

Описание процесса кодирования

Подготовка к кодированию. Фреймовая структура. Перед кодированием исходный сигнал разбивается на участки, называемые фреймами, каждый из которых кодируется отдельно и помещается в конечном файле независимо от других. Последовательность воспроизведения определяется порядком расположения фреймов. Каждый фрейм может кодироваться с разными параметрами. Информация о них содержится в заголовке фрейма.

Начало кодирования. Кодирование начинается с того, что исходный сигнал с помощью фильтров разделяется на несколько, представляющих отдельные частотные диапазоны, сумма которых эквивалентна исходному сигналу.

Работа психоакустической модели. Для каждого диапазона определяется величина маскирующего эффекта, создаваемого сигналом соседних диапазонов и сигналом предыдущего фрейма. Если она превышает мощность сигнала интересующего диапазона или мощность сигнала в нем оказывается ниже определенного опытным путем порога слышимости, то для данного фрейма данный диапазон сигнала не кодируется.

Для оставшихся данных для каждого диапазона определяется, сколькими битами можно пожертвовать, чтобы потери от дополнительного квантования были ниже величины маскирующего эффекта. При этом учитывается, что потеря одного бита, ведет к повышению шума квантования на 6 dB.

Завершение кодирования. После завершения работы психоакустической модели формируется итоговый поток, который дополнительно кодируется.

Дополнение. Кроме того, кодирование стереосигнала допустимо четырьмя различными методами:

Dual Channel - Каждый канал получает ровно половину потока и кодируется отдельно как моно сигнал. Рекомендуется главным образом в случаях, когда разные каналы содержат принципиально разный сигнал - скажем, текст на разных языках.

Stereo - Каждый канал кодируется отдельно, но кодер может принять решение отдать одному каналу больше места, чем другому. Это может быть полезно в том случае, когда после отброса части сигнала, лежащей ниже порога слышимости или полностью маскируемой, оказалось, что код не полностью заполняет выделенный для данного канала объем, и кодер имеет возможность использовать это место для кодирования другого канала.

Joint Stereo (MS Stereo) - Стереосигнал раскладывается на средний между каналами и разностный. При этом второй кодируется с меньшим битрейтом. Это позволяет несколько увеличить качество кодирования в обычной ситуации, когда каналы по фазе совпадают. Но приводит и к резкому его ухудшению, если кодируются сигналы, по фазе не совпадающие. В частности, фазовый сдвиг практически всегда присутствует в записях, оцифрованных с аудиокассет, но встречается и на CD, особенно если CD сам был записан в свое время с магнитной ленты.

Joint Stereo (MS/IS Stereo) - Вводит еще один метод упрощения стереосигнала, повышающий качество кодирования на особо низких битрейтах. Состоит в том, что для некоторых частотных диапазонов оставляется уже даже не разностный сигнал, а только отношение мощностей сигнала в разных каналах. Понятно, для кодирования этой информации употребляется еще меньший битрейт.

В отличие от всех предыдущих, этот метод приводит к потере фазовой информации, но выгоды от экономии места в пользу среднего сигнала оказываются выше, если речь идет о очень низких битрейтах.

Анализ разных битрейтов.

Разные битрейты дают разное качество. Разные любители MP3 абсолютно по-разному оценивают степень приемлемости одних и тех же битрейтов и имеют свой взгляд на то, какой битрейт следует считать оптимальным. Кто-то выбирает 128kbs, другие 160kbs, третьи золотую середину - от 192kbs до 256kbs. Некоторые - 320kbs.

Тесты профессиональных экспертов, нанятых разработчиками формата, для выбранных тестовых композиций показали достаточность 256kbs для сохранения качества звучания, неотличимого человеческим слухом от исходного сигнала. И, хотя документированных доказательств никто не привел, этих высказываний достаточно, чтобы сделать вывод об обоснованности признания 256kbs не самым безупречным битрейтом, так как этого и следовало ждать.

То есть достаточного запаса качества 256kbs не дает, несмотря на то, что он на треть выше 192kbs, на котором отличия для вебмастера MP3 Tech оказались уже почти неощутимы.

Из этого можно сделать три вывода. Во-первых, битрейт 256kbs следует считать пограничным. Во-вторых, для абсолютного большинства пользователей он действительно совершенно достаточен. В-третьих, для безоговорочно высокого качества все же необходимо несколько увеличить запас.

С другой стороны, те же тесты определили MP3 160kbs... 192kbs как в большинстве случаев вполне приемлемые для хранения аудио на компьютере, например, в компьютерных играх, когда внимание отвлечено.

Следующий после 256kbs битрейт - 320kbs, он же - максимальный для кодирования аудио с характеристиками CD Audio, то есть 44.1 kHz 16bit Stereo. В данном случае мы имеем запас в 1/4 от битрейта 256 kbs, и его вполне можно считать достаточным в силу имеющихся данных о степени улучшения качества кодирования при кодировании на 160 kbs вместо 128 kbs.

Таким образом, можно свободно уменьшить объем CD Audio более чем вчетверо, используя 320 kbs, и быть спокойным за сохранение качества, или же использовать MP3 256 kbs, применяя сжатие в шесть раз.

И все же ни для кого не секрет, что самым популярным все же был и остается битрейт 128 kbs. Но при его использовании мы имеем скорее качество аудиокассеты и с очень низким уровнем шумов.

Способы хранения MP3

Стандарт MP3 не определяет никакого точного стандартного математического алгоритма кодирования. Вместо этого он определяет общую схему процесса кодирования, а также формат закодированного фрейма. Сами последовательности фреймов могут передаваться потоком (streaming) или храниться в файлах.

MP3 файл, как и поток, состоит из последовательно расположенных фреймов, между которыми может содержаться произвольная информация. Основное требование состоит в том, что не должно быть совпадений с сигнатурой начала фрейма.

Часто к последовательности фреймов добавляют стандартный заголовок мета-аудиоформата WAV, и получается то, что называют WAV-MP3. Немного подробнее о последнем будет сказано ниже, когда будет описываться ACM pro codec. Еще чаще к MP3-файлу добавляется информационный блок ID3v2, содержащий информацию об исполнителе, жанре, названии композиции, и другую подобную информацию о треке. Он добавляется в конце файла.

Характер потерь при кодировании

На низких битрейтах всегда срезаются мелкие, сравнительно тихие детали, наличие или отсутствие которых нередко серьезно меняет эмоциональную окраску композиции, придает или лишает ее таких эффектов, как ощущение чистоты звука (в той мере, в которой она присутствует в CD Audio).

Узкое место всех схем компрессии класса MPEG - участки с резкими изменениями сигнала. В случае MP3 задержка может достигать величин порядка 160 мс, теоретический минимум - 59 мс.

Тестирование качественности кодеров

Обычно тестирование кодеров проводится по степени сохранения формы АЧХ оригинального сигнала. При этом, очевидно, что при битрейтах 256 kbs/320 kbs АЧХ исходного файла и файла, полученного после декодирования, должны быть идентичными как на синтетических тестах (сгенерированный белый шум), так и на реальных звуковых сигналов. На более низких битрейтах следует в первую очередь следить за сохранением формы АЧХ в области низких и средних частот.

Сами тесты по сохранению формы АЧХ следует проводить не только на белом шуме, как это делается обычно, но и на достаточно сложных композициях, в комплексе это позволяет получить значительно более достоверные результаты.

Общий обзор основных используемых кодеров и области их применения

Самым важным моментом, определяющим качество кодера при кодировании на битрейтах порядка 192kbs и ниже, являются характеристики примененной психоакустической модели и алгоритма ее применения, аккуратность его реализации. В разработке качественной модели больше всего преуспел собственно разработчик формата, Fraunhofer IIS.

Другой известный производитель коммерческих MP3-кодеров, Xing Tech, специализируется на выпуске высокоскоростных кодеров. В их последних кодерах реализована техника переменного битрейта (VBR). Основное отличие от кодеров с постоянным битрейтом состоит в том, что в кодерах, основанных на технологии VBR, в качестве параметра задается не битрейт, а желаемый уровень качества. Теоретически, это должно давать MP3 нужного качества при минимально необходимом битрейте.

Остальные известные кодеры, авторство которых не принадлежит ни FhG IIS, ни Xing Tech, все как один основаны на ISO source - общедоступных исходных текстах кодеpа, относительно равномерно кодирующего разные частотные диапазоны, что приводит к наивысшему качеству кодирования на высоких битpейтах и вполне приличному - на 128 kbs, однако несколько иному по характеру искажений по сравнению с кодерами от FhG IIS на битрейтах порядка 128 kbs.

Front-end - программа, предлагающая оконный интерфейс для повышения комфортности работы с программами, его не имеющими. В случае MP3 - с кодерами, управляемыми из командной строки, а также установленного в системе кодека.

Что такое ACM pro codec (MP3-кодек)?

Формат WAV является метаформатом для данных любого типа. Имеет стандартный заголовок и описания областей данных, которых может быть несколько, способ же кодирования аудиосигнала может быть каким угодно. Вполне могут содержаться данные, к аудио отношения не имеющие.

Каждый метод кодирования, указываемый в заголовке, имеет собственный идентификатор, в соответствии с которым Windows и определяет, установлен ли кодек для работы с данным файлом, и если установлен - использует его.

Кодеки, индивидуальные для каждого подформата, регистрируются в системе при их установке, после чего становится возможным использовать WAV-файлы, содержащие аудиоданные в форматах, поддерживаемых данными кодеками.

Тем не менее, хотя для MP3 тоже существует, по крайней мере, один кодек ACM pro codec от FhG IIS, сам по себе формат из-за потерь при кодировании непригоден на роль промежуточного, поэтому в редакторах с WAV-MP3 работать не рекомендуется. Единственным разумным применением данного кодека можно считать декодирование WAV-MP3, либо их кодирование, когда по каким-либо причинам неудобно сделать это из нормального кодера. При установленном кодеке можно применять WAV-MP3 в качестве стандартных звуков Windows.

28