Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Parametric Coding of Stereo Audio_перевод.doc
Скачиваний:
5
Добавлен:
15.03.2015
Размер:
1.42 Mб
Скачать

3.2. Mono coding effects

As discussed in Section 1, bit-rate reduction in conventional lossy audio coders is obtained predominantly by exploiting the phenomenon of masking. Therefore, lossy audio coders rely on accurate and reliable masking models, which are often applied to individual channel signals in the case of a stereo or multichannel signal. For a parametric-stereo extended audio coder, however, the masking model is applied only once on a certain combination of the two input signals. This scheme has two implications with respect to masking phenomena.

The first implication relates to spatial unmasking of quantization noise. In stereo waveform or transform coders, individual quantizers are applied on the two input signals or on linear combinations of the input signals. As a consequence, the injected quantization noise may exhibit different spatial properties than the audio signal itself. Due to binaural unmasking, the quantization noise may thus become audible, even if it is inaudible if presented monaurally. For tonal material, this unmasking effect (or BMLD, quantified as threshold difference between a binaural condition and a monaural reference condition) has shown to be relatively small (about 3 dB, see [83, 84]). However, we expect that for broadband maskers, the unmasking effect is much more prominent. If one assumes an interaurally in-phase noise as a masker, and a quantization noise which is either inter-aurally in-phase or interaurally uncorrelated, BMLDs are reported of 6 dB [85]. More recent data revealed BMLDs of 13 dB for this condition, based on a sensitivity of changes in the correlation of 0.045 [86]. To prevent these spatial unmasking effects of quantization noise, conventional stereo coders often apply some sort of spatial unmasking protection algorithm.

For a parametric stereo coder, on the other hand, there is only one waveform or transform quantizer, working on the mono (downmix) signal. In the stereo reconstruction phase, both the quantization noise and the audio signal present in each frequency band will obey the same spatial properties. Since a difference in spatial characteristics of quantization noise and audio signal is a prerequisite for spatial unmasking, this effect is less likely to occur for parametric-stereo enhanced coders than for conventional stereo coders.

Основываясь на предыдущих рассуждениях, будем считать IID, ITD и когерентность межканальными параметрами. Если все три межканальных параметра восстанавливаются верно, предполагается, что интерауральные параметры исходного и декодированного сигнала одинаковы (но отличаются от параметров интерауральных сигналов).

3.2. Эффекты моно кодирования.

Как говорилось в главе 1, снижение скорости цифрового потока в стандартных аудио кодерах с потерями осуществляется преимущественно с использованием явления маскировки. Поэтому аудио кодеры с потерями основываются на точных и надежных моделях маскировки, которые в случае многоканального или стерео сигнала применяются к каждому каналу в отдельности. Для улучшенных параметрических стерео кодеров, однако, модели маскировки применяются только один раз для определенной комбинации двух входных сигналов. В такой схеме явление маскировки можно применить двумя способами.

Первый относится к тому, что шум квантования в пространстве не маскируется. В стерео кодерах формы сигнала либо в кодерах на основе ДКП для каждого из двух входных сигналов либо для линейной комбинации входных сигналов применяются индивидуальные квантователи. Как следствие, дополнительный шум квантования может быть причиной изменения пространственных параметров сигнала по отношению к исходному. В результате отсутствия бинауральной маскировки, шум квантования может стать слышимым даже если его не слышно в моно формате. В случае тональных сигналов показано, что эффект отсутствия маскировки (или BMLD, измеряющийся как пороговая разность между бинауральным и моноуральным условиями) относительно мал (около 3 дБ, смотри [83, 84]). Однако ожидается, что для широкополосных маскирующих устройств эффект отсутствия маскировки гораздо более заметен. Если эффект проявляется в маскировании шумом квантования, который либо интераурально синфазен, либо интераурально некоррелирован, BMLDs составляет 6 дБ [85]. Более ранние данные указывают 13 дБ, основываясь на чувствительности к изменениям корреляции в 0.045 [86]. Чтобы избежать этого эффекта, в стандартных стерео кодерах часто применяют различного рода алгоритмы защиты от отсутствия маскировки.

С другой стороны, в случае параметрического стерео кодера существует только один квантователь формы волны либо квантователь на основе ДКП, работающий с моно сигналом (подвергнутым даунмиксу). На этапе восстановления стерео, шум квантования и звуковой сигнал, присутствующие в каждой полосе частот, будут обладать одинаковыми пространственными параметрами. Так как разница в пространственных характеристиках шума квантования и звукового сигнала является необходимым условием для отсутствия пространственной маскировки, этот эффект будет значительно меньше проявляться в параметрических кодерах, нежели в стандартных стерео кодерах.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]