Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Компьютерное аудио - форматы аудио-файлов и методы компрессии.doc
Скачиваний:
55
Добавлен:
01.05.2014
Размер:
352.77 Кб
Скачать

2.7. Aiff

AIFF -(Audio Interchange File Format) - используется на машинах SGI и Macintosh. Он

во многом напоминает WAVE , однако, в отличие от него позволяет использовать оцифрованный звук и шаблоны (аналогично MOD)

3. Системы сжатия, основанные на преобразованиях сигналов с использованием mpeg технологии

3.1. Основные стандарты mpeg

MPEG-1 (ISO/IEC 11172-3) предоставляет возможность :

  • одноканального (‘моно’) и двухканального(‘стерео’ или‘двойное моно’- ‘dual-mono’) кодирования с частотой дискретизации 32, 44.1, и 48 kHz. Предопределённые скорости передачи данных изменяются в диапазоне от 32 до 448 kbit/s для Layer I (1-го уровня), от 32 до 384 kbit/s для Layer II (2-го уровня), и от 32 до 320 kbit/s для Layer III (3-го уровня).

MPEG-2 BC (ISO/IEC 13818-3) предоставляет :

  • обладающее обратной совместимостью с MPEG-1многоканальное расширение; до 5 основных каналов плюс‘улучшенный низкочастотный канал’(LFE -LowFrequentEnhancement channel); поддерживаемая скорость потока данных - до 1 Mbit/s;

  • расширение MPEG-1 в сторону уменьшения частоты дискретизации - 16, 22.05, и 24 kHz для потоков от 32 до 256 kbit/s (Layer I) и от 8 до 160 kbit/s (Layer II & Layer III).

MPEG-2 AAC (ISO/IEC 13818-7) предоставляет :

  • высококачественное кодирование аудио сигнала, используется от 1 до 48 каналов, частота дискретизации - от 8 до 96 kHz, включает поддержку многоканальных, многоязыковых и многопроцессорных возможностей.AAC поддерживает скорость потока данных 8 kbit/s для кодирования речи одного диктора и вплоть до 160 kbit/s на канал для очень высококачественного преобразования, которое допускает многократное кодирование/декодирование. Три разновидности (profiles) AAC предоставляют различный уровень сложности и масштабируемости.

MPEG-4 (ISO/IEC 14496-3) будет предоставлять возможность :

  • кодирование и совмещение естественных и синтезированных аудио-объектов в очень широком диапазоне скоростей потока данных.

3.2. Mpeg-1 (iso/iec 11172-3)

  • одноканальное (‘моно’) и двухканальное(‘стерео’ или‘двойное моно’- ‘dual-mono’) кодирование с частотой дискретизации 32, 44.1, и 48 kHz. Предопределённые скорости передачи данных изменяются в диапазоне от 32 до 448 kbit/s для Layer I (1-го уровня), от 32 до 384 kbit/s для Layer II (2-го уровня), и от 32 до 320 kbit/s для Layer III (3-го уровня).

Без предварительной обработки, цифровые аудио сигналы обычно состоят из 16-битных выборок, записанных при частоте дискретизации, превышающей удвоенный частотный диапазон исходного аудио сигнала (например, 44.1 kHz дляCD). Таким образом, потребуется более чем 1400 бит, чтобы представить только 1 секунду стерео сигнала при качестве, не уступающемCD. ИспользуяMPEG кодировку, Вы сможете сжать исходные данные сCDв 12 раз без потери качества. При сжатии в 24 и более раз, результат будет всё же ощутимо лучше того, который мог быть получен уменьшением частоты дискретизации и размеров выборки. По существу, это реализуется за счёт т.н.‘распознающего кодирования’ (‘perceptual coding’), в котором используется тот же принцип, что и при распознавании звуковых волн человеческим ухом (см.‘Основы распознающего аудио кодирования - или:В чём секрет?’).

При использовании MPEGкодирования можно достичь следующих коэффициентов сжатия данных:

1:4 на Layer 1 (соответствует 384 kbps для стерео сигнала),

1:6...1:8 на Layer 2 (соответствует 256..192 kbps для стерео сигнала),

1:10...1:12 на Layer 3 (соответствует 128..112 kbps для стерео сигнала),

с сохранением качества аудио CD.

Используя стереоэффекты и ограничивая частотный диапазон аудио сигнала, схемы кодирования позволяют достичь приемлемого качества даже при более низких скоростях потока данных. Layer-3является наиболее мощным членом семействаMPEG. Для выбранного качества сигнала он требует наименьшей скорости потока данных - или для фиксированной скорости, он обеспечивает лучшее качество (см.‘Подробное описаниеLayer-3 или ПочемуLayer-3работает так хорошо?’).

Типичные характеристики Layer-3:

относительное качество диапазон режим скорость потока сжатие

звука данных

"телефонная связь" 5 kHz mono 8 kbps* 96:1

"лучше, чем

коротковолновое 4.5 kHz mono 16 kbps* 48:1

"лучше, чем AM радио" 7.5 kHz mono 32 kbps 24:1

"примерно как FM радио" 11 kHz stereo 56..64 kbps 26..24:1

"приближенное к CD" 15 kHz stereo 96 kbps 16:1

"CD" > 15 kHz stereo 112..128 kbps 14..12:1

*: Фраунгофер (Fraunhofer) использует non-ISO расширение Layer-3 для увеличения производительности ("MPEG 2.5")

Вообще, Layer-3 является неплохим решением для обеспечения высокого качества при низкой скорости потока данных.