- •1.1.Форматы общего типа
- •2.2. Сжатие m-Law и a-Law
- •2.3. Au
- •2.4. Система сжатия adpcm
- •2.5. Wave
- •2.7. Aiff
- •3. Системы сжатия, основанные на преобразованиях сигналов с использованием mpeg технологии
- •3.1. Основные стандарты mpeg
- •3.2. Mpeg-1 (iso/iec 11172-3)
- •3.3. Mpeg-2 bc (iso/iec 13818-3)
- •3.4. Mpeg-2 Advanced Audio Coding (aac)(iso/iec 13818-7)-
- •3.5. Сравнение mpeg-acc и mpeg-2 bc
- •3.6 Mpeg-4 (iso/iec 14496-3)
- •3.6.1 Что нового содержит mpeg-4 Audio по сравнению с mpeg-2 Audio?
- •3.6.2. Дополнительные функциональные возможности mpeg-4
- •3.6.3. Аудио объекты в mpeg-4
- •3.6.4.Использование mpeg-4 кодер речи (speech coder) вместо itu кодека
- •3.5. A2b music ( based on mpeg acc)
- •3.6.Vqf - (vector quantization format)
- •3.6.1 Размер файлов:
- •3.6.2 Качество звука:
- •3.6.3 Использование cpu:
- •3.6.4 Недостатки:
- •3.6.5 Системные требования:
- •3.6.6 Mp3 против vq. Сравнительная характеристика:
- •3.4.Dolby ac-3
- •3.4.3 Применение ac-3
- •3.6. QDesign Music
- •3.6.1. Обзор
- •3.6.2. Software
- •3.6.3. Преимущества технологии qDesign Music
- •3.6.4. Ограничения
- •3Сводная таблица характеристик:
- •3.7. Aspec
- •4.Методы сжатия речевых сигналов.
- •4.1. Основные типы систем сжатия речи
- •4.2. Некоторые системы кодирования речи на основе стандартов itu-t
- •4.4.InterWave
- •4.5.TrueSpeech
- •4.6. ToolVox for the Web
- •5. Основные форматы аудио данных в Интернете на музыкальных сайтах :
2.7. Aiff
AIFF -(Audio Interchange File Format) - используется на машинах SGI и Macintosh. Он
во многом напоминает WAVE , однако, в отличие от него позволяет использовать оцифрованный звук и шаблоны (аналогично MOD)
3. Системы сжатия, основанные на преобразованиях сигналов с использованием mpeg технологии
3.1. Основные стандарты mpeg
MPEG-1 (ISO/IEC 11172-3) предоставляет возможность :
одноканального (‘моно’) и двухканального(‘стерео’ или‘двойное моно’- ‘dual-mono’) кодирования с частотой дискретизации 32, 44.1, и 48 kHz. Предопределённые скорости передачи данных изменяются в диапазоне от 32 до 448 kbit/s для Layer I (1-го уровня), от 32 до 384 kbit/s для Layer II (2-го уровня), и от 32 до 320 kbit/s для Layer III (3-го уровня).
MPEG-2 BC (ISO/IEC 13818-3) предоставляет :
обладающее обратной совместимостью с MPEG-1многоканальное расширение; до 5 основных каналов плюс‘улучшенный низкочастотный канал’(LFE -LowFrequentEnhancement channel); поддерживаемая скорость потока данных - до 1 Mbit/s;
расширение MPEG-1 в сторону уменьшения частоты дискретизации - 16, 22.05, и 24 kHz для потоков от 32 до 256 kbit/s (Layer I) и от 8 до 160 kbit/s (Layer II & Layer III).
MPEG-2 AAC (ISO/IEC 13818-7) предоставляет :
высококачественное кодирование аудио сигнала, используется от 1 до 48 каналов, частота дискретизации - от 8 до 96 kHz, включает поддержку многоканальных, многоязыковых и многопроцессорных возможностей.AAC поддерживает скорость потока данных 8 kbit/s для кодирования речи одного диктора и вплоть до 160 kbit/s на канал для очень высококачественного преобразования, которое допускает многократное кодирование/декодирование. Три разновидности (profiles) AAC предоставляют различный уровень сложности и масштабируемости.
MPEG-4 (ISO/IEC 14496-3) будет предоставлять возможность :
кодирование и совмещение естественных и синтезированных аудио-объектов в очень широком диапазоне скоростей потока данных.
3.2. Mpeg-1 (iso/iec 11172-3)
одноканальное (‘моно’) и двухканальное(‘стерео’ или‘двойное моно’- ‘dual-mono’) кодирование с частотой дискретизации 32, 44.1, и 48 kHz. Предопределённые скорости передачи данных изменяются в диапазоне от 32 до 448 kbit/s для Layer I (1-го уровня), от 32 до 384 kbit/s для Layer II (2-го уровня), и от 32 до 320 kbit/s для Layer III (3-го уровня).
Без предварительной обработки, цифровые аудио сигналы обычно состоят из 16-битных выборок, записанных при частоте дискретизации, превышающей удвоенный частотный диапазон исходного аудио сигнала (например, 44.1 kHz дляCD). Таким образом, потребуется более чем 1400 бит, чтобы представить только 1 секунду стерео сигнала при качестве, не уступающемCD. ИспользуяMPEG кодировку, Вы сможете сжать исходные данные сCDв 12 раз без потери качества. При сжатии в 24 и более раз, результат будет всё же ощутимо лучше того, который мог быть получен уменьшением частоты дискретизации и размеров выборки. По существу, это реализуется за счёт т.н.‘распознающего кодирования’ (‘perceptual coding’), в котором используется тот же принцип, что и при распознавании звуковых волн человеческим ухом (см.‘Основы распознающего аудио кодирования - или:В чём секрет?’).
При использовании MPEGкодирования можно достичь следующих коэффициентов сжатия данных:
1:4 на Layer 1 (соответствует 384 kbps для стерео сигнала),
1:6...1:8 на Layer 2 (соответствует 256..192 kbps для стерео сигнала),
1:10...1:12 на Layer 3 (соответствует 128..112 kbps для стерео сигнала),
с сохранением качества аудио CD.
Используя стереоэффекты и ограничивая частотный диапазон аудио сигнала, схемы кодирования позволяют достичь приемлемого качества даже при более низких скоростях потока данных. Layer-3является наиболее мощным членом семействаMPEG. Для выбранного качества сигнала он требует наименьшей скорости потока данных - или для фиксированной скорости, он обеспечивает лучшее качество (см.‘Подробное описаниеLayer-3 или ПочемуLayer-3работает так хорошо?’).
Типичные характеристики Layer-3:
относительное качество диапазон режим скорость потока сжатие
звука данных
"телефонная связь" 5 kHz mono 8 kbps* 96:1
"лучше, чем
коротковолновое 4.5 kHz mono 16 kbps* 48:1
"лучше, чем AM радио" 7.5 kHz mono 32 kbps 24:1
"примерно как FM радио" 11 kHz stereo 56..64 kbps 26..24:1
"приближенное к CD" 15 kHz stereo 96 kbps 16:1
"CD" > 15 kHz stereo 112..128 kbps 14..12:1
*: Фраунгофер (Fraunhofer) использует non-ISO расширение Layer-3 для увеличения производительности ("MPEG 2.5")
Вообще, Layer-3 является неплохим решением для обеспечения высокого качества при низкой скорости потока данных.