- •1.1.Форматы общего типа
- •2.2. Сжатие m-Law и a-Law
- •2.3. Au
- •2.4. Система сжатия adpcm
- •2.5. Wave
- •2.7. Aiff
- •3. Системы сжатия, основанные на преобразованиях сигналов с использованием mpeg технологии
- •3.1. Основные стандарты mpeg
- •3.2. Mpeg-1 (iso/iec 11172-3)
- •3.3. Mpeg-2 bc (iso/iec 13818-3)
- •3.4. Mpeg-2 Advanced Audio Coding (aac)(iso/iec 13818-7)-
- •3.5. Сравнение mpeg-acc и mpeg-2 bc
- •3.6 Mpeg-4 (iso/iec 14496-3)
- •3.6.1 Что нового содержит mpeg-4 Audio по сравнению с mpeg-2 Audio?
- •3.6.2. Дополнительные функциональные возможности mpeg-4
- •3.6.3. Аудио объекты в mpeg-4
- •3.6.4.Использование mpeg-4 кодер речи (speech coder) вместо itu кодека
- •3.5. A2b music ( based on mpeg acc)
- •3.6.Vqf - (vector quantization format)
- •3.6.1 Размер файлов:
- •3.6.2 Качество звука:
- •3.6.3 Использование cpu:
- •3.6.4 Недостатки:
- •3.6.5 Системные требования:
- •3.6.6 Mp3 против vq. Сравнительная характеристика:
- •3.4.Dolby ac-3
- •3.4.3 Применение ac-3
- •3.6. QDesign Music
- •3.6.1. Обзор
- •3.6.2. Software
- •3.6.3. Преимущества технологии qDesign Music
- •3.6.4. Ограничения
- •3Сводная таблица характеристик:
- •3.7. Aspec
- •4.Методы сжатия речевых сигналов.
- •4.1. Основные типы систем сжатия речи
- •4.2. Некоторые системы кодирования речи на основе стандартов itu-t
- •4.4.InterWave
- •4.5.TrueSpeech
- •4.6. ToolVox for the Web
- •5. Основные форматы аудио данных в Интернете на музыкальных сайтах :
Компьютерное аудио
- форматы аудио-файлов и методы компрессии
1. Введение
В настоящее время в зависимости от конкретных задач и вычислительных ресурсов используется большое количество типов и систем формирования аудио-файлов. Дать их однозначную классификацию достаточно затруднительно. Тем не менее, можно предложить следующее условное разбиение на следующие группы;
1. В зависимости от содержания
форматы общего типа, используемые независимо от содержания аудио-файла,
форматы, связанные с музыкальной информацией,
форматы, связанные с речевыми сообщениями
2. В зависимости от используемой системы сжатия:
форматы без сжатия
форматы с использованием сжатия без потерь (в данной работе не рассматриваются)
форматы с использованием сжатия с потерями
2.1 В зависимости от скорости сжатого потока данных
форматы сжатия с фиксированной скоростью потока (bit stream rate)
форматы сжатия с нефиксированной скоростью потока
3. В зависимости от формы использования аудио-данных
данные, используемые в виде файлов, хранящихся на носителе
данные, используемые в режиме streaming, то есть поступающие по сети в реальном времени в потоковом режиме.
4. В зависимости от реального назначения
- распространение музыки через Интернет
запись на СD чисто музыкальной информации
запись на CD sound треков для видеофильмов
запись цифрового звука для бытового и профессионального видео
передача и сохранение речевой информации
Необходимо отметить, что практически все аудио- системы в настоящеее время являются мультиформатными и часто сами являются подсистемами программ более широкого назначения, включающих в себя работу с графическими и видео -данными.
Далее перечислим ряд известных форм представления аудио данных с использованием различных методов сжатия. При этом необходимо отметить , что понятие формат аудио-файла часто может включать в себя не только описание соответствующей структуры данных , но и сведения о применяемой системе сжатия.
1.1.Форматы общего типа
1 . PCM - (pulse code modulatuion) - импульсно-кодовая модуляция
2. AU
3. AIFF - (Audio Interchange File Format)
4. WAVE
5. MOD
6. MIDI
7. CCITT A - law
8. CCITT μ - law
ADPCM - (adaptive Differential PCM) 32,24,16 Kbit (G.726)
, включая
IMA ADPCM
Microsoft ADPCM
1.2. Форматы для кодирования музыкальных файлов (возможно использование речевых данных)
В основе использования большинства рассматриваемых форматов лежат психо-акустические модели восприятия аудио информации слуховой системой человека
1. MP3
MPEG2 BC
MPEG2 ACC
MPEG4
REAL AUDIO
DOLBY AC-3
QDESIGN MUSIC
A2B (MPEG2 ACC)
TWAIN VQF
INTERWAVE
MSN Audio
Wox Ware Meta SOUND
1.3. Форматы для кодирования речевых данных (основаны на моделировании речевого тракта)
GSM 06.10
TRUESPEECH
ToolVox for WEB
ASPEC
ACELP 5.3 Kbit (G.723.1)
LDCELP 16 Kbit (G.728)
CSACELP 8 Kbit (G729)
MPMLQ 6.3.Kbit (G723.1)
CVCELP 8 Kbit (internal Motorola algorthm)
CVCELP 16 Kbit (internal Motorola algorthm)
WoxWare Meta Sound (win 95)
2. Методы сжатия и форматы аудио-файлов
2.1. PCM
PCM - pulse code modulation (импульсно -кодовая модуляция) - исходное представление сигнала с выхода линейного АЦП без преобразований. Расширение файла .wav (Microsoft) илиaiff (Unix, Mac)
поддерживаются следующие параметры сигналов:
частота дискретизации Гц |
разрядность БИТ |
режим |
скорость потока данных Кбайт/сек |
скорость потока данных Кбит/сек |
8000 |
8 |
моно |
8 |
64 |
8000 |
8 |
стерео |
16 |
128 |
8000 |
16 |
моно |
16 |
128 |
8000 |
16 |
стерео |
31 |
248 |
11025 |
8 |
моно |
11 |
88 |
11025 |
8 |
стерео |
22 |
176 |
11025 |
16 |
моно |
22 |
176 |
11025 |
16 |
стерео |
43 |
344 |
22050 |
8 |
моно |
22 |
176 |
22050 |
8 |
стерео |
43 |
344 |
22050 |
16 |
моно |
43 |
344 |
22050 |
16 |
стерео |
86 |
688 |
44100 |
8 |
моно |
43 |
344 |
44100 |
8 |
стерео |
86 |
688 |
44100 |
16 |
моно |
86 |
688 |
44100 |
16 |
стерео |
172 |
1376 |
48000 |
8 |
моно |
47 |
376 |
48000 |
8 |
стерео |
94 |
752 |
48000 |
16 |
моно |
94 |
752 |
48000 |
16 |
стерео |
188 |
1504 |
2.2. Сжатие m-Law и a-Law
m-Law - является международным стандартом кодирования, ранее известным как ITU (бывший CCITT) стандарт G.711. Каждая 16- битовая выборка пакуется в 8 бит с использованием логарифмической таблицы для кодирования с 13-битовым динамическим диапазоном, теряя при этом последние значащие три бита точности. Кодирование и декодирование очень быстрое и имеется универсальная поддержка.
Имеется небольшая вариация метода , называемая A-Law , используемая в Европейских телефонных системах.
Кодирование m-Law использует следующее соотношение:
,
где mp - максимальное значение оцифрованного звука,
m- константа (обычно 100 или 255).
Варианты сжатия m-Law поддерживаемые в WIN95/98
частота дискретизации ГЦ |
разрядность БИТ |
режим |
скорость потока данных Кбайт/сек |
8000 |
8 |
моно |
8 |
8000 |
8 |
стерео |
16 |
11025 |
8 |
моно |
11 |
11025 |
8 |
стерео |
22 |
22025 |
8 |
моно |
22 |
22025 |
8 |
стерео |
43 |
44100 |
8 |
моно |
43 |
44100 |
8 |
стерео |
86 |