 
        
        - •1.1.Форматы общего типа
- •2.2. Сжатие m-Law и a-Law
- •2.3. Au
- •2.4. Система сжатия adpcm
- •2.5. Wave
- •2.7. Aiff
- •3. Системы сжатия, основанные на преобразованиях сигналов с использованием mpeg технологии
- •3.1. Основные стандарты mpeg
- •3.2. Mpeg-1 (iso/iec 11172-3)
- •3.3. Mpeg-2 bc (iso/iec 13818-3)
- •3.4. Mpeg-2 Advanced Audio Coding (aac)(iso/iec 13818-7)-
- •3.5. Сравнение mpeg-acc и mpeg-2 bc
- •3.6 Mpeg-4 (iso/iec 14496-3)
- •3.6.1 Что нового содержит mpeg-4 Audio по сравнению с mpeg-2 Audio?
- •3.6.2. Дополнительные функциональные возможности mpeg-4
- •3.6.3. Аудио объекты в mpeg-4
- •3.6.4.Использование mpeg-4 кодер речи (speech coder) вместо itu кодека
- •3.5. A2b music ( based on mpeg acc)
- •3.6.Vqf - (vector quantization format)
- •3.6.1 Размер файлов:
- •3.6.2 Качество звука:
- •3.6.3 Использование cpu:
- •3.6.4 Недостатки:
- •3.6.5 Системные требования:
- •3.6.6 Mp3 против vq. Сравнительная характеристика:
- •3.4.Dolby ac-3
- •3.4.3 Применение ac-3
- •3.6. QDesign Music
- •3.6.1. Обзор
- •3.6.2. Software
- •3.6.3. Преимущества технологии qDesign Music
- •3.6.4. Ограничения
- •3Сводная таблица характеристик:
- •3.7. Aspec
- •4.Методы сжатия речевых сигналов.
- •4.1. Основные типы систем сжатия речи
- •4.2. Некоторые системы кодирования речи на основе стандартов itu-t
- •4.4.InterWave
- •4.5.TrueSpeech
- •4.6. ToolVox for the Web
- •5. Основные форматы аудио данных в Интернете на музыкальных сайтах :
Компьютерное аудио
- форматы аудио-файлов и методы компрессии
1. Введение
В настоящее время в зависимости от конкретных задач и вычислительных ресурсов используется большое количество типов и систем формирования аудио-файлов. Дать их однозначную классификацию достаточно затруднительно. Тем не менее, можно предложить следующее условное разбиение на следующие группы;
1. В зависимости от содержания
- форматы общего типа, используемые независимо от содержания аудио-файла, 
- форматы, связанные с музыкальной информацией, 
- форматы, связанные с речевыми сообщениями 
2. В зависимости от используемой системы сжатия:
- форматы без сжатия 
- форматы с использованием сжатия без потерь (в данной работе не рассматриваются) 
- форматы с использованием сжатия с потерями 
2.1 В зависимости от скорости сжатого потока данных
- форматы сжатия с фиксированной скоростью потока (bit stream rate) 
- форматы сжатия с нефиксированной скоростью потока 
3. В зависимости от формы использования аудио-данных
- данные, используемые в виде файлов, хранящихся на носителе 
- данные, используемые в режиме streaming, то есть поступающие по сети в реальном времени в потоковом режиме. 
4. В зависимости от реального назначения
- распространение музыки через Интернет
- запись на СD чисто музыкальной информации 
- запись на CD sound треков для видеофильмов 
- запись цифрового звука для бытового и профессионального видео 
- передача и сохранение речевой информации 
Необходимо отметить, что практически все аудио- системы в настоящеее время являются мультиформатными и часто сами являются подсистемами программ более широкого назначения, включающих в себя работу с графическими и видео -данными.
Далее перечислим ряд известных форм представления аудио данных с использованием различных методов сжатия. При этом необходимо отметить , что понятие формат аудио-файла часто может включать в себя не только описание соответствующей структуры данных , но и сведения о применяемой системе сжатия.
1.1.Форматы общего типа
1 . PCM - (pulse code modulatuion) - импульсно-кодовая модуляция
2. AU
3. AIFF - (Audio Interchange File Format)
4. WAVE
5. MOD
6. MIDI
7. CCITT A - law
8. CCITT μ - law
- ADPCM - (adaptive Differential PCM) 32,24,16 Kbit (G.726) 
, включая
- IMA ADPCM 
- Microsoft ADPCM 
1.2. Форматы для кодирования музыкальных файлов (возможно использование речевых данных)
В основе использования большинства рассматриваемых форматов лежат психо-акустические модели восприятия аудио информации слуховой системой человека
1. MP3
- MPEG2 BC 
- MPEG2 ACC 
- MPEG4 
- REAL AUDIO 
- DOLBY AC-3 
- QDESIGN MUSIC 
- A2B (MPEG2 ACC) 
- TWAIN VQF 
- INTERWAVE 
- MSN Audio 
- Wox Ware Meta SOUND 
1.3. Форматы для кодирования речевых данных (основаны на моделировании речевого тракта)
GSM 06.10
- TRUESPEECH 
- ToolVox for WEB 
- ASPEC 
- ACELP 5.3 Kbit (G.723.1) 
- LDCELP 16 Kbit (G.728) 
- CSACELP 8 Kbit (G729) 
- MPMLQ 6.3.Kbit (G723.1) 
- CVCELP 8 Kbit (internal Motorola algorthm) 
- CVCELP 16 Kbit (internal Motorola algorthm) 
- WoxWare Meta Sound (win 95) 
2. Методы сжатия и форматы аудио-файлов
- 2.1. PCM 
PCM - pulse code modulation (импульсно -кодовая модуляция) - исходное представление сигнала с выхода линейного АЦП без преобразований. Расширение файла .wav (Microsoft) илиaiff (Unix, Mac)
поддерживаются следующие параметры сигналов:
| частота дискретизации Гц | разрядность БИТ | режим | скорость потока данных Кбайт/сек | скорость потока данных Кбит/сек | 
| 8000 | 8 | моно | 8 | 64 | 
| 8000 | 8 | стерео | 16 | 128 | 
| 8000 | 16 | моно | 16 | 128 | 
| 8000 | 16 | стерео | 31 | 248 | 
| 11025 | 8 | моно | 11 | 88 | 
| 11025 | 8 | стерео | 22 | 176 | 
| 11025 | 16 | моно | 22 | 176 | 
| 11025 | 16 | стерео | 43 | 344 | 
| 22050 | 8 | моно | 22 | 176 | 
| 22050 | 8 | стерео | 43 | 344 | 
| 22050 | 16 | моно | 43 | 344 | 
| 22050 | 16 | стерео | 86 | 688 | 
| 44100 | 8 | моно | 43 | 344 | 
| 44100 | 8 | стерео | 86 | 688 | 
| 44100 | 16 | моно | 86 | 688 | 
| 44100 | 16 | стерео | 172 | 1376 | 
| 48000 | 8 | моно | 47 | 376 | 
| 48000 | 8 | стерео | 94 | 752 | 
| 48000 | 16 | моно | 94 | 752 | 
| 48000 | 16 | стерео | 188 | 1504 | 
2.2. Сжатие m-Law и a-Law
m-Law - является международным стандартом кодирования, ранее известным как ITU (бывший CCITT) стандарт G.711. Каждая 16- битовая выборка пакуется в 8 бит с использованием логарифмической таблицы для кодирования с 13-битовым динамическим диапазоном, теряя при этом последние значащие три бита точности. Кодирование и декодирование очень быстрое и имеется универсальная поддержка.
Имеется небольшая вариация метода , называемая A-Law , используемая в Европейских телефонных системах.
Кодирование m-Law использует следующее соотношение:
                                    
 ,
,
где mp - максимальное значение оцифрованного звука,
m- константа (обычно 100 или 255).
Варианты сжатия m-Law поддерживаемые в WIN95/98
| частота дискретизации ГЦ | разрядность БИТ | режим | скорость потока данных Кбайт/сек | 
| 8000 | 8 | моно | 8 | 
| 8000 | 8 | стерео | 16 | 
| 11025 | 8 | моно | 11 | 
| 11025 | 8 | стерео | 22 | 
| 22025 | 8 | моно | 22 | 
| 22025 | 8 | стерео | 43 | 
| 44100 | 8 | моно | 43 | 
| 44100 | 8 | стерео | 86 | 
