Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Компьютерное аудио - форматы аудио-файлов и методы компрессии.doc
Скачиваний:
55
Добавлен:
01.05.2014
Размер:
352.77 Кб
Скачать

Компьютерное аудио

- форматы аудио-файлов и методы компрессии

1. Введение

В настоящее время в зависимости от конкретных задач и вычислительных ресурсов используется большое количество типов и систем формирования аудио-файлов. Дать их однозначную классификацию достаточно затруднительно. Тем не менее, можно предложить следующее условное разбиение на следующие группы;

1. В зависимости от содержания

  • форматы общего типа, используемые независимо от содержания аудио-файла,

  • форматы, связанные с музыкальной информацией,

  • форматы, связанные с речевыми сообщениями

2. В зависимости от используемой системы сжатия:

  • форматы без сжатия

  • форматы с использованием сжатия без потерь (в данной работе не рассматриваются)

  • форматы с использованием сжатия с потерями

2.1 В зависимости от скорости сжатого потока данных

  • форматы сжатия с фиксированной скоростью потока (bit stream rate)

  • форматы сжатия с нефиксированной скоростью потока

3. В зависимости от формы использования аудио-данных

  • данные, используемые в виде файлов, хранящихся на носителе

  • данные, используемые в режиме streaming, то есть поступающие по сети в реальном времени в потоковом режиме.

4. В зависимости от реального назначения

- распространение музыки через Интернет

  • запись на СD чисто музыкальной информации

  • запись на CD sound треков для видеофильмов

  • запись цифрового звука для бытового и профессионального видео

  • передача и сохранение речевой информации

Необходимо отметить, что практически все аудио- системы в настоящеее время являются мультиформатными и часто сами являются подсистемами программ более широкого назначения, включающих в себя работу с графическими и видео -данными.

Далее перечислим ряд известных форм представления аудио данных с использованием различных методов сжатия. При этом необходимо отметить , что понятие формат аудио-файла часто может включать в себя не только описание соответствующей структуры данных , но и сведения о применяемой системе сжатия.

1.1.Форматы общего типа

1 . PCM - (pulse code modulatuion) - импульсно-кодовая модуляция

2. AU

3. AIFF - (Audio Interchange File Format)

4. WAVE

5. MOD

6. MIDI

7. CCITT A - law

8. CCITT μ - law

  1. ADPCM - (adaptive Differential PCM) 32,24,16 Kbit (G.726)

, включая

  • IMA ADPCM

  • Microsoft ADPCM

1.2. Форматы для кодирования музыкальных файлов (возможно использование речевых данных)

В основе использования большинства рассматриваемых форматов лежат психо-акустические модели восприятия аудио информации слуховой системой человека

1. MP3

  1. MPEG2 BC

  2. MPEG2 ACC

  3. MPEG4

  4. REAL AUDIO

  5. DOLBY AC-3

  6. QDESIGN MUSIC

  7. A2B (MPEG2 ACC)

  8. TWAIN VQF

  9. INTERWAVE

  10. MSN Audio

  11. Wox Ware Meta SOUND

1.3. Форматы для кодирования речевых данных (основаны на моделировании речевого тракта)

GSM 06.10

  1. TRUESPEECH

  2. ToolVox for WEB

  3. ASPEC

  4. ACELP 5.3 Kbit (G.723.1)

  5. LDCELP 16 Kbit (G.728)

  6. CSACELP 8 Kbit (G729)

  7. MPMLQ 6.3.Kbit (G723.1)

  8. CVCELP 8 Kbit (internal Motorola algorthm)

  9. CVCELP 16 Kbit (internal Motorola algorthm)

  10. WoxWare Meta Sound (win 95)

2. Методы сжатия и форматы аудио-файлов

  1. 2.1. PCM

PCM - pulse code modulation (импульсно -кодовая модуляция) - исходное представление сигнала с выхода линейного АЦП без преобразований. Расширение файла .wav (Microsoft) илиaiff (Unix, Mac)

поддерживаются следующие параметры сигналов:

частота дискретизации Гц

разрядность

БИТ

режим

скорость потока данных Кбайт/сек

скорость потока данных Кбит/сек

8000

8

моно

8

64

8000

8

стерео

16

128

8000

16

моно

16

128

8000

16

стерео

31

248

11025

8

моно

11

88

11025

8

стерео

22

176

11025

16

моно

22

176

11025

16

стерео

43

344

22050

8

моно

22

176

22050

8

стерео

43

344

22050

16

моно

43

344

22050

16

стерео

86

688

44100

8

моно

43

344

44100

8

стерео

86

688

44100

16

моно

86

688

44100

16

стерео

172

1376

48000

8

моно

47

376

48000

8

стерео

94

752

48000

16

моно

94

752

48000

16

стерео

188

1504

2.2. Сжатие m-Law и a-Law

m-Law - является международным стандартом кодирования, ранее известным как ITU (бывший CCITT) стандарт G.711. Каждая 16- битовая выборка пакуется в 8 бит с использованием логарифмической таблицы для кодирования с 13-битовым динамическим диапазоном, теряя при этом последние значащие три бита точности. Кодирование и декодирование очень быстрое и имеется универсальная поддержка.

Имеется небольшая вариация метода , называемая A-Law , используемая в Европейских телефонных системах.

Кодирование m-Law использует следующее соотношение:

,

где mp - максимальное значение оцифрованного звука,

m- константа (обычно 100 или 255).

Варианты сжатия m-Law поддерживаемые в WIN95/98

частота дискретизации ГЦ

разрядность

БИТ

режим

скорость потока данных Кбайт/сек

8000

8

моно

8

8000

8

стерео

16

11025

8

моно

11

11025

8

стерео

22

22025

8

моно

22

22025

8

стерео

43

44100

8

моно

43

44100

8

стерео

86