Скачиваний:
1
Добавлен:
13.05.2026
Размер:
15.2 Mб
Скачать

MPEG-2 AAC

В 1997 году стандарт MPEG-2 был дополнен усовершенствованной системой кодирования звука ААС (Advanced Audio Coding), имеющей следующие основные характеристики:

-число звуковых программ в потоке данных до 16, полное число основных звуковых каналов до 48, низкочастотных каналов до 15, каналов многоязычного сопровождения до 15 и каналов данных до15;

-частота дискретизации звуковых сигналов от 8 до 96 кГц;

-число обрабатываемых частотных составляющих увеличено до 1024 (на Layer III было 32x18=576 составляющих);

-предусмотрены три профиля кодирования: основной (Main), упрощенный (LC - Low complexity) и масштабируемый (SSR - Scalable Sampling Rate);

-используется адаптивное предсказание кодируемого звукового кадра по предыдущему;

-улучшен алгоритм распределения битов.

Кроме того, ААС, содержит ряд других дополнений и усовершенствований по сравнению с Layer III.

В результате хорошее качество звучания достигается при сжатии стереозвука до 96 кбит/с, а при 128 кбит/с звук практически неотличим от исходного несжатого звука.

71

Кодирование звука в MPEG-4

Комплекс стандартов ГОСТ Р 53556 «Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. Часть III (MPEG-4 audio)» состоит из 13 отдельных взаимосвязанных стандартов, перечень которых приведен ниже, разработанных на базе международного стандарта ИСО/МЭК 14496-3:2009

«Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио». ГОСТ Р 53556.0-2009 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с

сокращением избыточности для передачи по цифровым каналам связи. Часть III (MPEG-4 audio). Основные положения. ПЕРЕИЗДАНИЕ. Июль 2020 г.

ГОСТ Р 53556.1-2012 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. Часть III (MPEG-4 audio). Общие требования к кодированию.

ГОСТ Р 53556.2-2012 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. Часть III (MPEG-4 audio). Кодирование речевых сигналов с использованием гармонических векторов (HVXC).

ГОСТ Р 53556.3-2012 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. Часть III (MPEG-4 audio). Кодирование речевых сигналов с использованием линейного предсказания (CELP).

72

Кодирование звука в MPEG-4

73

Кодирование звука в MPEG-4

ГОСТ Р 53556.10-2014 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. Часть III (MPEG-4 audio). Передискретизация аудио

ГОСТ Р 53556.11-2014 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. Часть III (MPEG-4 audio). Аудиокодирование без потерь

ГОСТ Р 53556.12-2014 Звуковое вещание цифровое. Кодирование сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи. Часть III (MPEG-4 audio). Масштабируемое кодирование без потерь

74

Кодирование звука в MPEG-4

Стандарт MPEG-4 Part 3: Audio обеспечивает средства кодированного представления натуральных звуков (речь и музыка) и синтезированных звуков. Представление синтезированных звуков основывается на текстовом или инструментальном описании. MPEG-4 предусматривает кодирование звука при скоростях потоков 2…64 кбит/с. Включено усовершенствованное кодирование звука AAC, регламентируемого в MPEG-2. AAC обеспечивает средства общей компрессии в верхней части скоростей потоков от 6 кбит/с. MPEG-4 устанавливает синтаксис потоков компрессированных данных. В диапазоне 2…4 кбит/с используется

кодирование HVXC (Harmonic Vector eXcitation Coding), в диапазоне 4…24 кбит/с — кодирование CELT (Code Excited Linear Predictive Coding).

Как и для видеообъектов, в стандарте MPEG-4 введена классификация типов объектов звука. В общей сложности первая версия определила 15 типов объектов, часть из них базируется на алгоритме ААС. Один на алгоритме Twin VQ, три типа объектов связаны с алгоритмами кодирования речи, еще четыре определяют типы объектов для синтезированных звуков. Определены 4 профиля кодирования звука.

75

Кодирование звука в MPEG-4

MPEG-4 аудио предлагает широкий перечень приложений, которые покрывают область от понятной речи до высококачественного многоканального аудио, и от естественных до синтетических звуков. В частности, он поддерживает высокоэффективную презентацию аудио объектов, состоящих из:

Речь: Кодирование речи может производиться при скоростях обмена от 2 кбит/с до 24 кбит/с. Низкие скорости передачи, такие как 1.2 кбит/с, также возможны, когда разрешена переменная скорость кодирования. Для коммуникационных приложений возможны малые задержки. Когда используются средства HVXC, скорость и высота тона могут модифицироваться пользователем при воспроизведении. Если используются средства CELP, изменение скорости воспроизведения может быть реализовано с помощью дополнительного средства.

Синтезированная речь: TTS-кодировщики с масштабируемой скоростью в диапазоне от 200 бит/ с до 1.2 кбит/с которые позволяют использовать текст или текст с интонационными параметрами (вариация тона, длительность фонемы, и т.д.), в качестве входных данных для генерации синтетической речи. Это включает следующие функции.

Синтез речи с использованием интонации оригинальной речи

Управление синхронизацией губ и фонемной информации.

Трюковые возможности: пауза, возобновление, переход вперед/назад.

76

MPEG-4

Международный язык и поддержка диалектов для текста (т.е. можно сигнализировать в двоичном потоке, какой язык и диалект следует использовать)

Поддержка интернациональных символов для фонем.

Поддержка спецификации возраста, пола, темпа речи говорящего.

Поддержка передачи меток анимационных параметров лица FAP (facial animation parameter). Общие аудио сигналы. Поддержка общей кодировки аудио потоков от низких скоростей до высококачественных. Рабочий диапазон начинается от 6 кбит/с при полосе ниже 4 кГц и распространяется до широковещательного качества передачи звукового сигнала для моно и многоканальных приложений.

Синтезированный звук: Поддержка синтезированного звука осуществляется декодером структурированного звука (Structured Audio Decoder), который позволяет использовать управление музыкальными инструментами с привлечением специального языка описания.

Синтетический звук с ограниченной сложностью: Реализуется структурируемым аудио декодером,

который позволяет работать со стандартными волновыми форматами.

77

MPEG-4

Синтетический профиль – группирует типы объектов синтезированного звука, может использоваться в тех случаях, когда требуется обеспечить передачу при очень низких скоростях.

Основной профиль – наиболее сложный профиль, объединяющий возможности всех остальных; пригоден для звуков всех видов, обеспечивает высокое качество звучания. Примеры применения – запись на DVD и мультемедийное вещание. Профиль имеет 4 уровня.

Соответствие звуковых профилей и типов объектов показано в таблице

MPEG-4

79

80

Соседние файлы в папке лекции