- •3. Практическое использование видеокомпрессии в телевидении
- •3.1. Задача сжатия информации и пути ее решения
- •3.2. Международный стандарт кодирования с информационным сжатием mpeg-2
- •3.2.1. Профили и уровни стандарта кодирования mpeg-2
- •Профили, уровни, согласованные точки стандарта mpeg-2
- •3.2.2. Компрессия видеоданных
- •3.2.3. Кодируемые кадры
- •3.2.4. Компенсация движения
- •3.2.5. Использование дкп в стандарте кодирования mpeg-2
- •Матрица квантования яркостного сигнала для блоков изображений I-кадров
- •Матрица квантования цветоразностных сигналов для блоков изображений I-кадров
- •3.2.6. Сжатие звукоданных Эффект маскирования и психоакустическая модель слуха
- •П Рис. 3.10.Проявление временнóго маскированияолосное кодирование и блок фильтров
- •Квантование и распределение бит
- •Уровни обработки звукоданных
- •3.2.7. Алгоритмы сжатия звукоданных кодерами различных уровней Особенности работы кодера первого уровня
- •Принципы функционирования кодера второго уровня
- •Алгоритм сжатия звукоданных кодерами третьего уровня
- •3.2.8. Реализация цифрового многоканального звука, поддерживаемая стандартом mpeg-2
- •Иерархия многоканальных звуковых систем согласно Рекомендации bs.775
- •Система улучшенного кодирования звука аас
- •3.2.9. Формирование транспортного потока данных в устройствах кодирования mpeg-2 Структура транспортного потока
- •Значения идентификаторов piDдля потока информацииSi
- •3.2.10. Качество телевизионных изображений при кодировании по стандарту mpeg-2
- •3.3. Стандарт представления медиа-объектов mpeg-4
- •3.3.1. Описание сцены в стандарте mpeg-4
- •3.3.2. Принципы доставки потоков данных
- •3.3.3. Кодирование визуальных объектов
- •3.3.4. Кодирование звуковых объектов
- •3.3.5. Профили и уровни стандарта mpeg-4
- •Профили и типы объектов mpeg-4 видео
- •Параметры потока для некоторых профилей mpeg-4 видео
- •Параметры предлагаемого студийного профиля стандарта mpeg-4
- •Требования к декодеру звука масштабируемого профиля
- •Профили и типы объектов mpeGаудио
- •Профили графических средств и описаний сцены в mpeg-4
- •3.3.6. Идентификация и защита интеллектуальной собственности
- •3.4. Стандарт кодированного представления визуальной информации н.264/avCилиMpeg-4Part10
- •3.4.1. Структура стандарта видеокомпрессии н.264 Основные механизмы кодирования, используемые в стандарте н.264
- •Формирование закодированных снимков
- •Моды слоев стандарта н.264
- •Синтаксис элементов макроблока
- •Используемые типы карт распределения макроблоков по группам слоев
- •Профили, используемые стандартом н.264
- •Формат закодированных данных
- •3.4.2. Базовый профиль Особенности кодирования, обусловленные базовым профилем
- •Использование ссылочных снимков
- •Мгновенная очистка буфера декодера
- •Лишний кодированный снимок
- •Произвольный порядок слоев
- •Прогнозирование макроблоков
- •Древовидная структура компенсации движения
- •Предсказание векторов движения
- •Прогноз в моде intra
- •Деблочный фильтр
- •Условия фильтрации
- •Преобразование и квантование
- •3.4.3. Основной профиль Особенности кодирования в основном профиле
- •Ссылочные снимки
- •Опции прогноза
- •Опции прогнозов для макроблоков в-слоев
- •Двунаправленный прогноз
- •Прямой прогноз
- •Чересстрочная развертка
- •Контекстно-адаптивное арифметическое кодирование (савас)
- •Экспоненциальные коды Голомба
- •Процесс кодирования
- •Контекстные модели для первого бита
- •Контекстные модели
- •Контекстные модели
- •Модуль арифметического кодирования
- •3.4.4. Расширенный профиль
- •Слои sPиSi
- •Слои деления данных
- •3.4.5. Транспортный механизм стандарта н.264 Структура кодированной видеопоследовательности
- •Элементы rbsp
- •Параметрические множества
- •Передача и хранение единиц nal
- •3.4.6. Кодек стандарта н.264
- •3.5. Стандарт описания мультимедийной информации mpeg-7
- •3.5.1. Общие сведения о стандарте mpeg-7
- •3.5.2. Основные части стандарта mpeg-7
- •3.5.3. Описание главных функций стандарта mpeg-7 Системы стандарта mpeg-7
- •Язык описания определений mpeg-7
- •Аудио mpeg-7
- •Визуальный mpeg-7
- •Основные объекты и схемы описания мультимедиа mpeg-7
- •Эталонные программы mpeg-7: модель экспериментов (eXperimentationModel)
- •3.5.4. Области применения стандарта mpeg-7
- •Контрольные вопросы
3.2.6. Сжатие звукоданных Эффект маскирования и психоакустическая модель слуха
Из-за повышенной чувствительности уха к искажениям сжатие звуковых сигналов оказывается более сложной задачей, чем видеокомпрессия. В то же время некоторые психофизиологические особенности слухового восприятия позволяют даже при значительной компрессии (6:1 и более) обеспечить «прозрачный» канал, то есть канал, звучание выходного сигнала которого субъективно неотличимо от звучания сигнала источника.
Для понимания этих особенностей ознакомимся с некоторыми механизмами слухового восприятия. Как и во всякой системе с преобразованием из временнóй в частотную область, в слуховой системе имеется некоторая неопределенность в разделении отдельных частотных составляющих. Несовершенное разделение по частоте приводит к тому, что ухо не в состоянии различить звуки с близкими частотами, этот эффект называетсячастотным маскированием. Граница восприятия вблизи маскирующего тона называетсяпорогом маскирования.

Рис. 3.9.Критические полосы человеческого слуха
В результате длительных исследований удалось измерить ширину и расположение частотных полос, в пределах которых действует маскирование. Эти полосы получили название критических, и в полосе слухового восприятия их насчитывается 25. В области низких слышимых частот ширина критической полосы менее 100 Гц, в районе 2 кГц она равна 300 Гц и возрастает до 4 кГц в области высших воспринимаемых частот (рис. 3.9). Измеряется ширина критической полосы в Барках (в относительных значениях полосы звуковых частот) и рассчитываются по формуле [14]:

Кроме частотного (статического), имеет место и временнóе(динамическое)маскирование. «Временнóе маскирование», то есть эффект, при котором звук достаточной амплитуды маскирует другие звуки, непосредственно предшествующие ему или следующие за ним по времени (рис. 3.10). Когда звук маскируется следующим за ним по временисигналом, такое маскирование называется маскированием назад. Типичный промежуток времени, в пределах которого действует маскирование назад, составляет 5…50 мс. Если звук маскируется предшествующим ему сигналом, то такое маскирование называется маскированием вперед, характерные интервалы времени для которого составляют от 50 до 200 мс в зависимости от уровней маскирующего и маскируемого сигналов. Несовершенство временнóго разделения связано с резонансным характером восприятия.
Использование эффекта маскирования позволяет существенно сократить объем звукоданных, сохраняя приемлемое качество звучания. Принцип здесь достаточно простой: «Если какая-то составляющая не слышна, то и передавать ее не следует». На практике это означает, что в области маскирования можно снизить число бит на отсчет до такой степени, чтобы шум квантования все еще оставался ниже порога маскирования. Таким образом, для работы звукового кодера необходимо знать пороги маскирования при различных комбинациях воздействующих сигналов. Вычислением этих порогов занимается важный узел в кодере – психоакустическая модель слуха(ПАМ). Она анализирует входной сигнал в последовательных отрезках времени и определяет для каждого блока отсчетов спектральные компоненты и соответствующие им области маскирования. Входной сигнал анализируется в частотной области, для этого блок отсчетов, взятых во времени, с помощью дискретного преобразования Фурье преобразуется в набор коэффициентов при компонентах частотного спектра сигнала. Разработчики кодеров компрессии имеют значительную свободу в построении модели, точность ее функционирования зависит от требуемой степени сжатия.
