- •Глава 3
- •Общие сведения
- •Избыточность
- •3.3. Степень сжатия, качество изображения и скорость цифрового потока
- •3.4. Потери при компрессии
- •3.5. Сравнение качества аналогового и цифрового изображения
- •3.6. Особенности восприятия изображения и звука
- •3.7. Кодирование видео: основные идеи
- •3.8. Кодирование аудио: основные идеи
3.5. Сравнение качества аналогового и цифрового изображения
Аналоговое телевидение обладает также многими искажениями, среди которых наиболее заметны:
множественные контуры ("двоение", "троение" и т. п.);
тянущиеся продолжения ярких объектов ("факелы");
яркие или темные узкие горизонтальные полосы ("выпадения строк" и искровые помехи);
разнообразные наклонные, горизонтальные или вертикальные полосы, вызванные помехами в канале связи;
небольшие "искорки", хаотически появляющиеся по всему экрану, возникающие при недостаточном уровне сигнала ("снег");
кратковременное пропадание цвета при недостаточном уровне сигнала.
Если субъективно проанализировать качество компрессированного цифрового и аналогового изображений, то качество цифрового изображения окажется выше для небольших степеней компрессии (для D1 скорость потока не ниже 2 Мбит/сек по состоянию развития технологий кодирования на 2009 год).
Основное принципиальное отличие искажений цифрового сигнала от аналогового заключаются в том, что аналоговые искажения охватывают обширные области экрана, а цифровые — небольшие.
Тем не менее, у многих зрителей формируется мнение, что "цифровое качество" хуже. Как показывает многолетний опыт внедрения цифровых технологий, это мнение объясняется непривычным характером артефактов компрессии, что делает их более заметными (и поначалу — непривычными), что связано с особенностями человеческого восприятия. Таким образом, зрителю необходима адаптация к цифровому изображению. Аналоговое телевидение существует очень давно, и к перечисленным дефектам аналоговой картинки зрители привыкли. При просмотре головной мозг частично маскирует эти дефекты, выделяя содержательную часть изображения, которая и воспринимается.
С другой стороны, артефакты компрессии приводят к небольшому, но все же искажению формы, текстуры и цвета предметов, на что человек реагирует особенно остро, что дополнительно делает артефакты компрессии более заметными.
Тем не менее, человеческий мозг быстро привыкает к этим артефактам, вырабатывая привычку на их отбраковку.
На практике всегда можно подобрать параметры кодера, соответствующие характеру изображения, которые позволяют свести количество артефактов до минимума.
3.6. Особенности восприятия изображения и звука
Немного забежим вперед и рассмотрим особенности восприятия человеком звука и изображения, которые используются при кодировании. В этом разделе будет применяться терминология, которая объясняется в последующих разделах. Рекомендую вам перечитать этот раздел еще раз после того, как вы познакомитесь с основными идеями, использующимися в кодировании.
Существуют особенности восприятия изображения и звука, которые активно применяются при кодировании с целью уменьшить количество передаваемой информации. Особенно важны эти особенности для компрессии звука. В основном эти особенности касаются так называемого эффекта маскирования (masking), суть которого заключается в том, что при определенных обстоятельствах часть получаемой информации не воспринимается головным мозгом — и соответственно нет необходимости передавать эту информацию от телестанции абоненту, поскольку абонент все равно ее не воспримет.
Простейший пример: после очень громкого звука, некоторое время человек чувствует себя "оглушенным" и перестает слышать. Говорят, что тихий звук "маскируется" громким. Следовательно, после громкого звука можно некоторый короткий промежуток времени компрессировать с худшим качеством (и меньшим битрейтом).
Подобным же образом, если звук какой-то одной частоты намного громче всех остальных, то восприятие звуков других частот ухудшается. Следовательно, при компрессии эти "остальные" частоты можно компрессировать сильнее, с большей потерей качества. Модель восприятия, использующаяся для управления преобразованием DCT в аудиокодеках, часто называется "психоакустической моделью" восприятия.
Далее рассмотрим наиболее важные особенности восприятия изображений.
Маскирование по яркости (luminance masking) — имеет отношение к различимости деталей изображения. Для того чтобы различить на сером фоне серый же узор, должны соблюдаться некоторые условия — этот узор должен быть или чуть темнее или чуть ярче фона примерно на 2% от яркости самого фона.
Если разница меньше — человеческий глаз не сможет отличить узор от фона. Таким образом, можно не передавать информацию об объектах, яркость которых отличается от яркости фона на величину, меньшую 2% от яркости фона. Эту особенность восприятия необходимо учитывать при квантизации коэффициентов DCT. На приведенной фотографии (рис. 3.4) детали на заднем фоне неразличимы по только что рассмотренной причине.
Сходный эффект с маскировкой по яркости называется фальшивыми контурами.
На фотографии (рис. 3.5) фальшивые контуры показаны стрелками. Этот эффект возникает, когда при квантизации выбрано недостаточное количество уровней и информация о непрерывных градиентах яркости передается с искажениями. При компрессии необходимо сводить фальшивые контуры к нулю правильным выбором уровней квантизации.
Маскирование по времени (temporal masking) — при быстрой смене изображения, например, на границе сцен, часть информации новой сцены не воспринимается человеком. Зритель как бы кратковременно "привыкает" к новому изображению. Например, если в одном плане демонстрировалась динамичная сцена, а потом произошло переключение на спокойную сцену, то небольшая часть начала спокойной сцены будет проигнорирована головным мозгом. В течение этого короткого периода "адаптации" изображение может быть компрессировано чуть сильнее (с соответствующей потерей качества). Конечно, это не даст сэкономить много, но все же...
Маскирование по детализации (frequency masking) — в области изображения, где содержится большое количество мелких деталей, внимание зрителя ослабляется. Таким образом, зритель не видит каждую мелкую деталь по отдельности, а видит их "совокупно". Пример — рябь на воде. В области же, где деталей мало, каждый мелкий элемент имеет свое значение. Таким образом, области, где деталей больше, можно компрессировать чуть сильнее, чем области, в которых деталей меньше.
Рис.
3.4.
Исходное изображение Рис.
3.5.
Фальшивые контуры
(показаны
стрелками)
Однако наиболее важное свойство человеческого глаза — это пониженная четкость цветового восприятия. Именно поэтому качество цветовой составляющей изображения может быть в 4 раза снижено по сравнению с яркостной составляющей. Мы говорили об этом подробно в главе 1 "Сигналы и интерфейсы", когда обсуждали форматы 4:4:4 и 4:2:2. Вследствие этого свойства восприятия, количество пикселов цветовой составляющей может быть уменьшено в 2 раза по сравнению с яркостной составляющей и человек при этом ничего не заметит. Очевидно, это дает хорошую выгоду при компрессии изображения.
