- •Глава 3
- •Общие сведения
- •Избыточность
- •3.3. Степень сжатия, качество изображения и скорость цифрового потока
- •3.4. Потери при компрессии
- •3.5. Сравнение качества аналогового и цифрового изображения
- •3.6. Особенности восприятия изображения и звука
- •3.7. Кодирование видео: основные идеи
- •3.8. Кодирование аудио: основные идеи
Глава 3
Обзор способов компрессии видео и звука
Общие сведения
Необходимость в компрессии возникла вследствие ограниченной пропускной способности каналов связи. Некомпрессированный поток видеоизображения стандарта D1, как мы уже рассматривали ранее, составляет 270 Мбит/сек, что неприемлемо для передачи через эфир. Для передачи одного такого потока потребовалась бы полоса частот около 60 МГц. Но существующий порядок таков, что для передачи одного телеканала можно использовать не более 8 МГц. С использованием же сжатия изображения и звука в полосе 8 МГц можно будет передавать 10 телевизионных каналов и даже больше!
К настоящему времени изобретено много различных способов видео и аудио- компрессии, однако распространение получили лишь несколько: это MPEG2 и H.264 для видео, а также MP3 и ААС для аудио.
В этой главе мы вкратце рассмотрим основные принципы сжатия изображений и звука, а также сравним различные способы компрессии.
Избыточность
Сжатие (компрессия) видеоизображений стала возможна вследствие избыточности видеоизображения, т. е. обычное, некомпрессированное видео содержит больше информации, чем необходимо. Что это значит?
точно так же достаточно передать только диаметр окружности, ее цвет и декартовы координаты положения на экране, т. е. всего 128 бит! Проблема здесь одна — кодер должен уметь находить на экране эту окружность, как-то измерять ее координаты и диаметр. А приемник, который принимает эту картинку, соответственно должен уметь рисовать окружность по переданным параметрам.
Вот, что значит избыточность — для передачи изображений мы можем передавать значительно меньше информации, но для этого мы должны иметь два устройства — кодер и декодер. Кодер должен уметь находить в изображении все "самое ценное", что можно передать, не нарушив при этом качества изображения, а декодер на основании переданной информации должен уметь заново "нарисовать" (говорят — "декодировать" или "восстановить") переданную телевизионную картинку. Способы поиска "самого ценного", что необходимо передать, и составляют способ видеокомпрессии (например, MPEG2 или H.264).
Похожая ситуация со звуком. Поскольку звук — это комбинация колебаний с разной частотой, амплитудой и фазой, то для передачи звука можно передавать параметры этих колебаний, а не сам звук.
Конечно, описанная картина очень примитивна. Реальное изображение гораздо сложнее окружности, более того, оно не состоит из правильных фигур и оно движется. Именно поэтому выработка оптимальных алгоритмов компрессии потребовала от человечества много времени. Все эти алгоритмы имеют под собой сложную математическую основу и требуют высокой производительности компьютеров.
