Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Серов.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.41 Mб
Скачать

Глава 3

Обзор способов компрессии видео и звука

  1. Общие сведения

Необходимость в компрессии возникла вследствие ограниченной пропускной способности каналов связи. Некомпрессированный поток видеоизображения стандарта D1, как мы уже рассматривали ранее, составляет 270 Мбит/сек, что неприемлемо для передачи через эфир. Для передачи одного такого потока потребовалась бы полоса частот около 60 МГц. Но существующий порядок таков, что для передачи одного телеканала можно использовать не более 8 МГц. С использованием же сжатия изображения и звука в полосе 8 МГц можно будет передавать 10 телевизионных каналов и даже больше!

К настоящему времени изобретено много различных способов видео и аудио- компрессии, однако распространение получили лишь несколько: это MPEG2 и H.264 для видео, а также MP3 и ААС для аудио.

В этой главе мы вкратце рассмотрим основные принципы сжатия изображе­ний и звука, а также сравним различные способы компрессии.

  1. Избыточность

Сжатие (компрессия) видеоизображений стала возможна вследствие избы­точности видеоизображения, т. е. обычное, некомпрессированное видео со­держит больше информации, чем необходимо. Что это значит?

Представим, что изображение состоит из белого фона и размещенной на нем черной окружности. Это изображение занимает объем памяти, равный 720x576x32 бит (32 — глубина цвета). Это примерно 13 Мбайт. И для того, чтобы передать изображение, нужно передавать все эти 13 Мбайт. Однако

точно так же достаточно передать только диаметр окружности, ее цвет и де­картовы координаты положения на экране, т. е. всего 128 бит! Проблема здесь одна — кодер должен уметь находить на экране эту окружность, как-то измерять ее координаты и диаметр. А приемник, который принимает эту кар­тинку, соответственно должен уметь рисовать окружность по переданным параметрам.

Вот, что значит избыточность — для передачи изображений мы можем пере­давать значительно меньше информации, но для этого мы должны иметь два устройства — кодер и декодер. Кодер должен уметь находить в изображении все "самое ценное", что можно передать, не нарушив при этом качества изо­бражения, а декодер на основании переданной информации должен уметь заново "нарисовать" (говорят — "декодировать" или "восстановить") пере­данную телевизионную картинку. Способы поиска "самого ценного", что необходимо передать, и составляют способ видеокомпрессии (например, MPEG2 или H.264).

Похожая ситуация со звуком. Поскольку звук — это комбинация колебаний с разной частотой, амплитудой и фазой, то для передачи звука можно переда­вать параметры этих колебаний, а не сам звук.

Конечно, описанная картина очень примитивна. Реальное изображение го­раздо сложнее окружности, более того, оно не состоит из правильных фигур и оно движется. Именно поэтому выработка оптимальных алгоритмов ком­прессии потребовала от человечества много времени. Все эти алгоритмы имеют под собой сложную математическую основу и требуют высокой про­изводительности компьютеров.