Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
labrab_Shulgin_Osnovi_szhatiya_izobrazhenij_i_v...docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
2.27 Mб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ, МОЛОДЕЖИ И СПОРТА УКРАИНЫ

Национальный аэрокосмический университет им. Н.Е. Жуковского «Харьковский авиационный институт»

Кафедра проектирования радиоэлектронных систем летательных аппаратов

В.И. Шульгин

Основы сжатия изображений и видео

Материал для самостоятельного изучения

rsd.khai.edu

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ Национальный аэрокорсмический университет им. Н.Е. Жуковского “ХАИ”

Кафедра Проектирования радиоэлектронных систем Летательных Аппаратов

ОСНОВЫ ТЕОРИИ ПЕРЕДАЧИ ИНФОРМАЦИИ

ОСНОВЫ ТЕОРИИ ЦИФРОВОЙ СВЯЗИ

Шульгин В.И.

ОСНОВЫ СЖАТИЯ ИЗОБРАЖЕНИЙ И ВИДЕО”

Материал для самостоятельного изучения

Харьков 2010

МЕТОДЫ СЖАТИЯ ВИДЕОИЗОБРАЖЕНИЙ

Прежде чем рассматривать принципы сжатия подвижных изображений или, как их

обычно называют – видео, кратко остановимся на методах формирования этих данных.

Формирование цифрового видеосигнала

Несколько слов о таком источнике информации, как изображение вообще, и

подвижное изображение – в частности.

Двумерное изображение некоторого физического объекта или явления – это

проекция на некоторую плоскость, называемую плоскостью изображения

пространственного распределения цветовой и/или яркостной отражающей (или излучающей) способности этого объекта (явления).

То есть, изображение представляет собой некоторую двумерную непрерывную функцию I (x,y) распределения яркости или цветов в плоскости проекции.

x

I(x,y)

y

Рис. 1 Тестовое изображение Лена

Несколько слов из истории кинематографа. Вы наверняка слышали, как в кино получается подвижное изображение. На киноленте расположено множество отдельных кадров. Если быстро сменять эти кадры один за другим, на экране возникает иллюзия непрерывности и плавности движения. Частота смены кадров

подобрана так, чтобы глаз не замечал отдельных фаз движения. Благодаря

инерционности зрения мы воспринимаем отдельные фазы как плавное движение и не замечаем мельканий изображения, достаточно лишь сменять кадры с

определенной частотой. Для кино она составляет 24 кадра в секунду.

То есть, подвижное изображение или видеоизображение это дискретная последовательность неподвижных изображений (кадров), фиксируемых с

небольшими интервалами времени, которая в силу инерционных (интегрирующих)

свойств системы зрения человека воспринимается как непрерывное подвижное

изображение.

Рис. 2. Последовательность неподвижных кадров формирующих

непрерывное подвижное изображение

Субъективное качество восприятия подвижного изображения (степень его непрерывности) зависит от частоты смены кадров, и вообще-то тем лучше, чем выше частота смены кадров. Но уже при частоте смены кадров выше 24 кадров в секунду мелькание кадров становится практически незаметным, и поток неподвижных картинок воспринимается как единое непрерывное движущееся изображение. Правда, если в кадре встречается объект, перемещающийся с очень

высокой скоростью, такой частоты обновления кадров становится недостаточно

(движение этого объекта на изображении перестает быть непрерывным). Поэтому,

для высококачественной передачи динамичных подвижных изображений частота смены кадров должна быть не менее 50 раз в секунду.

Таким образом, подвижное изображение (видео) может рассматриваться как дискретная последовательность кадров. Это первый шаг превращения непрерывного изображения в дискретное, то есть – в цифровое.

Следующим шагом является дискретизация изображения внутри кадра.

Известно, что любая непрерывная функция (в том числе - функция двух переменных x и y) с ограниченным спектром может быть продискретизована по

пространственным координатам x и y, а затем абсолютно точно восстановлена по своим дискретным отсчетам.

Шаг дискретизации по каждой координате – Δx и Δy, или необходимое количество

отсчетов (пикселей) изображения по координатам x и y зависит от скорости изменения изображения по соответствующим координатам, или, что то же самое, от

пространственного разрешения (от размера минимальных деталей на изображении).

То есть разрешение определяет необходимое число строк по вертикали

(дискретизация по координате y) и число пикселей внутри строки по горизонтали

(дискретизация по координате x).

Если мы умножим число строк на число пикселей по горизонтали, то получим разрешение, выраженное через число пикселей. Чем больше пикселей, тем более тонкие детали изображения можно будет увидеть – Рис. 3.

В таблице 1 приведены примеры разрешения для некоторых наиболее популярных на сегодня стандартов представления видеоизображения.

Таблица 1

Число активных строк по

Полное число

Частота смены

Формат

вертикали и пикселей по

кадров кадр/сек

пикселей

горизонтали

Low rate CIF

320 x 240

76800

16

NTSC (480i)

480 x 720

345 600

30

PAL (576i)

576 x 720

414 720

25

HD 720p

720 x 1280

921 600

30

HD 1080

1080 x 1920

2 073 600

25/30

2K

1556 x 2048

3 186 688

24/48

4K (полный кадр на

3112 x 4096

12 746 752

60

35 -мм кинопленке)

5K(1:2)

2500 x 5000

12 500 000

60

Строка

Пиксель I (xi,yj)

Рис. 3 Дискретизованное изображение

Как же производится дискретизация изображений, или, другими словами, как

формируется цифровое изображение?

Обычно это делается с использованием светочувствительной матрицы, на которую с

помощью объектива проектируется изображение – так называемой ПЗС-матрицы – Рис. 4. Каждый элемент этой матрицы – это пиксель изображения, то есть матрица должна иметь столько элементов, сколько пикселей должно содержать соответствующее цифровое изображение.

Рис. 4. Светочувствительная матрица

Светочувствительная матрица воспринимает и накапливает идущие от объекта

частицы света (фотоны) и преобразовывает их в электрические заряды.

Последовательно считав эти заряды с каждой ячейки матрицы, мы получаем

дискретные отсчеты изображения I (xi,yj).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]