
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ
ИНСТИТУТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИНФОРМАТИКИ И РАДИОЭЛЕКТРОНИКИ
А. И. Митюхин
ЦИФРОВАЯ ОБРАБОТКА СИГНАЛОВ И ИЗОБРАЖЕНИЙ
СПЕКТРАЛЬНАЯ ОБРАБОТКА ДВУМЕРНЫХ СИГНАЛОВ
УЧЕБНОЕ ПОСОБИЕ
по дисциплине «Цифровая обработка сигналов и изображений»
для студентов специальности
«Вычислительные машины, системы и сети»
МИНСК 2012
УДК 621.391.2 (075.8)
ББК 32.811.4 я 73
М 67
Рецензент:
Митюхин А. И.
М67. Спектральная обработка двумерных сигналов: Учебное пособие по дисциплине «Цифровая обработка сигналов и изображений» для студентов специальности Вычислительные машины, системы и сети / A. И. Митюхин.– Мн.: БГУИР, 2012.
ISBN 985-444-307-8
В пособии представлено учебно-методическое обеспечение (лабораторные работы) раздела дисциплины «Цифровая обработка сигналов и изображений». Изложены алгоритмы и методы пространственной и спектральной обработки двумерных сигналов для различных приложений. В частности, в таких областях ЦОС как обработка изображений, цифровая фильтрация, дистанционное зондирование земной поверхности и др. Изучаются следующие темы: «Корреляционное распознавание образов», «Эффективное кодирование двухмерных сигналов», «Дисперсионная фильтрация коэффициентов унитарных преобразований». Даются методические рекомендации по выполнению лабораторных работ, требования к содержанию отчетов по работам.
УДК 621.391.2 (075.8)
ББК 32.811.4 я 73
ISBN 985-444-307-8 © A.И. Митюхин, 2012
© БГУИР, 2012
Лабораторная работа «Эффективное кодирование двумерных сигналов»
1. ЦЕЛЬ РАБОТЫ
Изучение методов эффективного кодирования двумерных сигналов и их применение в современных радиоэлектронных системах с обработкой изображений.
2. ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ
2.1 Спектральные методы эффективного кодирования изображений
2.1. 1Общие сведения о спектральных методах кодирования
Спектральные методы кодирования изображений основаны на том, что цифровой эквивалент аналогового сигнала путем соответствующего линейного ортогонального преобразования может быть приведен к виду, который наиболее удобен с точки зрения сокращения избыточности информации. В этом случае повышение эффективности кодирования связано с тремя факторами: [1]
– в процессе преобразования ряд спектральных коэффициентов (трансформант) становится настолько малым по величине, что их можно отбросить без заметного изменения качества восстанавливаемых изображений.
– различное нелинейное квантование коэффициентов преобразования позволяет существенно сократить объем передаваемой информации без заметного ухудшения качества передаваемого изображения при его восстановлении.
Сущность спектральных методов кодирования заключается в том, что кодируется и передается не само изображение, а значения трансформант, получающихся при ортогональном преобразовании этого изображения. В процессе преобразований изображения, имеющего сильные корреляционные связи между смежными элементами, происходит процесс декорреляции, так что значения коэффициентов преобразования оказываются практически некоррелированными. В отличие от исходного изображения, для которого характерно в среднем равномерное распределение энергии между элементами, распределение энергии между спектральными коэффициентами резко неравномерно. Основная доля энергии приходится на коэффициенты с малыми номерами (низкие пространственные частоты), и лишь небольшая ее часть – на прочие. В дальнейшем коэффициенты, имеющие малую амплитуду, опускаются либо квантуются на малое число уровней, что позволяет использовать меньшее число разрядов кода для передачи. При приеме выполняются обратные преобразования. Предварительно по принятому коду восстанавливается матрица трансформант, а затем путем обратного ортогонального преобразования изображение восстанавливается.
В общем случае кодирование посредством преобразований реализуется путем двух последовательных операций. Первая операция состоит в линейном преобразовании статистически зависимых элементов изображения. С помощью второй операции осуществляется кодирование определенным способом выбранных коэффициентов преобразования.
На рисунке 1 показана схема трансформационного кодирования.
Входное
изображение
(N
N)
а)
Сжатое
изображение
Восстановленное
изображение
б)
Рисунок 1 – Система трансформационного кодирования:
а) кодер; б) декодер
Кодер выполняет четыре операции:
– разбиение изображения на блоки;
– преобразование;
– квантование;
– кодирование.
Декодер выполняет обратную последовательность
операций (за исключением квантования).
Первоначально изображение размерами
разбивается на
блоков
размерами n
n,
которые
затем подвергаются преобразованиям.
Целью процесса преобразования является
декорреляция значений элементов в
каждом блоке, или уплотнение как можно
большего количества информации в
наименьшее число коэффициентов
преобразования. На этапе квантования
те коэффициенты, которые несут минимальную
информацию, удаляются или же квантуются
грубо (они дают наименьший вклад в
качество восстанавливаемого изображения).
На заключительном этапе осуществляется
кодирование квантованных коэффициентов,
как правило, с помощью неравномерных
кодов. Все или некоторые из указанных
этапов могут быть адаптированы к
содержимому блока, т.е. к локальным
характеристикам изображения; такой
вариант называют адаптивным
трансформационным кодированием. В
противном случае говорят о неадаптивном
трансформационном кодировании [2].
2.2. Кодирование элементов изображения
При кодировании источника изображения после
аналого-цифрового
преобразования изображение представляется
множеством отсчетов интенсивности
светового потока, распределенным на
двумерной прямоугольной плоскости с
координатами (
).
Величина отсчета (например яркости X)
в точке с координатами (
)
характеризуется неким целым числом
Х(
).
Такой элемент цифрового изображения
называется пикселом. Пусть изображение
создается совокупностью отсчетов,
образующих матрицу из (
)
пикселов, т.е. исходное изображение
будет состоять из N
строк, каждая из которых содержит N
элементов изображения. Причем N
= 2Wt,
где W
– верхняя частота спектра обрабатываемого
сигнала изображения; t
– время обработки сигнала.
Если дискретный
сигнал Х
содержит
отсчетов, то его можно представить в
виде вектора с координатами (
)
в
- мерном векторном пространстве. Тогда
первая операция эффективного кодирования
- мерного вектора выражается в
Y = GX, |
(1)
|
где X=
Y=[
]
,
– векторы столбцы отсчетов с
координатами коэффициентов преобразования
(трансформант) и сигнала соответственно;
G=
– матрица кодирования (преобразования),
столбцами которой являются
-
мерные порождающие векторы g
[2].
Двумерное прямое
преобразование случайных величин [Х(
)]
можно записать как
|
(2) |
где
– матрица коэффициентов преобразования
(трансформант);
– матрица
кодирования;
и
.
Если элементами матрицы G
являются действительные числа, то
,
где Е – единичная матрица.
Обратное ортогональное двумерное преобразование коэффициентов определяется как
[Х(
)]
=
|
(3) |
Матрица
,
обеспечивающая некоррелированные
трансформанты, может быть вычислена по
ковариационной матрице
.
Эта матрица также представляется с
помощью собственных векторов и
соответствующих им собственных чисел
в виде дискретного разложения
Карунена-Лоэва:
= Ф
|
(4) |
где
Ф – матрица порядка
,
столбцы которой являются собственными
векторами, а
– диагональная матрица, образованная
собственными числами. В преобразованном
пространстве небольшое число М координат
представляют с минимальной
среднеквадратической ошибкой большую
часть статистической информации о
кодируемых элементах изображения.
Упорядочим собственные числа и собственные
векторы (4)
в соответствии с
|
(5) |
Кодирование изображения осуществим через преобразование
|
(6) |
Тогда вектор - столбец , состоящий из трансформант, будет иметь некоррелированные компоненты с дисперсиями, упорядоченными в соответствии с формулой (5) так, что эти компоненты сосредотачивают максимум дисперсии в первых М координатах. Отобрав М компонент вектора с наибольшими дисперсиями, получим вектор длиной М < . Далее М коэффициентов вместе с информацией о координатах отобранных векторов передаются по каналу связи. В результате потребуется только (М К) бит для представления всего изображения. Тем самым достигается сокращение (сжатие) полосы частот канала передачи. Коэффициент сжатия определяется отношением длины всех кодовых слов исходного изображения к суммарной длине слов, предназначенных к передаче:
|
(7) |
На приемной стороне
вектор М декодируется в вектор
длиной
пикселов, причем вместо переданных
трансформант вставляются нули. Выполняя
обратное преобразование по отношению
к Ф, можно восстановить изображение:
|
(8) |
Выражения (8) и (10)
показывают, что для реализации кодирования
изображения, основанного на преобразовании
Карунева-Лоэва (ПКЛ), требуется выполнить
вычислительных операций. Особенно
чрезмерно большим, требующим значительных
временных затрат, является вычисление
собственных значений и собственных
векторов ковариационной матрицы с
массивом из
элементов. Так как разным изображениям
соответствуют различные ковариационные
матрицы, процесс кодирования с помощью
ПКЛ технически сложно осуществить. Для
этого чтобы уменьшить вычислительную
сложность кодирования, используют идею
разбиения массива данных на меньшие
размеры (фрагменты), а затем для каждого
из фрагментов производится процедура
преобразования. Экспериментальные
исследования показали, что корреляция
между двумя пикселями быстро стремится
к нулю с ростом расстояния между ними.
Поэтому можно кодировать изображение,
разбив его на отдельные равные блоки
Вычисление ковариационных матриц и
кодирование проводится в пределах
-го
блока. [6]
Эффективное кодирование изображений на основе быстрых ортогональных преобразований вместо ПКЛ приводит к определенным качественным потерям, которые можно оценить, сравнивая с ошибками, которые получаются при сжатии на основе ПКЛ. Среднеквадратическая ошибка восстановленного изображения по отношению к исходному посредством ПКЛ будет минимальной по сравнению с ошибками при всех других возможных дискретных ортогональных преобразованиях. В этом смысле кодирование с помощью ПКЛ достигает предельной эффективности, являясь оптимальным. [7]
Для кодирования
и сжатия изображений можно использовать
такие двухмерные линейные преобразования,
как дискретное преобразование Фурье
(ДПФ), преобразование Адамара, дискретное
косинусное преобразование (ДКП),
дискретные преобразования Хартли (ДПХ),
Хаара и ряд других. Большинство из
названных одномерных преобразований
позволяют снизить вычислительную
сложность до величины порядка
и даже N.
Поскольку двухмерные преобразования
разделяются на одномерные операции по
строкам и столбцам, то для преобразования
всего изображения потребуется порядка
операций. Кодирование через снижение
размерности преобразования до (
)
пикселов приводит к еще большему
практическому выигрышу в числе операций.
[8]
Обобщенная структурная схема кодирования изображения с дискретным преобразованием имеет вид, показанный на рисунке 2.
Рисунок 2 – Структурная схема кодирования изображения с дискретным преобразованием