
- •Лабораторная работа №1. Методы кодирование цветных телевизионных изображений. Колориметрические стандарты 4
- •Лабораторная работа №2. Моделирование зашумленных телевизионных изображений
- •Лабораторная работа №3. Точечная обработка и геометрические преобразования изображений
- •Лабораторная работа №4. Методы фильтрации цифровых изображений
- •Лабораторная работа №5. Методы выделения признаков и символическое описание изображений
- •Контрольные вопросы
- •Литература
Лабораторная работа №3. Точечная обработка и геометрические преобразования изображений
Цель работы
Получить общее представление об основных задачах обработки и понимания изображений в автоматических системах, научиться и развить навыки выполнения точечных и геометрических преобразований изображений.
Общие сведения о задачах и методах автоматической обработки и понимания изображений.
При решении задач анализа изображений используется большое число различных процедур обработки цифровых двумерных сигналов и полей. Конкретный набор этих процедур определяется характером исходного изображения и конечными целями обработки: эффективное кодирование, реставрация и улучшение изображений для визуального восприятия и последующей машинной обработки, понимания изображении и распознавания образов [19,20]. Следует отметить, что приведенное разделение процедур по области применения является достаточно условным, так как во многих случаях для достижения конечной цели используются преобразования, характерные для другой области применения. Например, часто для наиболее эффективного кодирования изображений необходимо вначале обнаружить и классифицировать некоторые объекты на изображении, т.е. решить типовую задачу распознавания образов, а уже затем перечислением результатов распознавания осуществлять кодирование.
Удобно проводить систематизацию преобразований изображений на более низком иерархическом уровне - уровне операций, из которых могут составляться более сложные и менее абстрактные от решаемых задач процедуры [17]. В качестве таких базовых операций можно выбрать: точечную обработку изображений, пространственную и временную фильтрации изображений, геометрические преобразования изображений, статистическое оценивание изображений, выделение признаков и символическое описание изображений, семантическую интерпретацию.
Первые три вида операций относятся к начальному этапу в цепочке операций алгоритма понимания изображений и в большинстве случаев играют роль предварительной обработки исходного изображения для удобства его последующей машинной обработки. Поскольку в результате выполнения данных операций вновь получается изображение, то часто термин «обработка изображений» (Image Processing) применяется именно для обозначения подобных видов преобразований [20,23].
Статистическое оценивание изображений необходимо для преодоления априорной неопределенности и адаптации параметров алгоритма обработки к наблюдаемому изображению [22]. Эти операции заключаются в построении локальных или глобальных гистограмм значений различных признаков и нахождении моментов их распределений (средних значений, дисперсий, коэффициентов корреляции и т.д.). В связи с тем, что для изображений операции статистики не имеют сколь-нибудь существенных особенностей по сравнению с используемыми для анализа других радиотехнических сигналов и случайных процессов [25,6,7], то в настоящей работе они не рассматриваются.
Чаще всего для автоматического понимания видеоданных важно не изображение само по себе, а та информация, которая в нем содержится [13,20,23]. Извлечение этой информации и составляет цель дальнейшей (после предварительной) обработки изображений. Традиционно первым шагом на этом этапе является выделение вторичных признаков и составление вторичного описания в терминах этих признаков и отношений между ними. Часто этот этап называют сегментацией изображений [21].
Семантическая интерпретация обычно является; заключительным этапом в алгоритме понимания изображений. Операндами здесь являются уже не изображения, как на всех предыдущих шагах, а наборы (символы) вторичных признаков. Семантическая интерпретация в этом случае сводится к распознаванию образов и анализу сцен (Pattern Recognition and Image Analysis) [23].
Точечная обработка и геометрические преобразования изображений
Под точечной обработкой
подразумевается класс операций над
изображениями, где результатом является
также изображение, яркость каждого
элемента которого определяется лишь
яркостью и координатами соответствующего
элемента в исходном изображении и не
зависит от значений других элементов.
Если обозначить исходное изображение
,
а результат его
преобразования
,
то в общем случае
математическая модель точечных операций
имеет следующий вид:
.(4.1)
В зависимости от вида функции
можно выделитьлинейные
и нелинейные
точечные операции, а
также координатно-независимые
и координатно-зависимые
операции.
Координатно-независимые точечные преобразования
Самыми простыми с точки
зрения технической реализации являются
координатно-независимые точечные
операции. Здесь функция
тождественна самой себе для любых
значений аргументов
и
:
,
поэтому координатные
аргументы в ее обозначении можно не
указывать. Если функция
является линейной:
,(4.2)
где
и
- некоторые константы,
то имеет место линейное
точечное преобразование. Линейные
точечные преобразования осуществляют
изменение контраста
изображения (при
)
иего среднего уровня
яркости (
),
либоинверсию изображения
(при
).
Такие операции в основном предназначены
для улучшения визуального восприятия
цифрового изображения на индикаторе,
а также для нормировки изображения с
целью наилучшего использования
ограниченной разрядности видеопамяти
(обычно не более восьми).
Чаще при обработке изображений
используют нелинейные
точечные операции, которым
соответствует нелинейная функция
.
Так как для нелинейных преобразований
не существует универсальной формы
записи, то приведем лишь наиболее типовые
примеры:пороговая
обработка, квантование, яркостный срез,
табличное преобразование яркости. На
рис.4.1 показаны характерные виды функции
,
соответствующие перечисленным примерам,
а на рис. 4.2 - результаты преобразований
тестового изображения.
а) однопороговая обработка 6) квантование
в) яркостный срез г) табличное преобразование яркости
Рис. 4.1. Передаточные характеристики системы нелинейного преобразования изображений
Пороговая обработка (рис. 4.2,6) и яркостный срез (двухпороговая обработка) (рис. 4.2,в) используются для преобразования полутонового изображения в двухградационное (бинарное) изображение и используется чаще всего на заключительном шаге этапа предварительной обработки для подавления фона и выделения областей расположения полезных объектов, а также для обнаружения контрастных по отношению к фону точечных ориентиров.
Квантование (рис. 4.2,г) применяется для рационального сокращения разрядности представления изображения. Например, среднее отличие яркости большинства видимых астроориентиров значительно меньше, чем отличие их яркости по отношению к неинформативному фону, поэтому выделение большого числа разрядов на представление несуществующих яркостей в изображении звездного неба нецелесообразно.
а) б)
в) г)
д)
Рис. 4.2. Координатно-независимые точечные преобразования:
а) исходное тестовое изображение,
б) результат однопороговой обработки,
в) результат двухпороговой обработки (яркостный срез),
г) результат квантования на шесть уровней яркости,
д) результат табличного преобразования яркости.
Табличный тип преобразования яркости изображения является наиболее общим для цифрового изображения и для него справедливо все, касающееся других точечных операций. Отметим лишь, что любое табличное преобразование изменяет долю элементов изображения с той или иной яркостью и поэтому его применяют для желаемого видоизменения гистограмм распределения яркостей исходного изображения.
Координатно-зависимые точечные преобразования.
Более сложными являются
координатно-зависимые точечные
преобразования. Здесь каждому элементу
с координатами
ставится в соответствие своя функция
.
Эту функцию, например, можно задать
полем коэффициентов
и
или найти закономерность
между значениями коэффициентов
,
и координатами
и описать ее в виде
функциональной зависимости.
Практическое значение такой вид операций находит при компенсации яркостных искажений, вносимых телевизионными датчиками (рис.4.3). Дело в том, что большинство датчиков изображения, снабженных линзовыми объективами, имеют неоднородную, спадающую к границам кадра чувствительность. Вызванные этим яркостные искажения стараются скомпенсировать в предварительном видеоусилителе каждой телевизионной камеры, изменяя его коэффициент усиления согласованно с законом считывания данных с фоточувствительной мишени. Однако в рамках фиксированной электронной схемы полностью это не удается из-за индивидуальных дефектов каждой линзовой системы и фотомишени. Устранение оставшихся искажений выполняют уже алгоритмически в цифровом виде на перепрограммируемых устройствах, не требующих переделки принципиальной схемы.
а) б)
Рис. 4.3. Координатно-зависимые преобразования:
а) исходное изображение; б) результат преобразования оптической системой с ниспадающей к краям кадра передаточной характеристикой
Если поля коэффициентов
и
рассматривать как другие
изображения, то легко провести аналогию
между линейными координатно-зависимыми
преобразованиями и операциями сложения
и умножения двух и более кадров
изображения.
Геометрические преобразования
Многие регистрирующие и изображающие системы вносят геометрические искажения. Например, в видиконных телекамерах и дисплеях с кинескопом возникают подушкообразные и бочкообразные искажения (дисторсии) (рис.4.4). Один из возможных способов коррекции таких искажений сводится к компенсирующему предыскажению растра при развертке изображения. Метод пространственного искривления позволяет также корректировать перспективные искажения, моделировать линейные геометрические преобразования изображений, такие как смещение, поворот и изменение масштаба.
а) б)
Рис. 4.4. Геометрические преобразования: а) бочкообразные искажения; б) подушкообразные искажения
Процедуру геометрических
преобразований можно разбить на два
этапа. На первом этапе определяют
координаты каждой точки
наблюдаемого изображения, которые
отображаются в точки скорректированного
изображения с целочисленными координатами
.
Для этого пользуются
моделью преобразований координат
идеального изображения в координаты
наблюдаемого:
,
.
где
и
- монотонные отображения функции общего
вида.
Затем, зная координаты
в плоскости наблюдаемого
изображения и уровни яркости соседних
элементов с целочисленными координатами,
находят оценку яркости элемента
скорректированного изображения с
координатами
.
Эту задачу можно решить методами
интерполяцииsine-функциями,
функциями Бесселя, методами сплайновой
интерполяции [24], а также с помощью
двумерной линейной фильтрации изображений
(см. п.4.3).
Задание. Порядок выполнения
Выполнить в среде MathCAD ввод файла формата bmp с черно-белым изображением.
Определить динамический диапазон яркости изображения, его контрастность, средний уровень яркости, количество элементов изображения в строке и столбце.
Выполнить контрастирование изображения с учетом ограничения на положительное значение яркости элементов.
Выполнить пороговую однопороговую и двухпороговую обработку яркости изображения с целью выделения темных, светлых объектов и объектов средней яркости.
Выполнить нелинейное монотонное преобразование яркости изображения (например, логарифмическое или экспоненциальное преобразование яркости).
Выполнить преобразование поворота и масштабирования изображения.
Провести анализ изменения динамического диапазона, контрастности и средней яркости преобразованных изображений. Дать субъективную оценку изменения качества преобразованных изображений с точки зрения восприятия человеком. Предложить области применения рассмотренных алгоритмов.
Требования к содержанию отчетов
Титульный лист;
Цель работы;
Задание;
Основные теоретические сведения;
Методика выполнения работы;
Результаты работы;
Текст программы в среде MathCAD;
Выводы с анализом основных результатов.