
- •1.1. Элементы зрительного восприятия
- •1.2. Использование движения при сегментации
- •2.1. Свет и электромагнитный спектр
- •2.2. Сегментация на отдельные области
- •3.1. Понятие о дискретизации и квантовании изображения
- •3.2. Пороговая обработка
- •4.1. Фундаментальные отношения между пикселями
- •4.2. Связывание контуров и нахождение границ
- •5.1. Основные градационные преобразования
- •5.2. Обнаружение разрывов яркостей
- •6.1. Видоизменение гистограммы
- •6.2. Стандарты сжатия изображений
- •7.1. Основы пространственной фильтрации
- •7.2. Сжатие с потерями
- •8.1. Пространственные фильтры
- •8.2. Сжатие без потерь
- •9.1. Введение в фурье-анализ
- •9.2. Модели сжатия
- •10.1. Сглаживающие частотные фильтры
- •10.2. Основы теории сжатия изображений
- •11.1. Частотные фильтры повышения резкости
- •11.2. Вейвлет-пакеты
- •12.1. Гомоморфная фильтрация. Вопросы программной реализации
- •12.2. Двумерные вейвлет-преобразования
- •13.1. Модели шума
- •13.2. Быстрое вейвлет-преобразование
- •14.1. Подавление шумов с помощью пространственной и частотной фильтрации
- •14.2. Одномерные вейвлет-преобразования
- •15.1. Оценка искажающей функции
- •15.2. Цветовая сегментация
- •16.1. Геометрические преобразования
- •16.2. Цветовые преобразования
- •17.1. Цветовые модели
- •17.2. Кратномасштабное разложение
- •18.1. Сглаживание и повышение резкости
- •18.2. Одномерные вейвлет-преобразования
- •19.1. Шумы на цветных изображениях
- •19.2. Элементы зрительного восприятия
3.2. Пороговая обработка
Некоторые задачи обработки изображения связаны с преобразованием полутонового изображения (то есть такого, которое имеет много градаций яркости) в бинарное (двухградационное). Такое преобразование осуществляется в первую очередь для того, чтобы сократить информационную избыточность изображения, оставить в нем только ту информацию, которая нужна для решения конкретной задачи. В бинарном изображении должны быть сохранены интересующие нас детали (например, очертания изображенных объектов) и исключены несущественные особенности (фон).
Пороговая обработка полутонового изображения заключается в разделении всех элементов изображения на два класса по признаку яркости, то есть в выполнении поэлементного преобразования вида
где f0 - некоторое "пороговое" значение яркости.
При выполнении пороговой обработки основной вопрос состоит в выборе порога f0 . Пусть полутоновое изображение содержит интересующие нас объекты одной яркости на фоне другой яркости (типичные примеры: машинописный текст, чертежи, медицинские пробы под микроскопом и т. д.). Тогда в идеале плотность распределения яркостей должна выглядеть как две дельта-функции (рис. 8а). В данном случае задача установления порога тривиальна: в качестве f0 можно взять любое значение между "пиками". На практике, однако, встречаются определенные трудности, связанные с тем, что, во-первых, изображение искажено шумом и, во-вторых, как для объектов, так и для фона характерен некоторый разброс яркостей. В результате пики функции плотности распределения "расплываются", хотя обычно ее бимодальность сохраняется (рис. 8б). В такой ситуации можно выбрать порог f0 , соответствующий положению минимума между модами, то есть использовать функцию поэлементного преобразования, показанную на рис. 8в.
Пороговая обработка является одним из основных методов сегментации изображений, благодаря интуитивно понятным свойствам. Этот метод ориентирован на обработку изображений, отдельные однородные области которых отличаются средней яркостью. Самым распространенным методом сегментации путем пороговой обработки является бинарная сегментация, то есть когда в нашем распоряжении имеется два типа однородных участков.
В этом случае изображение обрабатывается по пикселям и преобразование каждого пикселя входного изображения в выходное определяется из соотношения:
Естественно сегментация может быть не только бинарной и в таком случае существующих классов больше, чем два. Такой вид сегментации называется многоуровневым. Результирующее изображение не является бинарным, но оно состоит из сегментов различной яркости. Формально данную операцию можно записать следующим образом:
Самым сложным в пороговой обработке является сам процесс определения порога . Порог часто записывают как функцию, имеющую вид:
Если значение порога зависит только от , то есть одинаково для всех точек изображения, то такой порог называют глобальным. Если порог зависит от пространственных координат , то такой порог называется локальным. Если зависит от характеристики , то тогда такой порог называется адаптивным. Таким образом, обработка считается глобальной, если она относится ко всему изображению в целом, а локальной, если она относится к некоторой выделенной области [2].