Санкт-Петербургский государственный университет
Факультет прикладной математики – процессов управления
Кафедра моделирования экономических систем
Никитин Михаил Александрович
Дипломная работа
Сегментация изображений на основе контурного анализа
Заведующий кафедрой, доктор физ.-мат. наук, профессор Прасолов А. В.
Научный руководитель, кандидат физ.-мат. наук, доцент Ковшов А. М.
Рецензент, кандидат тех. наук, доцент Гришкин В. М.
Санкт-Петербург
2015
Содержание
Введение 3
Общая задача контурного анализа 5
Существующие методы бинаризации 7
Алгоритм максимизации контуров в окрестности точки 12
Анализ контуров бинаризованых изображений 17
Сравнительный анализ 21
Заключение 23
Список литературы 24
Приложение 25
Введение
Одной из самых востребованных областей на современном этапе развития цифровых и компьютерных технологий является компьютерное зрение. Область его применения довольно широка: от распознавания номеров автомобилей, штрих-кодов товаров до анализа сложных объектов для ориентации на местности. Основной же задачей является довольно простая цель – заставить компьютер понять, что запечатлено на изображении. Однако столь простая и естественная для человеческого взгляда задача предстает огромным препятствием для компьютера.
Человек с ранних лет учится распознавать объекты, он изучает как изменение освещения или расположения, так и меняет форму объекта, тем самым накапливая за жизнь огромное количество информации. Компьютер же не способен запоминать настолько огромное количество примеров, да и не способен набирать опыт в той же скорости, что и человек. Для этого вводят некоторые наборы первоначальных факторов, зависимости между которыми уже подбираются автоматически.
Сегментация – процесс разделения цифрового изображения на несколько сегментов (множество пикселей), для которых выполняется определенный критерий однородности. Одним из базовых способов такого разделения является построение сегментации с помощью порога. Операция порогового разделения заключается в сопоставлении значения яркости каждого пикселя изображения с заданным значением порога.
Бинаризация, как частный случай сегментации, – процесс переведения цветного изображения в черно-белый вариант. Контур – самонепересекающаяся замкнутая кривая, полученная путем анализа бинарного изображения. Контурный анализ представляет собой изучение геометрических свойств полученных контуров с целью сравнения их как между собой (для выделения текстуры, как множество однородных для человеческого глаза объектов), так и с другими изображениями для получения информации о свойствах исследуемого объекта.
В дипломной работе в пункте 1 рассматривается общая задача, повествуется о стадиях (исследуются стадии) распознавания. Во втором рассматриваются существующие методы бинаризации, их преимущества и недостатки; в пункте 3 рассмотрен алгоритм бинаризации, а также описано программное приложение, реализованное автором на основе описанного алгоритма; в пункте 4 описываются геометрические свойства контуров, а также описывается алгоритм поиска однородных структур в сегментах изображения; в пункте 5 представлен сравнительный анализ данного алгоритма в соответствии с алгоритмами, ранее использованными в данной области; в заключении сделаны выводы и обозначены пути дальнейшего исследования проблемы.
Общая задача контурного анализа.
В данной работе используется метод распознавания растровых изображений, основанный на анализе свойств множества контуров, выделяемых после бинаризации изображения, а также изучается сам процесс бинаризации как средство получения контуров наилучшего качества. Рассматриваются изображения, представленные в формате цветовой модели RGB (Red Green Blue) – формате, где каждый пиксель изображения описывается тремя цветовыми составляющими, яркость каждого из которых может изменяться в пределах от 0 до 255. Бинаризация изображения может проводиться различными способами после приведения изображения к серым тонам. В дальнейшем используется преобразование к серотоновому изображению, происходящее либо по шкале NTSC, когда красная, зеленая и синяя составляющие составляют соответственно 0.33, 0.56 и 0.11 долей яркости; либо по равномерной шкале, где каждый цветовой канал дает треть части пикселя.
После бинаризации начинается обход всех черных областей вдоль их границ, что дает замкнутые контуры, после чего идет распознавание контуров по их геометрическим свойствам. Множество всех контуров разбивается на подмножество одинаковых, после чего идет их дальнейший анализ как текстуры или, при необходимости распознать объект, сравнение с контурами изначально заложенных в программу образцов. В работе Я. А. Фурмана [1] контуры описываются как «концентратор информации в изображении», после чего следует их спектральный и корреляционный анализ. Однако цель данной работы – исследование методов бинаризации для получения максимального значения контуров.
Цель работы – провести сегментацию и, как частный случай, бинаризацию изображения с получением наибольшего количества контуров, после чего сравнить с существующими методами для дальнейшего анализа. В данной работе разработан алгоритм по нахождению максимального количества контуров, попадающих в заранее заданную окрестность каждого пикселя.
