Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курсовая_Априамашвили_док.doc
Скачиваний:
38
Добавлен:
10.05.2015
Размер:
2.61 Mб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«МОСОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ РАДИОТЕХНИКИ, ЭЛЕКТРОНИКИ И АВТОМАТИКИ»

МГТУ МИРЭА

Факультет

Информационных Технологий

Курсовая работа

по дисциплине

“Обработка изображений и распознавание образов”

на тему:

«Система нахождения графических примитивов на изображении на основе преобразования Хафа»

Выполнил:

студент 5 курса

группы ИТА-4-08

Априамашвили А. Д.

МОСКВА 2012

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

АНАЛИЗ СУЩЕСТВУЮЩИХ МЕТОДОВ НАХОЖДЕНИЯ ГРАФИЧЕСКИХ ПРИМИТИВОВ И ПРОГРАММНЫХ РЕАЛИЗАЦИЙ

1 Графические примитивы и методика их отыскания

2 Анализ и предварительная обработка входных данных

2.1 Фильтрация шумов

2.2 Выделение границ

3 Базовое преобразование Хафа

3.1 Поиск прямых

3.2 Выделение окружностей на изображении

3.3 Нахождение кривых высшего порядка

4 Модификации преобразования Хафа

5 Нахождение точечных особенностей изображения

5.1 Детектор Харриса

5.2 Масочный детектор

6 Сравнительная характеристика алгоритмов детекции

7 Анализ существующих программных решений

8 Выводы

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

ВВЕДЕНИЕ

Системы компьютерного зрения и распознавания образов широко входят в обыденную жизнь современного человека. Если изначально такие системы, применялись исключительно в военных и медицинских целях, то сейчас существует широкий спектр задач, где компьютерное зрение позволяет эффективно решать задачи управления и оповещения.

Такие системы выполняют преобразование исходных многомерных данных (цветных растровых изображений) в набор обобщенных выходных данных (классов объектов, гипотез, функций принадлежности.). На начальных этапах такого преобразования часто требуется найти графические примитивы - окружности, эллипсы, прямоугольники, кривые, прямые и пр., - на сложном зашумленном изображении и построить карту графических примитивов.

Преобразованная информация используется в качестве входных данных для охранных систем, систем оптического распознавания бумажных документов, картографических систем и систем моделирования трехмерных сцен и объектов. На рынке существует ряд продуктов, выполняющих задачу сбора данных по графическим примитивам. Однако алгоритмы и подходы, применяющиеся в таких системах, не позволяют корректно проанализировать кадр, схему или изображение, полученные в сложных условиях освещения. Программный продукт, разрабатываемый на основе данного исследования, должен устранить этот пробел за счет применения гибко настраиваемых фильтров и механизмов предварительной обработки изображений, а также эффективных алгоритмов преобразования изображения и поиска графических примитивов на основе данных, полученных на предварительных этапах.

Целью данной работы является разработка программного продукта, позволяющего проводить анализ изображения для нахождения и классификации графических примитивов, формировать математическую модель и осуществлять сбор информации о характеристиках графических примитивов (длина, радиус, площадь и т.д.). Для достижения заданной цели должны быть решены следующие задачи:

– Обзор существующих алгоритмов нахождения геометрических объектов на изображении. Рассмотрение основных этапов предварительной обработки изображения.

– Разработка классификации графических примитивов.

– Разработка алгоритмов на основе базового преобразования Хафа и его модификаций.

– Исследование механизмов нахождения точечных особенностей изображения.

– Реализация программного продукта.

– Тестирование и отладка.

Первая глава выпускной квалификационной работы посвящена проблемам классификации графических примитивов, а также существующим подходам к их нахождению. Рассмотрен механизм обработки изображения, начиная с исходного изображения, до получения информации о найденных объектах. Проведен обзор шумоподавляющих фильтров, операторов детектирования краев изображения, методов бинаризации. Рассмотрен базовый алгоритм преобразования Хафа и его модификации. Проведен обзор алгоритмов нахождения точечных особенностей изображения. Выполнена сравнительная характеристика методов на основе преобразования Хафа.

Вторая глава работы посвящена описанию программной реализации рассмотренных методов детектирования объектов. Приведены руководства пользователя и программиста, в которых изложены основные аспекты, необходимые для работы и сопровождения данного программного продукта.

По данной тематике был сделан доклад на научно-практической конференции студентов, аспирантов и молодых ученых "Актуальные проблемы авиации и космонавтики" (Красноярск, 2011).

1. АНАЛИЗ СУЩЕСТВУЮЩИХ МЕТОДОВ НАХОЖДЕНИЯ ГРАФИЧЕСКИХ ПРИМИТИВОВ И ПРОГРАММНЫХ РЕАЛИЗАЦИЙ

.1 Графические примитивы и методика их отыскания

Под графическим примитивом понимается простейший геометрический объект, отображаемый на экране дисплея. Основное назначение примитивов - обеспечить программистов и пользователей удобным набором средств для формирования геометрических объектов. Описание графического примитива обычно содержит метрическую и атрибутивную части. Метрическая часть позволяет сопоставить те величины, в которых задан графический примитив для отображения его на дисплее и те величины, которые характеризуют его физическое или логическое представление. Атрибутивная часть передает геометрические параметры, характеризующие форму и расположение графического примитива. В основе построения любых графических элементов в современных графических библиотеках лежат три основных примитива: точка, отрезок и треугольник. Нередко в качестве примитива выступают прямоугольники, окружности, эллипсы, полигоны произвольных форм и др. Классификация графических примитивов приведена в таблице 1. В большинстве задач, решаемых в рамках компьютерного зрения, особое значение имеют точки, отрезки, треугольники, окружности и прямоугольники. Для обнаружения графических примитивов на изображении используется ряд методов и алгоритмов. Сравнительный анализ наиболее часто применяемых методов данного назначения приведен в таблице 2.

Таблица 1 - Классификация графических примитивов

Тип примитива

Описание

Точка

Простейший графический примитив, имеющий нулевую размерность. Точка характеризуется только координатами своего местоположения.

Отрезок

Совокупность точек, через которые проходит геометрический отрезок с заданными конечными точками. Характеризуется начальной и конечной точками, или начальной точкой и приращениями координат, или длиной и углом наклона.

Ломаная

Последовательности отрезков, соединяющих заданные точки.

Полигон

Область, ограниченная замкнутой ломанной.

Эллипс

Геометрическое место точек плоскости, для которых сумма расстояний до двух данных точек (фокусы) постоянна и больше расстояния между ними.

Окружность

Геометрическое место точек плоскости, равноудаленных от заданной точки, называемой центром, на заданное ненулевое расстояние, называемое ее радиусом.

Парабола

Геометрическое место точек, равноудаленных от данной прямой (директриса параболы) и данной точки (фокус параболы).

Гипербола

Геометрическое место точек плоскости, для которых абсолютное значение разности расстояний до двух выделенных точек (фокусы) постоянно.

Треугольник

Частный случай полигона, ограниченный замкнутой ломанной, состоящей из трех отрезков.

Прямоугольник

Полигон, ограниченный замкнутой ломанной в форме четырехугольника, все углы которого прямые.

Таблица 2. Сравнительный анализ подходов к обнаружению графических примитивов

Подход

Преимущества

Недостатки

Преобразование Хафа

Полное покрытие возможных состояний и положения объекта (за счет полного перебора в стандартном алгоритме). Модифицируемость алгоритма, что позволяет сократить время полного перебора без потери существенной информации.

Предназначен лишь для поиска прямых и окружностей.

Преобразование Радона

Инвариантность по отношению к качеству изображения. Применяемый математический аппарат позволяет легко переходить к другим видам преобразований (аффинным, Фурье).

Сложность реализации. Огромное число операций.

Генетические алгоритмы

В некоторых случаях позволяют добиться большей производительности по сравнению с преобразованиями Хафа и Радона. Адаптируемость к изменяющимся характеристикам изображения.

Эвристический алгоритм, не позволяет говорить о детерминированности проводимых исследований.

В данной работе был выбран подход на основе преобразования Хафа. Преобразование Хафа позволяет добиться приемлемых результатов в рамках задач компьютерного зрения (например, в задачах распознавания рукописного текста) без потерь производительности. Ограниченность базового алгоритма в поиске прямых и окружностей исключается при использовании модификаций преобразования Хафа, а также применением аппроксимационных методов для нахождения более сложных графических примитивов (треугольников, прямоугольников). Задача поиска точек на изображении решается с применением угловых детекторов, основанных на схожих с преобразованием Хафа методиках анализа пространства изображения.

.2 Анализ и предварительная обработка входных данных

Входными данными для преобразования Хафа служат монохромные изображения. Процесс получения геометрического описания пространства изображения заключается в прохождении следующих этапов:

а) Ввод растрового цветного изображения.

б) Преобразование в полутоновое изображение.

в) Сглаживающая фильтрация (для устранения шумов).

г) Операторы выделения краев.

д) Бинаризация.

е) Преобразование Хафа (для нахождения точек, прямых, окружностей, треугольников и прямоугольников) или применение детектора Харриса и масочного детектора (для нахождения особых точек).

Рассмотренная последовательность действий не является строго фиксированной и допускается изменение порядка следования некоторых этапов, а также дополнение иными действиями по предварительной обработке изображения (например, применение морфологических операций).