Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Рябинин К.Б. Обработка и распознавание трехмерных изображений групповых точечных объектов и точечных полей на базе их кв

.pdf
Скачиваний:
31
Добавлен:
02.05.2014
Размер:
1.98 Mб
Скачать

На правах рукописи

Рябинин Константин Борисович

ОБРАБОТКА И РАСПОЗНАВАНИЕ ТРЕХМЕРНЫХ ИЗОБРАЖЕНИЙ ГРУППОВЫХ ТОЧЕЧНЫХ ОБЪЕКТОВ И ТОЧЕЧНЫХ ПОЛЕЙ НА БАЗЕ ИХ КВАТЕРНИОННЫХ МОДЕЛЕЙ

Специальность 05.13.18 – Математическое моделирование, численные методы и комплексы программ

Автореферат

диссертации на соискание ученой степени

кандидата технических наук

Ульяновск – 2008

Работа выполнена на кафедре «Радиотехнических и медико-биологических систем» Марийского государственного технического университета

Научный руководитель:

доктор технических наук, профессор

 

Фурман Яков Абрамович

Официальные оппоненты:

доктор физико-математических наук,

 

профессор

 

Валеев Султан Галимзянович

 

кандидат технических наук, доцент

 

Кревецкий Александр Владимирович

Ведущая организация:

ОАО «Марийский машиностроительный

 

завод», г. Йошкар-Ола

Защита состоится « 8 » октября 2008 г. в 1500 на заседании диссертационного совета Д212.277.02 при Ульяновском государственном техническом университете по адресу: 432027, г. Ульяновск, ул. Северный Венец, 32 (ауд. 211).

С диссертацией можно ознакомиться в библиотеке Ульяновского государственного технического университета.

Автореферат разослан «______» _______________ 2008 г.

Ученый секретарь диссертационного совета, В.Р. Крашенинников

доктор технических наук, профессор

3

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Диссертация посвящена получению и исследованию новых методов обработки и распознавания изображений групповых точечных объектов и точечных полей, расположенных в трехмерном пространстве.

Актуальность работы. Важным условием для успешного решения задач обработки изображений расположенных в пространстве объектов, в частности, точечных объектов, является наличие их адекватных аналитических моделей, а также применение математического аппарата, позволяющего эффективно на базе имеющихся моделей получить требуемые результаты. Трехмерные модели в задачах обработки и распознавания изображений обладают следующими достоинствами:

1)использование третьей координаты повышает информативность изображения;

2)усиливается степень ортогональности зашумленных пространственных групповых точечных объектов разных классов, что обеспечивает значительный рост эффективности распознавания по сравнению с двумерным случаем;

3)появляется возможность анализа результатов трехмерного моделирования в любой проекции и сечении объекта.

Техническое зрение является трехмерной проблемой. Поэтому в основе разработки многофункциональных систем технического зрения, пригодных для работы в различных средах, лежит процесс обработки информации о трехмерных сценах. Интенсивные исследования в этой области имеют многолетнюю историю и связаны с работами М.Минского, П.Уинстона, К.Фу, Р.Гонсалеса, В.Киричука, Я.Фурмана и др. Вместе с тем, единый подход к обработке трехмерных изображений в настоящее время отсутствует. В этом плане целесообразно привлечение аппарата кватернионного анализа, который в полной мере отражает свойства трехмерного пространства.

В диссертационной работе исследуются точечные трехмерные сцены двух видов. Сцены первого вида – это скопления небольшого количества точек – пространственные групповые точечные объекты (количество точек невелико и

составляет 10-20 отметок), сцены второго вида – это обширные точечные поля, расположенные на поверхности трехмерных объектов (количество точек порядка 103

иболее). Обработка сцен первого вида актуальна для радиолокационных, астронавигационных и медико-биологических задач. Здесь важной нерешенной проблемой является задача упорядочения отметок пространственного группового точечного объекта (ПГТО), без решения которой нельзя корректно перейти к решению вопросов распознавания и оценки параметров объектов. Для пространственных точечных полей (ПТП) актуальны задачи детектирования (обнаружения) заданной формы трехмерной подстилающей поверхности и визуализации результатов обработки. Решению этих задач посвящено данное диссертационное исследование.

В диссертации процесс обработки ПТП сводится к обработке векторных полей. Поскольку отметки на поверхности трехмерных объектов получены случайным образом, то исследуемые модели трехмерной поверхности и ПГТО являются разновидностями трехмерных случайных полей. Обработке многомерных случайных полей посвящены работы Васильева К.К., Крашенинникова В.Р.

4

На основе проведенного анализа опубликованных работ можно сделать вывод о том, что задача обработки трехмерных изображений является актуальной и перспективной проблемой.

Целью диссертационной работы является разработка оптимального по критерию минимума расстояния алгоритма формирования «проволочной» математической модели для решения задач распознавания изображений, расположенных в пространстве в виде групповых точечных объектов при наличии координатного шума, а также разработка алгоритмов для визуализации и анализа пространственных объектов, заданных в виде ПТП. Под проволочной моделью

будем понимать пространственную полигональную линию, проходящую единственным образом без разветвлений через все точки объекта.

Для достижения заявленных в диссертационной работе целей решаются следующие задачи:

Разработка алгоритма представления ПГТО в виде упорядоченной последовательности точек.

Исследование эффективности и устойчивости алгоритма распознавания упорядоченного ПГТО в условиях воздействия координатных шумов.

Разработка алгоритма определения параметров вращения кватернионных моделей сигналов, таких как угол поворота и ось вращения, для решения задачи распознавания.

Синтез алгоритма сегментации и визуализации ПТП на основе процедур кластеризации.

Методы исследования. Для решения поставленных в диссертационной работе задач использованы методы математического моделирования, методы обработки сигналов и изображений, спектрального и корреляционного анализа, теории вероятностей, математической статистики, линейной алгебры, методы объектноориентированного программирования.

Научная новизна. В диссертационной работе получены следующие, выносимые на защиту, новые научные результаты:

Проволочная модель ПГТО и результат исследования её на помехоустойчивость при воздействии координатных шумов.

Алгоритм упорядочения ПГТО на базе проволочной модели, оптимальный по критерию минимума расстояния.

Алгоритм распознавания кватернионных сигналов с неизвестным углом поворота и осью вращения относительно эталонного сигнала, оптимальный по критерию минимума расстояния.

Алгоритм визуализации трехмерной модели анализируемого объекта или сцены на основе процедуры кластеризации точек множества.

Практическая ценность работы заключается в следующем:

1.Решение задачи упорядочения ПГТО, представленного в виде его проволочной модели, позволяет использовать методы теории сигналов для распознавания трехмерных изображений групповых точечных объектов.

2.Реализованы в виде программных модулей алгоритмы упорядочивания и распознавания отметок ПГТО в виде проволочной модели; алгоритмы определения параметров вращения кватернионных сигналов – угла поворота и оси вращения.

5

3.Разработанный алгоритм визуализации трехмерного объекта на основе процедуры кластеризации, позволяет анализировать форму поверхности исследуемого изображения.

4.Результаты, полученные в ходе диссертационного исследования, вошли в учебный процесс кафедры «Радиотехнических и медико-биологических систем» по специальности «Радиотехника» в курсы «Радиотехнические системы», «Цифровая обработка радиотехнических сигналов» и для специальности «Инженерное дело в медико-биологической практике» - «Обработка медико-биологических объектов».

На защиту выносятся:

1.Адекватная проволочная кватернионная модель изображения ПГТО, ассоциированная с выпуклыми вложенными многогранниками, вершинами которых служат точки объекта и оценка ее помехоустойчивости.

2.Оптимальный по критерию минимума расстояния алгоритм распознавания ПГТО, представленных в виде их проволочных моделей.

3.Алгоритм определения параметров вращения ПГТО по результатам его согласованной фильтрации.

4.Оптимальный алгоритм сегментации ПТП по критерию максимума модуля гиперкомплексной части скалярного произведения кватернионных сигналов.

Личный творческий вклад автора. Непосредственно автором разработан алгоритм нумерации граней ассоциированного с ПГТО выпуклого многогранника на основе интегральных характеристик и на основе расстояния между контурами граней [1]. Автором были проведены эксперименты по проверке помехоустойчивости сформированной проволочной модели при воздействии координатных шумов [7,8]. Лично была разработана программа определения параметров вращения кватернионного сигнала [2,3,9] и программа визуализации точечных полей на основе процедуры кластеризации [4,5,6,10,11].

Апробация работы. Результаты работы обсуждались на 8-ой Международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ-8-2007) (Йошкар-Ола, 2007 г.); на 13-ой Всероссийской конференции «Математические методы распознавания образов» (ММРО-13) (Санкт-Петербург, 2007 г.); на всероссийском семинаре «Современное состояние и перспективы применения ГИС-технологий и аэрокосмочиских методов в лесном хозяйстве и садово-парковом строительстве» (Йошкар-Ола, 2008), на ежегодных научных конференциях профессорско-преподавательского состава МарГТУ. Результаты работы использованы в проектах, поддержанных грантами РФФИ: проект №07-01-00058-а «К решению проблемы визуализации и анализа 3D сцен, распознавания пространственных образов методами кватернионного исчисления», проект №08-01-12000-офи «Разработка методов и создание информационной технологии визуализации и сравнительного анализа сопряженных пространственных статических и динамических сцен».

Публикации. По теме диссертации опубликовано 11 печатных работ. Из них две – в журналах РАН, в том числе одна работа, опубликована в журнале, рекомендованном ВАК. Также получено одно свидетельство об официальной регистрации программы.

Структура и объем диссертации. Диссертационная работа включает в себя

6

введение, 6 глав, заключение, список литературы из 70 наименований и одного приложения. Основная часть работы изложена на 196 страницах машинописного текста, содержит 90 рисунков, 7 таблиц.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность проблемы, определены цели и задачи исследования, сформулирована научная новизна, обоснована практическая значимость работы и приведена краткая структура диссертации.

В первой главе отражено состояние вопросов обработки, распознавания и упорядочения отметок объемных изображений, представленных в виде ПГТО. Приведена классификация известных методов решения задач визуализации трехмерных изображений. Изложено преимущество аппарата кватернионого анализа для представления ПГТО в трехмерном пространстве. По результатам аналитического обзора сформированы конкретные цели и задачи исследований.

Для получения точечных сцен рассмотрены принципы дистанционного восприятия и анализа объектов с помощью сканеров. Рассмотрены ультразвуковые, магнитные, механические и лазерные сканеры.

Большинство задач распознавания решаются при условии предварительного упорядочения отметок ПГТО, т.е. известна начальная точка прослеживания объекта, а также порядок следования отметок ПГТО. В условиях отсутствия такой информации, решить задачи определения класса объекта известными методами не представляется возможным. Таким образом, одной из важнейших задач в области обработки ПГТО является именно задача упорядочения его отметок.

Среди применяемых алгоритмов упорядочения множества точек следует отметить следующие: 1) нумерация точек по принципу максимальной простоты; 2) нумерация на основе графа «минимальное дерево»; 3) естественный подход к нумерации точек ГТО; 4) алгоритм объективной группировки точек.

Следующей задачей является визуализация полученных точечных объектов. В настоящее время известно довольно большое число различных методов представления трехмерных объектов и связанных с ними методов визуализации. Эти представления можно разделить на несколько классов, обладающих характерными свойствами:

1.Поверхностные, либо объемные.

2.Связанные, либо дискретные.

3.Явные, либо параметрические.

Поверхностные модели описывают только поверхность объекта в трехмерном пространстве. При этом область пространства E3 при воксельном представлении делится на набор элементарных кубов (вокселей). Связанные модели явно или неявно содержат информацию о непрерывных участках поверхностей моделей, тогда как дискретные представления описывают только приближение поверхности объекта. Явное задание моделей предполагает, что описание модели объекта в данном представлении доступно в явной форме, а параметрическое - что для его получения необходимо дополнительно вычислять некоторую функцию, зависящую от ряда параметров.

Во второй главе приведен обзор методов аналитического представления ПГТО. Проведен структурный анализ точек ПГТО, в результате чего получен алгоритм для представления ПГТО в виде сложной многогранной структуры, в которой отметки

7

ПГТО представляются вершинами этой структуры. По результатам структурного анализа на базе кватернионных сигналов получено описание ПГТО в виде проволочной модели.

ПГТО задается в виде кватернионного сигнала, который получается следующим образом. Пусть А an 0,s 1 - множество расположенных в трехмерном

пространстве s точек (рис.1).

Рис. 1: Пространственный групповой точечный объект

Каждую его точку an соединим с началом отсчета одноименным вектором

an an,1 i an,2

j an,3 k,

n 0,1,...,s 1, заданным в

кватернионном

виде. В

результате получим векторный кватернионный сигнал

 

 

 

 

 

 

 

 

 

 

 

А an 0,s 1

an,1 i an,2 j an,3 k

.

(1)

 

 

 

 

0,s 1

 

 

Для аналитического описания ПГТО известны следующие методы представления:

1)в виде пучка кватернионов;

2)в виде полигонального контура;

3)в виде амплитудно-фазовой модели.

Для решения задачи упорядочения ПГТО во второй главе находится представление в виде выпуклого многогранника по заданному множеству точек его вершин. В данном разделе будет показано, что для решения этой задачи достаточно задать неупорядоченный ПГТО n 0,s 1, где n , n 0,1,...,s 1, одна из s его

вершин.

Основная проблема задания выпуклого многогранника множеством его вершин состоит в установлении по результатам анализа ПГТО связей между этими вершинами в виде графа или матрицы. Например, для гексаэдра (рис.2,а) такой граф имеет вид представленный на рис. 2,б.

Каждое полупространство, пересечение конечного числа которых образует выпуклый многогранник, содержит ограничивающую плоскость . Такую плоскость назовем критической. Она обладает следующими свойствами: 1) содержит не менее трех точек ПГТО , являющихся вершинами выпуклого многогранника, и 2) все остальные вершины многогранника расположены по одну сторону критической плоскости, а по другую сторону плоскости нет ни одной точки ПГТО.

8

а)

б)

 

Рис.2: Объемная фигура гексаэдра (а) и его граф (б)

Синтез выпуклого многогранника по заданному множеству точек n 0,s 1

его вершин является многоэтапной процедурой. На каждом этапе выделяется одна из граней многогранника, упорядочиваются точки множества , лежащие в пределах этой грани, и две из них отбираются для поиска следующей грани.

Результатом начального этапа должно быть построение по этим данным нулевой (начальной) критической плоскости 0 и определение находящихся в ней вершин М, т.е. точек A0 an,0 .

Для построения текущей плоскости из множества A an 0,s 1 произвольно

выбирается одна точка в качестве полюса и ещё две точки для построения двух разностных векторов. Далее вычисляется нормаль r к полученной плоскости. Если полученная плоскость не обладает свойством критичности, то оставшиеся s-3 точки множества А будут располагаться по обе её стороны. Поэтому для проверки плоскости на критичность достаточно вычислить знаки косинусов углов, образованных векторами, соединяющих каждую из этих (s-3) точек с полюсом, и вектором нормали r к полученной плоскости (рис. 3,а).

Построенная плоскость будет критической, если вычисленные значения косинусов углов будут иметь один и тот же знак. После получения первой критической плоскости 0 определяем расположенные в ней точки an,0

подмножества A0. Эти точки будут вершинами многоугольника, ограничивающего

грань G0.

Следующей, после получения многогранника, является процедура упорядочения точек данного подмножества, являющихся вершинами выпуклого многоугольника. Стороны этого многоугольника будут ребрами многогранника, относящимися к грани G0 . Упорядочение проводится методом построения критических линий для расположенного в плоскости множества точек. На рис. 3,б показаны линии, проходящие через точки, принадлежащие одной плоскости. Точки этого множества расположены по обе стороны линии 11 и поэтому данная линия не будет, в отличии от линии 22 , критической.

 

9

а)

б)

 

Рис. 3: Решение задачи представления ПГТО в виде выпуклого многогранника: а) к

 

методу критических плоскостей; б) к методу критических линий

После получения первой критической линии аналогично строится вторая подобная линия, причем полюс выбирается во второй точке первой критической линии и т.д. Процесс построения критических линий является сходящимся, т.е. в конечном счете, мы получаем замкнутую ломаную линию в виде выпуклого многоугольника, являющегося границей грани G0 (рис. 4,а).

а) б) Рис. 4: Формирование грани многоугольника в результате пересечения всех критических

линий множества точек: а) контур грани; б) фрагмент графа многогранника

Результат начального этапа анализа многоугольника можно представить в виде фрагмента полного графа, описывающего структуру многогранника (рис. 4,б).

Поскольку выпуклый многогранник характеризуется конечным значением своего объема, то рассматриваемая процедура нахождения его граней заканчивается при замыкании всех связей формируемого полного графа. Кроме полного графа многогранника после окончания промежуточного анализа получены аналитические представления всех его граней G0,G1,...,Gl 1 в виде их контуров D0,D1,...,Dl 1.

Контур Dm dm n , m 0,1,...,lm 1, представляет собой последовательность кватернионов, задающих упорядоченные ребра многогранника в пределах грани Gm.

Упорядоченные точки множества A an 0,s 1 , относящиеся к грани Gm, не сохраняют свою первоначальную нумерацию. Поэтому элементарные векторы контура Dm имеют свою нумерацию, обусловленную законом упорядочения точек грани Gm. Также известны нормали rm , площади и точки центров тяжести граней

Gm, m 0,1,...,lm 1.

Следующий этап упорядочивания состоит в получении проволочной модели ПГТО. Проволочная модель дает правила нумерации его отметок, при которых номер точки с достаточно высокой вероятностью сохраняется в условиях действия

10

координатных шумов и при произвольных параметрах масштаба и вращения. Первой процедурой для получения проволочной модели ПГТО является упорядочение граней ассоциированного с ним выпуклого многогранника.

Упорядочение граней на основе их интегральных характеристик. Анализ контура грани Gn позволяет найти нормаль rn к плоскости грани и количество её вершин sn, а также такие интегральные характеристики, как площадь Sn,

положение центра тяжести tn грани относительно центра тяжести tx многогранника

X, периметр Ln, коэффициент формы kф, и др.:

 

sn 2

 

1

 

 

 

 

sn 1

dn(m)

 

Sn 0,5

( dn(m),dn( ))

;

Ln

;

 

1

 

m 0

 

 

 

 

m 0

(2)

 

 

 

 

 

 

 

1 sn 2

2

 

 

 

 

 

 

1

кф Ln

/Sn ;

 

 

tn

 

 

dn(m) tx

 

 

s

 

 

 

 

 

 

 

1 m 0

Грань с нулевым номером (начальная грань) должна иметь набор информационных признаков, обеспечивающих её значительное отличие от остальных граней. Нумерация остальных граней выполняется в соответствии с правилами: 1) последующий номер присваивается грани, являющейся смежной по отношению к грани с предыдущим номером; 2) последующий номер присваивается грани с наиболее отличающимися характеристиками от грани с предыдущим номером.

Упорядочение на основе величины расстояний между гранями. Ранее рассмотренный подход к упорядочению граней на основе различия их интегральных характеристик имеет эвристический характер. Представляя контуры граней элементами метрического пространства, можно найти расстояние между ними и тем самым с позиции критерия максимума расстояние оптимизировать процедуру

нумерации граней многогранника X.

 

 

 

 

 

 

 

 

 

 

 

Gn 0,l 1

Пусть Dn 0,l 1 -

множество

 

контуров многоугольников граней

многогранника

X, где

Dn dn(m) 0,s 1,

 

dn(m) dn,1(m)i dn,2(m) j dn,3(m)k ,

m 0,1,...,sn 1,

контур грани

Gn . Квадрат расстояния между пространственными

контурами Dn и D равен

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R2

 

 

 

 

D

 

 

 

2

 

 

 

D

 

 

 

2 2Re(D ,D ),

(3)

 

 

 

 

 

 

 

 

 

 

где

 

n,

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

sn 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(Dn ,D )= dn(m)dv (m).

 

(4)

 

 

 

 

 

 

 

 

 

 

 

m 0

 

 

 

 

Пусть текущая грань имеет номер u, т.е. Gn Gn(u ) ,

а следующий номер следует

присвоить одной из граней Gv 1,Gv 2,...,Gv h. Для принятия решения в

соответствии

с выражением

(3)

вычисляется h

значений

расстояний

R2

,R2

,...,R2

между

контуром

D

и

контурами

D

,D

 

,...,D

.

n,v 1

n,v 2

 

n,v h

 

 

 

 

n

 

 

 

 

v 1

v 2

v h

 

Следующий,

 

(u 1)-й

номер

присваивается

грани,

для

которой

 

значение

вычисленного расстояния максимально, т.е.

 

 

 

 

 

 

 

 

 

 

 

 

 

G

 

G(u 1)

при

R2

 

max, 1,2,...h.

 

(5)

 

 

 

v

v

 

 

n,v

 

 

 

 

 

 

 

Соседние файлы в предмете Дипломная работа (подготовка и защита)