Скачиваний:
113
Добавлен:
01.05.2014
Размер:
964.61 Кб
Скачать

1) , 4) ,

2) , 5) ,

3) , 6) ,

7) ,

.

Например,

.

Символы алфавита в грамматиках деревьев соответствуют деревьям, конкатенация производится в узлах деревьев. В грамматиках сетей символы алфавита соответствуют помечен­ным графам — сетям с произвольным числом точек, в которых сети могут сцепляться друг с другом. Еще более сложную структуру представляют собой грамматики графов [28, 43]. Для всех вышеперечисленных типов грамматик проведена классификация по Хомскому. Как в случае строковых грамма­тик, годными к практическому использованию являются контекстно-свободные и регулярные грамматики таблиц, сетей, деревьев, графов [28, 43, 47].

Синтактико-семантические методы. Син­таксическая модель позволяет эффективно учитывать струк­туру и контекст (сочетаемость примитивов) изображения. Од­нако, решая задачу описания объекта, желательно иметь еще некоторую качественную информацию о подобразах, т. е. учи­тывать и семантический аспект изображения. Этого можно достичь, описав каждый примитив и отношения между ними с помощью набора характеристик (признаков, атрибутов) и установив соотношения, по которым получают атрибуты про­изводных подобразов. Такой сннтактико-семантический подход позволяет сделать описание объекта более гибким и эффек­тивным. Для формализации синтактико-семантического под­хода к описанию используют атрибутные грамматики [28, 43, 45].

Введение атрибутных грамматик основано на следующих утверждениях [45]. Пусть есть объект S, состоящий из двух примитивов X и Y с отношением R между ними: . Примитивы X, Y и отношение R можно описать через набо­ры (векторы) признаков (атрибутов), т. е.

,

,

.

Вектор атрибутов объекта S представим в виде функции атрибутов X, Y и R:

A(S) = f(A(X), A(Y), A(R)).

Рассмотрим некоторую одномерную грамматику. Пусть среди продукций из множества P имеется правило . В этом случае отношение R между символами есть простая конкатенация, тогда A(S) = f(A(X), A(Y)). Атрибутная строковая грамматика представляет собой обычную строковую грамма­тику с добавлением семантических правил для вычисления атрибутов.

Формально атрибутная строковая грамматика определя­ется как четверка G = (VN, VT, Р, S), где VNмножество нетерминалов; VT множество терминалов; S — начальный символ [45]. Для каждого символа существует конечное множество атрибутовА(X), и атрибут имеет конечный или бесконечный набор возможных значенийDxj. Каждая продукция из множества P состоит из двух частей: синтаксического правила и семантического правила, где синтаксическое правило в форме для КС-грамматик имеет вид: . Пусть, где — словарь языка, для всех i от 1 до k. Тогда семантическое (атрибутное) правило можно записать как отображение

,

или

.

Чтобы проиллюстрировать процесс установления семанти­ческих правил, рассмотрим следующий пример [45]. Пусть имеется некоторая дискретная кривая с уже выделенными примитивными элементами — последовательностью отрезков кривой. Предположим, что существует строковая КС-грамматика, описывающая данную конфигурацию. Определим для каждого отрезка кривой с вектор атрибутов А (с):

.

где —вектор прямолинейного отрезка, соединяющего начало и конец примитива; Lдлина примитива;  — угол изме­нения наклона кривой: Z —мера симметрии примитива с. В ка­честве атрибута отношения конкатенации между примитивами возьмем угол  между ними. Тогда отрезок линии N, состоя­щий из двух примитивов с1 и c2, сцепленных под углом , будет выражен так:

,

,

где обозначает вычисление атрибутов по соотношениям (см. рис. 3.11):

;

LN = L1 + L2;

N = 1 +  + 2;

.

Далее, если , то . Сущест­венное свойство операции — ее ассоциативность.

Важнейшим свойством атрибутных грамматик является то, что семантическая информация, дополняя синтаксическое описание, компенсирует его синтаксическую слабость, позволяя, например, для контекстно-зависимых грамматик без атрибутов строить эквивалентные контекстно-свободные или регулярные атрибутные грамматики. Это свойство достигается благодаря тому, что семантические правила помимо вычисления атрибутов, устанавливают ограничения на приме­нение следующего правила подстановки.

Использование одномерных атрибутных грамматик, а так­же атрибутных грамматик более высокой размерности (грам­матик деревьев, графов) [28, 45] делает возможным введение процедуры синтаксического анализа в качестве описывающей и распознающей процедуры. Методы разбора атрибут­ных грамматик усложнены по сравнению с простыми КС-грамматиками применением на каждом шаге подстановки семантических правил, поэтому для атрибутных грамматик могут использоваться модифицированные алгоритмы разбора КС-грамматик (например, алгоритм Эрли) [28, 43].

Синтаксический анализ (грамматический разбор) вход­ного предложения может выполнять две функции. Процедура распознавания выявляет факт корректности организации вход­ной строки в соответствии с правилами грамматики, порождающей «модельный» язык. Таким образом, может решаться как простейшая задача классификации, так и задача узнава­ния в рамках определенного класса форм. Широкое распро­странение получили методы грамматического разбора, коррек­тирующего ошибки, иными словами, применимые к изменен­ным входным данным (например, вследствие воздействия шу­мов, ошибок сегментации, неправильного распознавания при­митивов) [28, 43]. Продукт синтаксического анализа — дерево разбора — может использоваться для полного описания вход­ного изображения через его примитивные составляющие. Процесс грамматического разбора осуществляет, таким образом, синтез иерархической реляционной дескриптивной структуры. Особенно выпукло эта сторона процесса прояв­ляется при использовании атрибутных грамматик, так как описание, получаемое при построении дерева раэбора, прив­носит большую долю семантической информации об изображении [28, 43, 45].

Вообще говоря, процедура синтаксического анализа в за­дачах распознавания недостаточно определена и считается вычислительно трудоемкой. Эффективные процедуры разбора мо­гут быть получены для специальных классов языков либо вы­ведены эвристически. Наиболее известный алгоритм разбора для класса КС-языков—алгоритм Эрли [43 ].

Реляционные структуры. Альтернативным под­ходом к синтезу структурных описаний кривых является полный отказ от формализма, заимствованного из теории фор­мальных грамматик и языков. В рамках данного направления описание объекта строится с использованием реляционных структур, устанавливающих пространственные отношения между примитивами либо отношения типа часть— целое [37, 47].

В качестве структурной модели, отражающей пространственные отношения между частями объектов, используют графы (часто помеченные графы) и их табличные представле­ния. Характерный пример подобной структуры – RSE-граф (region-segment-endpoint graph) [15]. Наибольшей эффектив­ности применение аналогичных структур достигает для хорошо семантически определенных примитивов, поэтому при опи­сании границ объектов их используют реже, чем при описании областей. Обычно в качестве отношений для контурных при­митивов применяют отношения коллинеарности, «следует за», «слева (справа) от» и т. д.

Другим типом реляционных структур являются так называемые «деревья полосок» [32, 37]. Описание контура с использованием дерева полосок, с одной стороны, является аппроксимационным по отношению к описываемой кривой, а с другой — реализует на этой кривой отношение типа «часть — целое» и отношение следования, т. е. является иерархическим структурным описанием [32, 37]. Построение дерева полосок не требует предварительной процедуры выделения примити­вов, так как каждый узел дерева сам по себе представляет аппроксимацию некоторого отрезка контура, который описы­вается фрагментом полоски (рис. 3.12) [32, 37].

Точки cb и ce на рис. 3.12,а соответствуют начальной и конечной точкам аппроксимируемого отрезка контура. Ориентация прямоугольника — фрагмента полоски — определяется прямой, соединяющей начальную и конечную точки отрезков. Ширина полоски wминимальная ширина всех возможных прямоугольников, заданных длиной отрезка прямой [cb, ce] и содержащих целиком отрезок контура {cb, ce}.

Дерево полосок — бинарное дерево, таким образом, каж­дый узел дерева имеет двух «сыновей», соответствующих двум частям отрезка контура, представленного их «отцом». Каж­дый узел дерева полосок описывается восемью параметрами, из которых первые шесть служат для представления фрагмен­та полоски (это координаты начальной и конечной точек и две составляющие ширины wl и wr), а последние два указы­вают адреса «сыновей», если они существуют. Алгоритм, опи­сываемый ниже, дает способ построения дерева полосок для дискретной кривой DC= (c1, ..., cN} посредством рекурсивного обращения к процедуре формирования узла дерева.

Описание замкнутого контура с помощью дерева полосок производится аналогично, в соответствии с этим алгоритмом.

Соседние файлы в папке LECTURE12