Скачиваний:
71
Добавлен:
01.05.2014
Размер:
427.52 Кб
Скачать

8.5. Грамматики, используемые в распознавании образов

В этом параграфе рассматривается распознавание образов при помощи синтаксического подхода. В п. 8.5.1 обсуждается спо­соб определения потенциальной возможности порождения неко­торого образа определенной грамматикой. Пункт 8,5.2 посвя­щен распознаванию двумерных объектов, которые могут сво­диться к эквивалентному представлению в виде цепочки. Это упрощение играет важную роль в создании синтаксических систем распознавания, так как позволяет использовать стан­дартные понятия из теории грамматик цепочек. Наконец, в п. 8.5,3 мы рассматриваем распознавание образов, допускаю­щих представление древовидной структурой. Эти структуры не­посредственно связаны с грамматиками деревьев, являющимися расширением результатов, о которых до сих пор шла речь в данной главе.

8,5.1. Синтаксически ориентированное распознавание

В § 8.3 было отмечено, что формальные грамматики можно использовать в распознавании образов, определяя, является ли данных объект терминальным предложением какой-либо из со­ответствующих рассматриваемой задаче грамматик. Основным вопросом, после того как определены грамматики, является раз­работка процедуры, устанавливающей, является или нет данный объект допустимым предложением. Процедура, применяемая для этого в теории формальных языков, называется граммати­ческим разбором. Мы рассматриваем в основном два типа грам­матического разбора: сверху вниз и снизу вверх. Эти названия становятся более осмысленными, если обратиться к семантиче­скому дереву, такому, например, как представленное на рис. 8-1. Вершина или корень (инвертированного) дерева—это началь­ный символ 5. Терминальные предложения (образы) пред­ставляют нижнюю часть или листья дерева. Процедура разбора сверху вниз начинается с корневого символа 5 и заключается в попытках посредством повторяющегося применения граммати­ческих правил получить заданное терминальное предложение. С другой стороны, процедура разбора снизу вверх начинается с конкретного предложения и заключается в попытках дойти до символа S с помощью инверсии правил подстановки. В каждом из этих случаев при неудачном исходе грамматического разбора

349

заданный образ отклоняется как представляющий неправиль­ное предложение. Совершенно очевидно, что описанные выше схемы граммати­ческого разбора принципиально неэффективны, так как тре­буют полного перебора при применении грамматических правил. Зачастую нет необходимости применять последовательность грамматических правил от начала до конца, поскольку суще­ствует возможность проверять на соответствие поставленным целям промежуточные результаты и определять тем самым, спо­собна ли данная последовательность правил обеспечивать успешный грамматический разбор.

Дальнейшее усовершенствование процесса грамматического разбора связано с применением правил синтаксиса грамматики. Синтаксис определяется как соединение и конкатенация объек­тов, Синтаксическое правило устанавливает некоторые допусти­мые (или запрещенные) отношения между объектами. Напри­мер, соединение qqq никогда не встречается в английском языке. В этой терминологии грамматика является не более чем множе­ством синтаксических правил, определяющих допустимые или желательные отношения между объектами. Синтаксически ори­ентированный грамматический анализатор, таким образом, включает в процесс грамматического разбора синтаксис грам­матики, Следующий пример позволит нам внести большую ясность в эти понятия.

Пример. Вернемся к структурам типа квадрат, использован­ным для иллюстрации содержания предыдущего параграфа. Непроизводными элементами, как показано на рис, 8.4, о, слу­жат горизонтальный и вертикальный отрезки определенной длины, обозначенные a1 и a2 соответственно. Бесконтекстная грамматика G, способная порождать квадраты, задается набо­ром G = (VN, VT, Р, S) при

где А{х,у) и L(x,y) читаются соответственно «.х расположен над у» и «х расположен слева от у». Важно еще paз указать, что для того, чтобы обрабатывать изображения, мы должны уметь обобщать грамматические правила так, чтобы они могли при­меняться к двумерным соединениям. В этом простом примере мы считаем позиционный дескриптор А{х,у} допустимым только в том случае, если часть y находится непосредственно над х, а дескриптор L(x,y} допустим только тогда, когда часть у на­ходится непосредственно справа от х.

Структуры, напоминающие квадраты, изображенные на рис. 8.4, б, порождаются последовательностью грамматических правил

это правило заменяет начальный символ нопроизводным эле­ментом a1, расположенным над некоторым пока еще не опреде­ленным объектом O2. Правило

заменяет не определенный объект О2 другим объектом O1, еще не определенным, расположенным над горизонтальным отрез-

Рис, 8.4. Образы, использованные для иллюсграции синтаксически-ориентиро­ванного грамматического разбора, a — непроизводные элементы образов;

б—образы, поддающиеся разбору с помощью описанной схемы; в —образы, не поддающиеся разбору с помощью описанной схемы.

ком a1. Наконец, O1 заменяется на два вертикальных непроиз­водных элемента посредством применения правила

зок под ним и завершается все помещением между ними двух вертикальных отрезков. Изменчивостью структур можно управ­лять, налагая ограничения на позиционные дескрипторы А (х, у) и L(x,y. Стоит также отметить, что приведенная выше грам­матика способна порождать лишь структуры типа квадратов и что только приведенная выше последовательность правил счи­тается допустимой,

Грамматический разбор, проведенный в этой простой си­стеме, представляет собой тривиальную процедуру, поскольку используется только одна последовательность правил подста­новки. Предположим, например, что требуется установить, при­надлежит или не принадлежит данная структура к классу объ­ектов, порождаемых описанной выше грамматикой. Синтакси­чески ориентированный разбор сверху вниз будет произво­диться следующим образом. Первое правило подстановки начи­нается с S и предполагает поиск некоторого объекта О2 ниже непроизводного элемента a1. Если ниже некоторого a1 не най­дено ни одного объекта, грамматический разбор прерывается и образ отклоняется. Если же это правило применено успешно, на следующем шаге отыскивается некоторый объект О1; над дру­гим непроизводным элементом a1. Первый элемент a1 не счи­тается частью О1. Если O1 обнаружен, грамматический разбор продолжается, в противном случае образ отклоняется. Наконец, объект O1. обнаруженный на предыдущем шаге, должен для принятия образа разделиться на два непроизводных элемента a2 по условию L{a2, a2}. Этой схеме грамматического разбора удовлетворяют структуры, изображенные на рис. 8.4, б, и не удовлетворяют структуры, изображенные на рис, 8.4,в.

Синтаксически ориентированный грамматический разбор снизу вверх, заключающийся в применении правил подстановки в обратном порядке, происходит следующим образом. Сначала мы пытаемся обнаружить объект O1, определяя, содержит ли данный объект непроизводный элемент a2 слева от непроизводного элемента a2. Если поиск оказался удачным, процедура продолжается: в противном случае образ отклоняется. Заметим, что, поскольку процедура разбора снизу вверх начинается с терминального предложения, сначала должны рассматриваться те правила подстановки, применение которых приводит исклю­чительно к терминальным символам. Для продолжения грам­матического разбора необходимо на следующем шаге получить объект О2, который состоит из объекта O1, расположенного над непроизводным элементом a1. Если этот шаг оказался успеш­ным, мы пытаемся вывести начальный символ S, отыскивая непроизводный элемент a1, расположенный над О2. Если S может быть выведен, то образ принимается, в противном случае на этом шаге он отклоняется. Объекты, изображенные на

рис 8,4,6, поддаются грамматическому разбору, тогда как объекты, изображенные на рис. 8.4, в, будут отклонены на од­ном из этапов грамматического разбора, I

Соседние файлы в папке lecture7