Скачиваний:
71
Добавлен:
01.05.2014
Размер:
427.52 Кб
Скачать

8.5.2. Распознавание образов, представленных графами

Хотя предыдущий пример, несомненно, иллюстрирует основ­ные положения синтаксического подхода, мы признаем, что он s значительной мере идеализирован, особенно если учесть, что грамматика позволяет реализовать только одну последователь­ность грамматических правил. При рассмотрении этого при­мера возникает, однако, один важный вопрос. Должно быть

Рис. 8.5. Обобщенное представление структур образа с помощью ориентиро­ванных отрезков прямых, связанное с использованием языка PDL.

ясно, что поиск непроизводных элементов или подструктур, представляющих интерес с точки зрения анализа двумерные объектов, может оказаться для вычислительной машины почти неразрешимой задачей. И хотя этот вопрос обсуждался в пре­дыдущем разделе, стоит упомянуть о нем еще раз, поскольку он является одним из основных препятствий на пути создания истинно универсальной системы синтаксического распознавание образов. К настоящему времени наиболее успешные исследова­ния в данной области связаны с объектами, сводимыми к струк­турам типа графов. В данном разделе мы обсуждаем некоторый из этих подходов с целью иллюстрации основных понятий, вво­димых при синтаксическом распознавании объектов, представ­ленных графами.

Интересным приложением лингвистических понятий в распо­знавании образов является язык PDL (Picture Description Lan­guage)— язык описания изображений, предложенный Шоу (1970). Непроизводным элементом в PDL служит любая n-мер­ная структура с двумя выделенными точками —хвостовой и головной, как это показано на рис. 8.5 для двумерных структур. Заметим, что практически любая структура может обобщенно рассматриваться как ориентированный отрезок прямой, так как определение вводит только две точки,

Рис. 8.6. Правила соединения, ис­пользуемые в языке PDL.

Непроизводный элемент может примыкать к другим непро­изводным элементам только в своей хвостовой и/или головной точке- На основании этой допу­стимой формы соединения, а так­же вследствие того, что каждый непроизводный элемент обоб­щается до ориентированного от­резка прямой, очевидно, что струк­туры языка PDL представляют собой ориентированные графы и для обработки этих структур можно использовать грамматики цепочек.

Основные правила соединения обобщенных непроизводных эле­ментов приведены на рис. 8.6. Важно отметить, что пустые не­производные элементы могут быть использованы для порождения внешне разъединенных структур, подчиняющихся при этом прави­лам связности. Иногда полезно также рассмотрение нулевой точ­ки непроизводного элемента с идентичными головной и хвосто­вой точками.

Принципы действия языка PDL лучше всего проиллюстри­ровать на примере. Рассмотрим следующую простую грамматику языка PDL:

причем (~ d) означает перемену мест головной и хвостовой точек непроизводного элемента d.

Применение первого правила подстановки приводит к полу­чению непроизводного элемента d, сопровождаемого еще не определенной переменной. На этом этапе мы знаем только, что хвостовая точка структуры, представленной символом А1, будет

Рис- 8,7, Шаги построения структуры в языке PDL. Обратите внимание на головные и хвостовые точки составных подструктур.

связана с головной точкой элемента d, потому что этот непро­изводный элемент сопровождается оператором «+». Перемен­ная А1 разлагается на с+ А2, причем А2пока не определена. Аналогичным образом А2 разлагается на ~d* А3. Результаты применения первых трех правил подстановки приведены на рис. 8.7, а, б и в. Из определения оператора «*» мы знаем, что при разложении элемента Аз происходит его соединение с со­ставной структурой, показанной на рис. 8.7,в путем присоеди­нения хвостовых точек к хвостовым, а головных к головным. Конечный результат, полученный после применения всех пра­вил подстановки, показан на рис- 8.7, е.

Грамматика языка PDL, описанная выше, способна порож­дать только одну структуру. Можно, однако, расширить число структур, порождаемых этой грамматикой, введением в правила подстановки рекурсивности — способности переменной заме­щаться этой же переменной. Предположим, например, что мы определяем правила подстановки следующим образом;

Результатом применения этих правил в указанном порядке является структура, изображенная на рис. 8.7, е. Между тем это новое множество правил допускает, например, возможность за первым правилом подстановки применять третье, опуская вто­рое. Применяя в указанном порядке оставшиеся правила под­становки, мы получили бы треугольную структуру. Более того. эти правила позволяют порождать бесконечные структуры по­средством многократного замещения переменной этой же пере­менной. Многообразие структур, порождаемых приведенной выше грамматикой, может быть еще более расширено, если положить, что А1 и A2 равны S, При этом возможности грамма­тики возрастут до максимума. Нужно отметить, однако, что подобное увеличение порождающей способности грамматики может иногда оказаться нежелательным. Особенно верно это замечание для тех прикладных исследований в области синтак­сического распознавания образов, где требуется более чем одна грамматика. В этом случае чрезмерное многообразие приводит к уменьшению различающей мощности применяемых грам­матик.

Грамматический разбор структур при помощи предложен­ной грамматики в принципе несложен. Предположим, напри­мер, что объектом, представленным на распознавание, служит изображение на рис. 8.7, е, причем используется второе множе­ство правил подстановки. Грамматический разбор сверху вниз будет происходить в следующей последовательности. Предполо­жим, что интересующий нас объект сканируется с целью полу­чения соответствующего терминального представления (d+(c+(~d)))*(a + b)*с). Как отмечалось ранее, процесс сканирования, вообще говоря, не является тривиальной проце­дурой. Грамматический анализатор, работающий по принципу «сверху вниз», начинает с корневого символа S и пытается по­лучить интересующий нас объект, применяя правила подста­новки данной грамматики. В настоящем случае S заменяется на d+ А1. Терминальный символ d, сопровождаемый знаком «+», обнаружен, поэтому происходит грамматический разбор эле­мента А1. Здесь имеются две возможности, поскольку А1 может заменяться при помощи как второго, так и третьего правила, Применение второго правила приводит к успеху, так как первый «+» образа сопровождается символом с. Третье правило этому условию не соответствует. Для того чтобы разложить элемент А1 , следующий за «+» после символа с. необходимо найти правило подстановки вида А1 —> ~d, сопровождающееся «*». Этому условию отвечает третье правило. Продолжая эту процедуру, устанавливаем, что данный образ поддается грам­матическому разбору. При наличии двух или более грамматик анализ производится для каждой из них до тех пор, пока образ не идентифицируется либо пока не исчерпаются возможности грамматики; в последнем случае образ отклоняется.

Другим интересным приложением синтаксического распозна­вания образов является работа Ледли [1964, 1965] по автомати­ческой классификации хромосом. Бесконтекстная грамматика, способная классифицировать V-образные и телоцентрические хромосомы, задается следующим образом-

357

На рис, 8-8,а изображены непроизводные элементы {а,Ь,с, d,e}, на рис. 8.8,6—типичный вид V-образной и телоцентрической хромосом. Для данного конкретного случая оператор «.» означает просто связность отдельных частей хромосомы, фик­сируемую при продвижении вдоль ее границы по направлению

Рис- 8.8, а—непроизводные элементы грамматики, предназначенной для опи­сания изображений хромосом, б—телоцентрическая и V-образная хромосомы и соответствующие им терминальные цепочки. Иллюстрация заимствована из статьи Ледли < Высоко с корост ной автоматический анализ биомедицинсккх изображений», Science, 146, No. 3641, 1964 (R. S, Ledley, High-Speed Automa­tic Analysis of Biomedical Pictures),

часовой стрелки. Начальные символы S и Т представляют V-образную и телоцентрическую хромосомы соответственно. Инте­ресно отметить, что для разделения объектов на два класса в данном случае используется одна грамматика с двумя на­чальными символами. Если, например, грамматический разбор снизу вверх приводит к Т. хромосому относят в класс телоцентрических. Если грамматический разбор приводит к S, хро­мосома классифицируется как V-образная. Должно быть оче­видно, что применение одной грамматики для распознавания— в сущности, не что иное. как объединение двух классифика­ционных грамматик с различными начальными символами. И хотя это можно сделать всегда, имеет смысл объединять только достаточно похожие грамматики, поскольку объединение значительно отличающихся грамматик ничего не дает.

Проиллюстрируем грамматический разбор снизу вверх, не­сколько подробнее рассмотрев использование этой схемы в со­четании с приведенной выше грамматикой классификации хро­мосом. В качестве первого шага процесса распознавания за­данного цифрового изображения хромосомы необходимо найти

Рис, 8.9. Восходящий грамматический разбор представляющей хромосому цепочки abcbabdbabcbabdb.

точку на границе хромосомы и затем осуществлять продвиже­ние вдоль границы по направлению часовой стрелки. По мере продвижения система процедур распознавания обеспечит обна­ружение непроизводных элементов {a,b,c,d,e}. В результате такого отслеживания границы хромосома оказывается эффек­тивно сведенной к цепочке непроизводных элементов и образует терминальное предложение, как показано на рис. 8.8,6.

После сведения хромосомы к терминальному предложению начинается процесс синтаксического распознавания. Рассмот­рим, например, предложение, полученное для V-образной хро­мосомы. показанной на рис. 8.8,6. Грамматический анализатор, работающий по принципу снизу вверх, начинает с применения грамматических правил в обратном порядке. Проследим об­ратный порядок применения правил подстановки, начиная с правила Плечо—>а. Так, если анализатор находит а, он вы­дает нетерминал Плечо. Как показано на рис. 8.9, символ а обнаруживается четыре раза, что приводит к появлению четы­рех нетерминалов Плечо на первом уровне поиска, считая снизу. Следующее правило подстановки сочетает нетерминал Плечо с терминалом Ь. Как следует из рассмотрения дерева на рис. 8.9, на следующем уровне порождаются только Плечи. Количество проб в грамматическом разборе можно сократить, следуя определенной заранее упорядоченной последовательно­сти. «Наилучший» порядок устанавливается экспериментально. Следующие правила подстановки порождают нетерминал Сто­рона. Из трех порожденных Сторон два нетерминала порож­даются при помощи символов d и один при помощи единствен­ного оставшегося неиспользованным символа Ь. На следующих двух уровнях комбинация Плеча и символа с порождает Пра­вую часть, и комбинация Правой части с Плечом порождает Пару плеч. Наконец, комбинация символов Пара плеч и Сторона порождает два символа Пара плеч, которые затем, объ­единяясь, порождают символ S, завершая, таким образом, грамматический разбор снизу вверх. Следовательно, хромосома была правильно классифицирована как V-образная.

Необходимо отметить, что в зависимости от способа обхода границы хромосомы, получающиеся в результате цепочки сим­волов, не всегда бывают правильно упорядочены с точки зрения разбора. Эту трудность тем не менее легко преодолеть, заме­тив, что начало и конец цепочки в действительности примы­кают друг к другу, так как, в конце концов, цепочка образована в результате полного обхода вдоль границы хромосомы. Если бы, например, на рис. 8.8, б была приведена цепочка bcbabdbabcbabdba, то для образования символа Плечо первый терминальный символ b был бы объединен с последним симво­лом а.

Приведенный грамматический разбор привел к искомому результату при первой реализации. Конечно, далеко не всегда получается так, поскольку обычно бывают необходимы частые возвраты. Их число, однако, можно минимизировать упорядо­чением. упоминавшимся ранее, а также с помощью введения в процесс поиска эвристических правил, указывающих грамма­тическому анализатору способ действия в ситуациях, когда воз­можны несколько вариантов продолжения.

Соседние файлы в папке lecture7