Нисходящий разбор с возвратами.

Алгоритм нисходящего разбора строит синтаксическое дерево, начиная с корня. Описание усложняется главным образом из-за вспомогательных операций, которые необходимы для того, чтобы возвраты с твёрдой уверенностью, что все возможные попытки построения дерева были предприняты. Опишем алгоритм образно.

Представим, что на любом этапе разбора, в каждом узле уже построенной части дерева, находится по одному человеку. Люди, находящиеся в терминальных узлах, запоминают места, соответствующие символам предложений. Некому человеку предстоит провести разбор предложения Х. Следовательно ему необходимо отыскать вывод Z=>+x, z - начальный символ. Первым непосредственным выводом должен быть z=>y где z::=Y – правило. Пусть для z существуют правила z::=X₁X₂…X_n|Y₁Y₂…Y_m|Z₁Z₂…Z_l.

Сначала человек пытается применить правило z::=X₁X₂…X_n. Если нельзя построить дерево, используя это правило он делает попытку применить второе правило z::= Y₁Y₂…Y_m. В случае неудачи он переходит к следующему правилу и т.д. Как ему определить правильно ли он выбрал непосредственный вывод Z::=X₁X₂…X_n? Если вывод правилен, то для некоторых цепочек x_i будет иметь место х::=X₁X₂…X_n, где X_i=>*x_i i= . Прежде всего человек, выполняющий разбор, возьмёт себе «приёмного сына» М₁, который должен найти вывод Х₁=>^*x₁ x₁такого, что х=х₁… Если сыну М₁ удаётся найти такой вывод, он ( и любой из его сыновей, внуков и .т.д.) закрывает цепочку х₁ в предложении х и собирает своему от об успехе. Тогда его отец усыновляет M₂, чтобы там нашёл вывод X₂=>^*x₂, где х=х₁х₂… и ждёт ответа от него и т.д. Сообщение об успехе пришедшее от сына M_n, означает, что разбор предложения закончен.

Как быть, если сыну М_i не удаётся найти вывод X_i=>^*x_i ? В этом случае M_i сообщает об неудачи своему отцу, тот от него отрекается и даёт старшему брату M_i M_i-1 такое распоряжение: «Ты уже нашёл вывод, но этот вывод неверен. Найди другой». Если M_i-1 сумеет найти другой вывод, он вновь сообщает об успехе, и всё продолжается по прежнему. Если M_i-1 сообщает об неудаче, отец отречётся и от него, и тогда его уже старшего брата M_i-2, попросят предпринять ещё одну попытку. Если придётся отречься даже от М₁, значит непосредственный вывод z X₁X₂…X_n был неверен и человек, начинавший разбор, попытается воспользоваться другим выводом z::= Y₁Y₂…Y_m.

Как же действует каждый M_i? Пусть его целью является терминал Х_i входная цепочка имеет вид x=x₁x₂…x_iТ…, где символы х₁х₂…х_i-1 уже закрыты другими людьми. M_i проверяет, совпадает ли очередной незакрытый символ Т с его целью Х_i. Если это так, он закрывает этот символ и сообщает об успехе; если нет – сообщает о неудаче.

Если цель M_i – нетерминал Х_i, то M_i поступает точно также, как его отце. Он начинает проверять правые части правил, относящихся к нетерминалу, и, если необходимо, тоже усыновляет или отрекается от сыновей. Если все его сыновья сообщают об успехе, то M_i в свою очередь сообщает об успехе своему отцу. Если отец просит M_i найти другой вывод, а целью является терминальный символ, то M_i сообщает о неудаче, т.к. другого вывода не существует. В противном случае M_iпросит младшего сына найти другой вывод и реагирует на его ответ также как и раньше. Если все сыновья сообщают о неудаче, он сообщает о неудаче своему отцу.

Частичный нисходящий разбор предложения i+i*i.

Привлекательность этого метода в том и стоит, что каждый человек должен помнить лишь о своей цели, о своём отце, о своих сыновьях, а также о своём месте в грамматике и во входной цепочке.

И никому не нужны точные сведения о том, что происходит в других местах.

Для имитации усыновления и отречения от сыновей в программе используется стек LIFO. Пусть для реализации стека используется массив S и счётчик V. При V=0 стек пуст. При V=n, n>0 в стеке находится S[1]S[2]…S[n]. Предположим, что грамматика задана списком в одномерном массиве GRAMMAR таким образом, что каждое множество правил U::=x|y…|z представлено как Ux|y|…z|$, т.е. каждый символ занимает одну ячейку, за каждой правой частью U следует |, а за последней правой частью следует |$.

Таким образом грамматика:

Z::=E#

E::=T+E|T

T::=F*T|F

F::=(E)|i

Будет выглядеть ZE#|$ET+E|T|$TF*T|F|$F(E)|i|$.

Каждый элемент стека соответствует одному человеку и состоит из 5 компонент (GOAL,i,FAT,SON,BRO), которые означают следующие:

GOAL – цель, т.е. символ, который человек ищет таким образом в незакрытой в данный момент части предположения ему предстоит найти такую голову, которая приводит к GOAL и закрыть её GOAL передаётся ему отцом.
i- индекс в массиве GRAMMAR, указывающий на тот символ в правой части правила для GOAL, с которым человек работает в данный момент.
FAT - имя отца(номер элемента стека, соответствующего отцу).
SON – имя самого последнего(младшего) из сыновей.
BRO – имя его старшего брата.

Нуль в любом из нолей означает, что данная величина отсутствует. В программе значение переменной V равно количеству участвующих в разборе людей.

С – имя(номер элемента в стеке) человека, работающего в данный момент. Остальные ожидают конца его работы. Индекс j относится к самому левому (незакрытому) символу входной цепочки. Если в программе встречаются обозначения GOAL, i, FAT, SON, BRО и нет других спецификаций, то считается, что они ссылаются на компоненты, относящиеся к тому человеку, который в данный момент работает, т.е. (C) -> S[с]. GOAL.

Можно хранить имена всех своих сыновей в собственном стеке, но в таком случае число полей элемента станет переменным. Но можно использовать поле SON для хранения ссылки на последнего (младшего) сына. Тогда поле BRО элемента соответствующего этому сыну, укажет на его старшего брата и т.д.

В качестве иллюстрации рассмотрим синтаксическое дерево для предложения i+i*i нашей грамматики.

стек	цель	i	FAT	SON	BRD
1	Z	4	0	15	0
2	E	10	1	7	0
3	T	20	2	4	0
4	F	28	3	5	0
5	i	0	4	0	0
6	+	0	2	0	3
7	E	12	2	8	6
8	T	18	7	12	0
9	F	28	8	10	0
10	i	0	9	0	0
11	*	0	8	0	9
12	T	20	8	13	11
13	F	28	12	14	0
14	i	0	13	0	0
15	#	0	1	0	2

Теперь у человека 2 – S[2] есть цель Е; предполагается, что он в соответствии с синтаксическим деревом использует правило Е::=Т+Е. ему для того, чтобы найти символы Т, +, и Е потребуется три сына. Значение поля S[2]. SON = 7, так что его младшим сыном является человек с номером 7, цель которого Е. Имя среднего сына – G, определяется значение поля S[7]. BRO, цель этого сына – символ ʺ+ʺ. Имя старшего сына находится в поле BRO человека и элементы этого списка в стеке связаны между собой стек в его окончательном виде – внутренняя форма синтаксическая дерева.

Рассмотрим алгоритм нисходящего разбора. Он разбит на 6 частей, для того, чтобы выделить разные функции.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2021 / 2421 22 23 24 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.11.201890.11 Кб7Lectiya_03(nizhnii pal-t).doc
#
01.05.2015309.61 Кб9lecture1.pdf
#
01.04.2025448.5 Кб3LEKhA.docx
#
01.05.202560.93 Кб2LEKSIChESKIJ_MINIMUM_I_kurs (1).doc
#
01.07.20254.83 Mб2lektsii_po_upravleniyu_proektami.docx
#
01.03.2025342.66 Кб1Lektsii_YaPiMT_ispravlennoe (2).docx
#
01.03.2025272.13 Кб5Lektsii_YaPiMT_ispravlennoe.docx
#
01.05.2015281 Кб11LEKTsIYa_Prezentatsii_PowerPoint_2007_doc.docx
#
01.07.202538.58 Mб8Lekts_Materialdisk3.doc
#
01.07.202584.87 Кб3Lexichesky_minimum_s_rasshifrovkoy.docx
#
01.05.20152.63 Mб1107Lexikologia_TIDOT.doc