Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Витебский государственный университет им. П. М. Машерова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

УМК по СПО.doc

Скачиваний:

Добавлен:

01.07.2025

Размер:

1.79 Mб

Скачать

☆

<<< < Предыдущая 13 14 15 16 17 18 19 20 21 22 23 2425 / 5525 26 27 28 29 30 31 32 33 34 35 36 37 > Следующая >>>

6.5.Удаление левой рекурсии

Основная трудность при использовании предсказывающего анализа - это нахождение такой грамматики для входного языка, по которой можно построить таблицу анализа с однозначно определенными входами. Иногда с помощью некоторых простых преобразований грамматику, не являющуюся LL(1), можно привести к эквивалентной LL(1)-грамматике. Среди этих преобразований наиболее эффективными являются левая факторизация и удаление левой рекурсии. Здесь необходимо сделать два замечания. Во-первых, не всякая грамматика после этих преобразований становится LL(1), и, во-вторых, после таких преобразований получающаяся грамматика может стать менее понимаемой.

Непосредственную левую рекурсию, т.е. рекурсию вида AA, можно удалить следующим способом. Сначала группируем A-правила:

AA₁ | A₂ | … | A_m | ₁ | ₂ | … | _n |

где никакая из строк _i не начинается с A. Затем заменяем этот набор правил на

A₁A’ | ₂A’ | … | _nA’

A’₁A’ | ₂ A’ | … | _m A’ | 

где A' - новый нетерминал. Из нетерминала A можно вывести те же цепочки, что и раньше, но теперь нет левой рекурсии. С помощью этой процедуры удаляются все непосредственные левые рекурсии, но не удаляется левая рекурсия, включающая два или более шага. Приведенный ниже алгоритм позволяет удалить все левые рекурсии из грамматики:

Вход. КС-грамматика G без -правил (правил вида A ).

Выход. КС-грамматика G' без левой рекурсии, эквивалентная G.

Метод. Выполнить шаги 1 и 2.

Упорядочить нетерминалы грамматики G в произвольном порядке.

Выполнить следующую процедуру:

for (i=1;i<=n;i++){

for (j=1;j<=i-1;j++){

пусть A_j ₁ | ₂ | ... | _k - все текущие правила для A_j;

заменить все правила вида A_i A_j

на правила A_i ₁ | ₂ | ... | _k;

}

удалить правила вида A_i A_i;

удалить непосредственную левую рекурсию в правилах для A_i;

}

После (i - 1)-й итерации внешнего цикла на шаге 2 для любого правила вида A_kA_s, где k < i, выполняется s > k. В результате на следующей итерации (по i) внутренний цикл (по j) последовательно увеличивает нижнюю границу по m в любом правиле A_iA_m, пока не будет m≥i. Затем, после удаления непосредственной левой рекурсии для A_i-правил, m становится больше i.

Получающаяся грамматика без левой рекурсии может иметь -правила.

6.6.Алгоритм разбора для ll(1)-грамматик

Для LL(l)- грамматик алгоритм работы распознавателя предельно прост. Он заключается всего в двух условиях, проверяемых на шаге выбора альтернативы. Исходными данными для этих условий являются символ aVT, обозреваемый считывающей головкой МП-автомата (текущий символ входной цепочки), и символ AVN, находящийся на верхушке стека автомата^².

Эти условия можно сформулировать так:

необходимо выбрать в качестве альтернативы правило Ах, если aFIRST(l,x);
необходимо выбрать в качестве альтернативы правило А, если aFOLLOW(l,A).

Если ни одно из этих условий не выполняется (нет соответствующих правил), то цепочка не принадлежит заданному языку и МП-автомат не принимает ее (алгоритм должен сигнализировать об ошибке).

Работа автомата на шаге «выброса» остается без изменений.

Кроме того, чтобы убедиться, является ли заданная грамматика G(VT,VN,P,S) LL(1)-грамматикой, необходимо и достаточно проверить следующее условие: для каждого символа AVN, для которого в грамматике существует более одного правила вида А₁||₂|...|_n, должно выполняться требование

FIRST(l, _i,FOLLOW(l,A))  FIRST(l, _jFOLLOW(l,A)) = 

 ij, n  i  0 n  j  0.

Очевидно, что если для символа AVN отсутствует правило вида А, то согласно этому требованию все множества FIRST(1,₁), FIRST(l, ₂), ..., FIRST(l, _n) должны попарно не пересекаться, если же присутствует правило А, то они не должны также пересекаться со множеством FOLLOW(l,A). Отсюда видно, что LL(1)-грамматика не может содержать для одного и того же нетерминального символа AVN двух правил, начинающихся с одного и того же терминального символа.

Условие, накладываемое на правила LL(1)-грамматики, является довольно жестким. Очень немногие реальные грамматики могут быть отнесены к классу LI.(l)-грамматик. Например, даже довольно простая грамматика G({a},{S}, {Sa|aS}, S) не удовлетворяет этому условию (хотя она является LL(2)-грамматикой и даже регулярной праволинейной грамматикой).

Иногда удастся преобразовать правила грамматики так, чтобы они удовлетворяли требованию LL(1)-грамматик. Например, приведенная выше грамматика может быть преобразована к виду G'({a},{S,A}, (SaA, A|S}, S)^³. В такой форме она уже является LL(1)-грамматикой (это можно проверить). Но формального метода преобразовать произвольную КС-грамматику к виду LL(1)-грамматики или убедиться в том, что такое преобразование невозможно, не существует. Первое преобразование правил грамматики, которое можно рекомендовать, — устранение левой рекурсии^⁴. Второе преобразование носит название «левая факторизация», оно уже было упомянуто выше при знакомстве с методом рекурсивного спуска. Это преобразование заключается в следующем: если для символа А VN существует ряд правил

Аа₁|а₂|...|а_n|₁|₂|…|_m , i: _i(VTVN)', j: _j (VTVN)', aVT

и ни одна цепочка символов _j не начинается с символа а, тогда во множество нетерминальных символов грамматики VN добавляется новый символ А', а правила для А и А' записываются следующим образом: АаА'|₁,|₂|...|_m и A'₁|₂|...|_n. Левую факторизацию можно применять к правилам грамматики несколько раз с целью исключить для каждого нетерминального символа правила, начинающиеся с одних и тех же терминальных символов. Однако применение этих двух преобразований отнюдь не гарантирует, что произвольную КС-грамматику удастся привести к виду LL(1)-грамматики.

Для того чтобы запрограммировать работу МП-автомата, выполняющего разбор входных цепочек символов языка, заданного LL(1)-грамматикой, надо научиться строить множества символов FIRST(l,x) и FOLLOW(1,A). Для множества FIRST(l,x) все очевидно, если цепочка х начинается с терминального символа, если же она начинается с нетерминального символа В (х = By, x (VTVN)*, y (VTVN)'), то FIRST(l.x) = FIRST(1,B). Следовательно, для LL(1)-грамматик остается только найти алгоритм построения множеств FIRST(1,B) и FOLLOW(l,A) для всех нетерминальных символов A,BVN.

Исходными данными для этих алгоритмов служат правила грамматики.

<<< < Предыдущая 13 14 15 16 17 18 19 20 21 22 23 2425 / 5525 26 27 28 29 30 31 32 33 34 35 36 37 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.03.20253.12 Mб9УМК Охраны труда (распознанное ) ВСЕ.doc
#
13.11.201944.87 Mб76УМК П и РЭ_2012.doc
#
01.05.202525.3 Mб4УМК П и РЭ_2013_2 мая_практика №1-5.docx
#
04.05.20192.46 Mб57УМК Плешкун для студентов.doc
#
10.11.201910.9 Mб108УМК по немецкому языку 4 курс , доп.спец..doc
#
01.07.20251.79 Mб5УМК по СПО.doc
#
01.07.20252.04 Mб2УМК Психология.doc
#
01.05.20252.1 Mб14УМК СПФ Ясюкевич.doc
#
01.05.202516.24 Mб12УМК Станочное оборудование.doc
#
01.05.2025549.38 Кб6УМК страноведение США.doc
#
01.04.20252.01 Mб11УМК ТАХД посл.doc