Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Теория языков программирования

Файл:

ВОСХОДЯЩИЕ МЕТОДЫ ОБРАБОТКИ ЯЗЫКОВ / LR_K_GR.DOC

Скачиваний:

Добавлен:

01.05.2014

Размер:

263.68 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 63 4 5 6 > Следующая >>>

4.2.2. Алгоритм разбора для lr(k)-грамматики

Для любой LR(k)-грамматики G = < T, N, S, R > можно построить детерминированный анализатор, который выдает правый разбор входной цепочки.

Анализатор состоит из магазина, входной ленты, выходной ленты и управляющего устройства (см. рис. 4.5).

Входная лента

Рис. 4.5

Магазин

Выходная лента

агазинный алфавитV_p представляет собой множество специальных символов, соответствующих грамматическим вхождениям или их множествам. Грамматическое вхождение – это символы полного словаря грамматики, снабженные двумя индексами. Первый индекс задает номер i правила грамматики, в правую часть которого входит данный символ, а второй индекс j – номер позициии символа в этой правой части

Например, для грамматики G₂ (рис. 4.3) грамматическое вхождение A_5,2представляет собой нетерминал А из второй позиции правой части пятого правила вывода. Если символ входит в правую часть i-го правила только один раз, то второй индекс будем опускать. Например. А₁– это грамматическое вхождение нетерминала А в первое правило, а А₅_– грамматическое вхождение нетерминала А в пятое правило. Перед началом работы алгоритма магазин пуст (содержит маркер дна).

Управляющее устройство анализатора представляет собой таблицу Ʈ, строки которой отмечены символами Т  Vp  {}. Одна строка такой таблицы называется LR(k)-таблицей. Каждая LR(k)-таблица задает две функции: функцию действия f и функцию переходов g.

Функция действия f, аргументом которой служит цепочка u  T^*, принимает значения из множества { ДОПУСК, ОШИБКА, ПЕРЕНОС, (СВЕРТКА, i) }.

Аргументом функции переходов g является символ Х  V, а ее значениями – элементы множества { ОШИБКА }  Vp.

Опишем LК(k)-алгоритм разбора.

Вход

Анализируемая цепочка z = t₁ t₂… t_j… t_n  T^*,где j – номер текущего символа входной цепочки, находящегося под читающей головкой.
Управляющая таблица Ʈ (множество LR(k)-таблиц) для LR(k)-грамматики

G = < T, N, S, R >.

Выход

Если z  L(G), то правый разбор цепочки z, в противном случае – сигнал об ошибке

Описание алгоритма

j :=0.
j := j + 1. Если j > n, то выдать сообщение об ошибке и перейти к п. 5.
Определить цепочку u следукщим образом:

а) если k = 0, то u = t_j ;

б) если k  1 и j+k-1 n, то u = t_j t_j+1 … t_j+k-1– первые k символов цепочки

t_j, t_j+1,…, t_n;

в) если k  1 и j+k-1 > n, то u = t_j t_j+1… t_n– остаток входной цепочки.

Применить функцию действия f из строки таблицы Ʈ, отмеченной верхним cимволом магазина T, к цепочке u.

а) f(u) =ПЕРЕНОС. Определить функцию переходов g(t_j) из строки таблицы Ʈ, отмеченной символом Т из верхушки магазина. Если g(t_j) = T’ и T’ V_p {}, то записать Т’ в магазин и перейти к п.2. Если g(t_j) = ОШИБКА, то выдать сигнал об ошибке и перейти к п. 5.

б) f(u) = (СВЕРТКА, i) и A   – правило вывода с номером i грамматики G. Удалить из верхней части магазина  символов, в результате чего в верхушке магазина окажется символ T’ V_p {}, и выдать номер правила i на выходную ленту. Определить символ T = g(A) из cтроки таблицы Ʈ, отмеченной символом T’, записать его в магазин и перейти к п. 3.

в) f(u) = ОШИБКА.Выдать сообщение об ошибке и перейти к п. 5.

г) f(u) = ДОПУСК. Объявить цепочку, записанную на выходной ленте, правым разбором входной цепочки z.

5) Останов.

Рассмотрим работу LR(k) -анализатора на примере.

Пример 4.1.

На рис. 4.6 изображена управляющая таблица для LR(0)-грамматики G₂_, правила вывода которой приведены на рис. 4.3.

Буквы С, П и Д в этой таблице (и во всех следующих таблицах) служат условными обозначениями значений функции f(u): ПЕРЕНОС, СВЕРТКА и ДОПУСК соответственно, а пустые элементы таблицы имеют значение ОШИБКА.

Заметим, что в данном примере магазинный алфавит Vp представляет собой множество грамматических вхождений символов грамматики в правила вывода. Первая строка управляющей таблицы отмечена грамматическим вхождением So начального символа грамматики S в правую часть нулевого правила вывода S’ S пополненной грамматики G₂’, полученной из исходной грамматики G₂.

T	f(u)				g(X)
T	a	b	c		a	b	c	S	A	B
S₀				Д
a₁	П	П	П		a₅	b₃	c₆		A₁	B₄
A₁	П	П	П			b₁
b₁	С,1	С,1	С,1	С,1
c₂	С,2	С,2	С,2	С,2
b₃	П	П	П		a₁		c₂	S₃
S₃	С,3	С,3	С,3	С,3
B₄	П	П	П			b₄
b₄	С,4	С,4	С,4	С,4
a₅	П	П	П		a₅	b₃	c₆		A₅	B₄
A₅	С,5	С,5	С,5	С,5
c₆	С,6	С,6	С,6	С,6
	П	П	П		a₁		c₂	S₀

Рис. 4.6

Работу алгоритма опишем в терминах конфигураций, представляющих собой тройки вида (T, ax, ), где T – цепочка магазинных символов (Т - верхний символ магазина), ax – необработанная часть входной цепочки, начинающаяся символом a (для k = 0 длина цепочки u равна 1),  – выход, построенный к настоящему моменту времени.

Рассмотрим последовательность тактов, которую выполнит LR(k)-алгоритм при

анализе входной цепочки abcb.

Начальная конфигурация алгоритма – (, abcb, ) (в вершине магазина находится маркер дна магазина, а текущим входным символом является символ а). Для строки управляющей таблицы, отмеченной символом , f(A) = ПЕРЕНОС, а g(A)=a₁_, поэтому в магазин записывается символ a₁ (грамматическое вхождение символа a в правую часть первого правила), входная головка сдвигается на один символ вправо, а алгоритм переходит в конфигурацию (a₁, bcb, ). Для строки таблицы, отмеченной символом a₁, f(b) = ПЕРЕНОС, а g(b) = b₃, следовательно, алгоритм перейдет в конфигурацию (a₁b₃, cb, ). Аналогично для магазинного символа b₃и текущего символа входной цепочки с магазин перейдет в конфигурацию (a₁b₃c₂, b, ).

Рассмотрим теперь строку управляющей таблицы Ʈ, помеченную грамматическим вхождением с₂. В этом случае f(b) = (С. 2), значит, необходимо выполнить свертку с использованием правила (2) S  c. Правая часть этого правила содержит только один символ, поэтому удаляем из магазина символ с₂и определяем значение функции переходов для символа S из левой части правила (2) в отроке управляющей таблицы Ʈ, отмеченной символом b₃, который стал верхним символом магазина. Теперь g(S)=S₃и, следовательно, алгоритм перейдет в конфигурацию

(a₁b₃ S₃, b, 2), и в выходную цепочку запишется 2 (номер использованного правила).

Поступая дальше подобным образом, получим следующую последовательность тактов работы анализатора (символ ÷ используется для перехода из одной конфигурации в другую):

(a₁b₃ S₃, b, 2) ÷ (a₁A₁, b, 23) ÷ (a₁A₁b₁, , 23) ÷ (S₀, , 231),

где конфигурация (S₀, , 231) является заключительной, а цепочка 231 – правым разбором цепочки abcb.

Приведем последовательность тактов, которую выполнит алгоритм при анализе входной цепочки aabc, содержащей синтаксическую ошибку.

(, aabc, ) ÷ (, aabc, ) ÷ (a₁, abc, ) ÷ (a₁a₅, bc, ) ÷ (a₁a₅b₃, c, ) ÷

(a₁a₅b₃c₂, , ) ÷ (a₁a₅b₃S₃, , 2) ÷ (a₁a₅A₅, , 23) ÷ (a₁B₄, , 235)

В последней конфигурации f() = ОШИБКА. Алгоритм выдает сообщение об ошибке и заканчивает работу.

Продемонстрировав работу LR(k)-анализатора для конкретных входных цепочек, рассмотрим построение управляющей таблицы Ʈ LR(k)-анализатора для k=0 и некоторого подмножества LR(1)-грамматик (алгоритм проверки принадлежности грамматики классу LR(k)-грамматик для произвольного k предполагает построение большого числа вспомогательных множеств, поэтому его использование для k>1 для решения практических задач не оправдано).

<<< < Предыдущая 1 23 / 63 4 5 6 > Следующая >>>

Соседние файлы в папке ВОСХОДЯЩИЕ МЕТОДЫ ОБРАБОТКИ ЯЗЫКОВ

#
01.05.2014263.68 Кб52LR_K_GR.DOC
#
01.05.2014222 б8Методы _восходящие методы обработки языков_ .log