Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Витебский государственный университет им. П. М. Машерова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

УМК по СПО.doc

Скачиваний:

Добавлен:

01.07.2025

Размер:

1.79 Mб

Скачать

☆

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 2324 / 5524 25 26 27 28 29 30 31 32 33 34 35 36 > Следующая >>>

6.3.Принципы построения распознавателей для ll(k)-грамматик

Для построения распознавателей LL(к)-грамматик используются два важных множества, определяемые следующим образом:

FIRST(k,) — множество терминальных цепочек, выводимых из (VTVN)*, укороченных до k символов;

FOLLOW(k.A) — множество укороченных до k символов терминальных цепочек, которые могут следовать непосредственно за АVN в цепочках вывода.

Формально эти два множества могут быть определены следующим образом:

FIRST(k,) - { VT* | либо ||_k и =>*, либо ||>k и =>*х, x (VTVN)'},  (VTVN)'. k>0.

FOLLOW(k,A) - (VT* | S=>*A и FIRST(,k), VT*), AVN, k>0.

Очевидно, что если имеется цепочка терминальных символов VT*, то FIRST(k, ) — это первые k символов цепочки .

Доказано, что грамматика G(VT,VN,P,S) является LL(k )-грамматикой тогда и только тогда, когда выполняется следующее условие:  А  Р и  Аg  Р (): FIRST(k, )  FIRST(k, ) -  для всех цепочек и таких, что S =>* A.

Иначе говоря, если существуют две цепочки вывода:

S =>* A => z =>* 

S =>* A => t =>* 

то из условия FIRST(k, ) - FIRST(k, ) следует, что z = t.

На основе этих двух множеств строится алгоритм работы распознавателя для LL(к)-грамматик, который представляет собой k-предсказывающий алгоритм для МП-автомата, заданного так: R({q},VT,Z,,q,S,{q}), где Z = VTVN, а S - целевой символ грамматики G. Функция переходов автомата строится на основе управляющей таблицы М, которая отображает множество (Z{.}) x VT^*^k на множество, состоящее из следующих элементов:

пар вида (,i), где  — цепочка символов, помещаемая автоматом на верхушку стека, а i — номер правила вида А, AVN, Z^*;

«выброс»;

«допуск»;

«ошибка».

Конфигурацию распознавателя можно отобразить в виде конфигурации МП-автомата с дополнением цепочки, в которую помещаются номера примененных правил. Поскольку автомат имеет только одно состояние, его в конфигурации можно не указывать. Если считать, что X — это символ на верхушке стека автомата,  — непрочитанная автоматом часть входной цепочки символов, а = FIRST(k, ), то работу алгоритма распознавателя можно представить следующим образом:

(, X, ) +(, , i),  Z^*, если М(Х, ) = (,i);

(, X, ) + (¹, , ), если X = аVT и  = а', М(а, ) = «выброс»;

(,.,) — завершение работы, при этом М(,) = «допуск»;

иначе — «ошибка».

Цепочка  = FIRST(k,) носит в работе автомата название «аванцепочка».

Таким образом, для создания алгоритма распознавателя языка, заданного произвольной LL(k)- грамматикой, достаточно уметь построить управляющую таблицу М. Управляющую таблицу М, а также множества FIRST и FOLLOW можно получить на основе правил исходной грамматики.

При k = 1 все существенно проще. Методы построения для LL(l)- грамматик, а также проверки принадлежности грамматики к классу LL(l)- грамматик рассмотрены ниже.

6.4.Левая факторизация

Oсновная идея левой факторизации в том, что в том случае, когда неясно, какую из двух альтернатив надо использовать для развертки нетерминала A, нужно изменить A-правила так, чтобы отложить решение до тех пор, пока не будет достаточно информации для принятия правильного решения.

Если A ₁ | ₂ - два A-правила и входная цепочка начинается с непустой строки, выводимой из , мы не знаем, разворачивать ли по первому правилу или по второму. Можно отложить решение, развернув A A'. Тогда после анализа того, что выводимо из , можно развернуть по A' ₁ или по A' ₂. Левофакторизованные правила принимают вид

AA’

A'₁ | ₂

Рассмотрим алгоритм левой факторизации грамматики:

Для каждого нетерминала A ищем самый длинный префикс , общий для двух или более его альтернатив. Если ≠, т.е. существует нетривиальный общий префикс, заменяем все A-правила

A₁| ₂| … | _n| z,

где z обозначает все альтернативы, не начинающиеся с , на

AA’ | z

A’₁| ₂| … | _n

где A' - новый нетерминал. Повторно применяем это преобразование, пока никакие две альтернативы не будут иметь общего префикса. Рассмотрим вновь грамматику условных операторов из примера:

S if E then S | if E then S else S | a

E b

После левой факторизации грамматика принимает вид

S if E then SS'| a

S' else S | e

E b

К сожалению, грамматика остается неоднозначной, а значит, и не LL(1).

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 2324 / 5524 25 26 27 28 29 30 31 32 33 34 35 36 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.03.20253.12 Mб6УМК Охраны труда (распознанное ) ВСЕ.doc
#
13.11.201944.87 Mб73УМК П и РЭ_2012.doc
#
01.05.202525.3 Mб1УМК П и РЭ_2013_2 мая_практика №1-5.docx
#
04.05.20192.46 Mб53УМК Плешкун для студентов.doc
#
10.11.201910.9 Mб101УМК по немецкому языку 4 курс , доп.спец..doc
#
01.07.20251.79 Mб0УМК по СПО.doc
#
01.05.20252.1 Mб3УМК СПФ Ясюкевич.doc
#
01.05.202516.24 Mб7УМК Станочное оборудование.doc
#
01.05.2025549.38 Кб2УМК страноведение США.doc
#
01.04.20252.01 Mб4УМК ТАХД посл.doc
#
14.08.2019858.62 Кб618УМК Теория литературы.doc