4.2.1.Определение lr(к)-грамматики

u A w

Рис. 4.4

Рассмотрим наиболее широкий класс КС-грамматик, для которых можно построить детерминированный восходящий анализатор. Такие грамматики получили название LR(k)-грамматик (входная цепочка читается слева (Left) направо, выходом анализатора является правый (Right) разбор, k – число символов входной цепочки, на которое можно "заглянуть" вперед для выделения основы).

Наиболее наглядно LR(k)-грамматику можно определить в терминах деревьев вывода. Грамматика G = < T, N, S, R > является LR(k)-грамматикой, если просмотрев только часть кроны дерева вывода в этой грамматике, расположенную слева от данной внутренней вершины, часть кроны, выведенную из нее, и следующие k символов входной цепочки, можно установить правило вывода, которое было применено к этой вершине при порождении входной цепочки. Например, рассмотрев цепочку uv и первые k символов цепочки w (рис. 4.4), можно определить, какое правило было применено к вершине А.

В определении LR(k)-грамматики используется множество ПЕРВ_k(), состоящее из префиксов длины k терминальных цепочек, выводимых из . Если из  выводятся терминальные цепочки, длина которых меньше k, то эти цепочки также включаются в множество ПЕРВ_k(). Формально

ПЕРВ_k() = { x   _l* xw и x  = k или

 _l* x и x  < k }.

Очевидно, что определение множества ПЕРВ(), приведенное при определении LL(k)-грамматики, полностью согласуется с данным определением для k = 1.

Введем еще одно понятие, которое понадобится для определения LR(к)-грамматики.

Определение. Пополненной грамматикой G’, полученной из КС-грамматики G = < T, N, S, R >, называется грамматика

G’ = < T, N  {S’}, S’ R  { S’ S } >.

Если правила грамматики G’занумерованы числами 1, 2, …, p, то будем считать, что S’ S – нулевое правило грамматики G’, а нумерация остальных правил та же, что и в грамматике G. Начальное правило S’ S вводится для того, чтобы свертка, в которой используется нулевое правило, можно было интерпретировать как признак того, что входная цепочка допустима. Дадим теперь точное определение LR(k)-грамматики.

Определение.

Пусть G = < T, N, S, R > – КС-грамматика и G’= < T, N’, S’, R’> –полученная из нее пополненная грамматика. G называется LR(k)-грамматикой для k0, если из условий:

S’ _r* Aw _rw ,
S’ _r* Bx _ry ,
ПЕРВ_k(w) = ПЕРВ_k(y)

следует, что Ay = Bx.

Это определение говорит о том, что если w и y – правовыводимые цепочки пополненной грамматики G’, у которых ПЕРВ_k(w) = ПЕРВ_k(y) и A   –

последнее правило, использованное в правом выводе цепочки w, то правило A   должно использоваться также в правом разборе при свертке y к Ay.

Поскольку A   независимо от w, то из определения LR (k)-грамматики следует, что в множестве ПЕРВ_k(w) содержится информация, достаточная для определения основы.

<<< < Предыдущая 12 / 62 3 4 5 6 > Следующая >>>

Соседние файлы в папке ВОСХОДЯЩИЕ МЕТОДЫ ОБРАБОТКИ ЯЗЫКОВ

#
01.05.2014263.68 Кб54LR_K_GR.DOC
#
01.05.2014222 б8Методы _восходящие методы обработки языков_ .log