Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Иркутский государственный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ParseUnit / MCADoc.doc

Скачиваний:

Добавлен:

31.05.2015

Размер:

1.53 Mб

Скачать

☆

<<< < Предыдущая 1 23 / 93 4 5 6 7 8 9 > Следующая >>>

2.1. Кс-грамматики. Дерево синтаксического разбора

Обозначим V – конечное множество символов, V⁺ - множество непустых цепочек символов из V, V^* - множество все возможных цепочек (включая цепочку нулевой длины) из V.

Определение. Грамматика G = <N, T, P, S>, где N, T – множества нетерминальных и терминальных символов соответственно (NT=), P – множество правил вида A->  (AN, (NT)^*), S - аксиома (SN), называется КС-грамматикой.

Пример КС-грамматики.

G=<N, T, P, S>, где

N={A,B,C,D,E}

T={+,*,(,),i}

S=A

P={ 1. A->CB

2. B->+CB

3. B->

4. C->ED

5. D->*ED

6.D->

7. E->(A)

8. E->i}

Выводом цепочки _n в грамматике G называется последовательность цепочек ₁=>…=>_i_-1 =>_i=>…=>_n, если [3, с.77]:

_1,…_i_-1, …, _n  (NT)^*,
₁=S,
i=2, …, n цепочка _i получена из цепочки _i_-1заменой одного нетерминального символа A цепочкой  согласно правила грамматики A->

Для цепочки i+i*i+i выводом в грамматике G является последовательность цепочек^²

A=>¹CB=>⁴EDB=>⁸iDB=>⁶iB=>²i+CB=>⁴i+EDB=>⁸i+iDB=>⁵i+i*EDB=>⁸i+i*iDB=>⁶=>i+i*iB=>²i+i*i+CB=>⁴i+i*i+EDB=>⁸i+i*i+iDB=>⁶ i+i*i+iB=>³ i+i*i+i

Вывод цепочки часто описывают деревом синтаксического разбора. Одно и тоже дерево синтаксического разбора может соответствовать различным выводам цепочки.

Деревом синтаксического разбора (ДСР) цепочки =₁, …, _m в KC-грамматике G называется дерево, у которого:

Корень дерева помечен символом S.
Терминальные узлы дерева помечены символами ₁, …, _m , .
Промежуточные узлы дерева помечены нетерминальными символами грамматики ₁, …, _m N.
Для всякого нетерминального узла A дерева синтаксического разбора, непосредственно связанного с узлами ₁, …, _n, в грамматике G имеет место правило A -> ₁…_n.

ДСР цепочки i+i*i+i в грамматике G представлено на рис.1.

Упражнение. Сопоставьте каждому элементу вывода цепочки i+i*i+i в грамматике G элементы ДСР.

Рис. 1. Дерево синтаксического разбора цепочки i+i*i+i. Верхний индекс в метке нетерминального узла – номер правила грамматики

2.2. Множества направляющих символов.Ll(1)-грамматики

Множество направляющих символов DS(P->) правила P-> КС-грамматики G определим как DS(P->)=S()F(P), где S()={a| a  T, (NT)⁺, =>^*a, (NT)^*}^³, а F(P)={a| a  T{#}, =>^*, S#=>^* xPay; S – аксиома КС-грамматики, P  N; x,y  (NT)^*} [3, c.104]. Таким образом, множество направляющих символов правила грамматики это символы входной строки, при обработке которых можно применить данное правило.

Построим множества направляющих символов для правил грамматики G:

DS(A->CB) = {(, i }

DS(B->+CB) = { + }

DS(B->) = {#, )}

DS(C->ED) = {(, i}

DS(D->*ED)={*}

DS(D->) = {+, #, )}

DS(E->(A)) = { ( }

DS(E->i) = { i }

LL(1)-грамматикой называется такая КС-грамматика G=<N, T, P, S>, у которой:

Нет подмножеств правил вида A->A₁₁, …, A_n-1->A_n_n, A_n->A, где A, A₁, …, A_n N, ₁, …, _n (NT)^*
xNT S=>^*x  P, где ,   (NT)^*
p₁, p₂| p₁, p₂ P, p₁=A->, p₂=A-> DS(A->)DS(A->)=

Приведенная выше КС-грамматика G является LL(1)-грамматикой.

LL(1)-грамматики используют в качестве моделей синтаксиса языков программирования. Свойства LL(1)-грамматики позволяют строить из нее автоматный синтаксический анализатор, обеспечивающий контроль принадлежности входной цепочки языку, заданному этой грамматикой.

<<< < Предыдущая 1 23 / 93 4 5 6 7 8 9 > Следующая >>>

Соседние файлы в папке ParseUnit

#
31.05.20151.53 Mб29MCADoc.doc
#
31.05.2015388.61 Кб31MLADoc.doc
#
31.05.201512.31 Кб22инструкция.htm