Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Саратовский государственный университет им. Н.Г. Чернышевского

Предмет:

Программирование

Файл:

Языки программирования и методы трансляции / 4_sem / Lects.pdf

Скачиваний:

Добавлен:

09.06.2015

Размер:

731.64 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 56 / 226 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 > Следующая >>>

2. Контекстно-свободные грамматики и автоматы

2.1. Приведенные грамматики

Из четырех типов грамматик контекстно-свободные грамматики являются наиболее важными с точки зрения приложений к языкам программирования и компиляции. Рассмотрим несколько эквивалентных преобразований КС-грамматик. Первый вид преобразования связан с удалением из грамматики бесполезных символов. Бесполезные символы в грамматике могут оказаться в следующих случаях:

а) из символа не может быть получена конечная терминальная цепочка, б) символ не может быть получен при выводе.

2.2. Удаление непроизводящих символов

Определение. Символ <X> VA называется непроизводящим, если из него не может быть выведена конечная терминальная цепочка.

Если все символы правой части являются производящими, то производящим является и символ, стоящий в левой части. Это утверждение позволяет описать алгоритм обнаружения непроизводящих символов:

1.Составить список нетерминалов, для которых найдется хотя бы одно правило, правая часть которого не содержит нетерминалов.

2.Если найдено такое правило, что все нетерминалы, стоящие в его правой части уже

занесены в список, то добавить в список нетерминал, стоящий в его левой части. 3. Если на шаге 2 список больше не пополняется, то получен список всех произво-

дящих нетерминалов грамматики, а все нетерминалы, не попавшие в него, являются не-

производящими.

Проанализируем следующую грамматику :

Г2. 0: R = {→aa, →b<A>d, →c, <A>→cd, <A>→a<A>d, →d<A>f },

Здесь непроизводящими являются символы <А> и <В>. После удаления правил, содер-

жащих непроизводящие символы, получаем: R' = { →aa, → c}.

2.3. Определение недостижимых символов

Определение. Символ X VT VA называется недостижимым в КС-грамматике Г, если X не появляется ни в одной выводимой цепочке.

Можно заметить, что если нетерминал в левой части правила является достижимым, то и все символы правой части являются достижимыми. Это свойство правил является основой процедуры выявления недостижимых символов, которую можно записать так:

1.Образовать одноэлементный список, состоящий из начального символа

2.Если найдено правило, левая часть которого уже имеется в списке, то включить в список все символы, содержащиеся в его правой части.

3.Если на шаге 2 новые нетерминалы в список больше не добавляются, то получен список всех достижимых нетерминалов, а нетерминалы, не попавшие в список, являются недостижимыми.

Рассмотрим грамматику:

Г2. 1 : R = { →ab, →c, <A> →b,

<A> →a }

Находим, что A является недостижимым символом.

2.4. Определение бесполезных символов

Бесполезный символ грамматики можно определить следующим образом:

Определение. Символ X, который принадлежит VT VA называется бесполезным в КС-грамматике Г, если он является недостижимым или непроизводящим.

Исключить бесполезные символы из грамматики можно удаляя правила, содержащие вначале непроизводящие, а затем недостижимые символы.

Определение. КС-грамматика называется приведенной, если она не содержит бесполезных символов.

2.5. Исключение леворекурсивных правил

Определение. Правило вида <A> → α <A> , где A VA , α ( VT VA) * , называется

праворекурсивным, а правило вида <A> → <A>α - леворекурсивным.

Для каждой КС-грамматики Г, содержащей леворекурсивные правила, можно построить эквивалентную грамматику Г', не содержащую леворекурсивных правил.

Пусть исходная грамматика Г содержит правила:

<A> → <A>α 1 | <A>α 2 | ... |<A>α m| β 1 | β 2 |...| β n ,

где ни одна цепочка β не начинается с <A> и αi, βj ( VT VA)* i =- 1,…,m . j = 1,…,n Введем новый нетерминал <A'> и преобразуем правила следующим образом:

<A> → β 1 | β 2 |...| β n | β 1<A'> | β 2<A'>|...| β n<A'>, <A'> →α 1 | α 2 |...| α m| α 1<A'> |α 2<A'>|...|α m<A'>.

Заменяя все правила с левой рекурсией в Г описанным способом, получим грамматику Г', такую что L(Г)=L(Г'), поскольку каждая цепочка, выведенная в грамматике Г, может быть построена в грамматике Г' и наоборот. Рассмотрим построение выводов в Г и Г'.

В грамматике Г вывод цепочки имеет вид:

< A> <A>α1 <A>α1α1 <A>α1α1α1 β1α1α1α 1,

в грамматике Г' эта же цепочка выводится следующим образом:

<A> β 1<A'> β1α 1<A'> β1α1α 1<A'> β1α1α1α 1.

Рассмотрим пример. Требуется преобразовать грамматику Г1. 9, которая задана схемой:

Г1. 9: R={<E> → <E> + <T> | <T>, < T> → <T> * <F> | <F>, <F> → ( <E> ) | a}.

Следуя описанному способу, правила <E> → <E> + <T> | <T> преобразуем в правила

<E>→ <T> | <T><E'> и <E'> → +<T> | +<T><E'> , а правила <T> → <T> * <F> | <F>

преобразуем в правила <T> → <F> | <F><T'> и <T'> → < F> | * <F><T'>.

В результате получаем грамматику Г'1. 9, имеющую схему:

Г'1. 9 : R'= { <E> → < T>, <E> → <T><E'>, <E'>→ + <T>,

<E'> → + <T><E'>, <T> → <F>,

<T> → <F><T'>, <T'> → * <F>, <T'> → * <F><T'>, < F> → a,

<F> → (<E>) },

не содержащую леворекурсивных правил.

2.6. Исключение цепных правил

Определение. Правило грамматики вида <A> → , где <A>, VA, называется

цепным.

Для КС-грамматики Г, содержащей цепные правила, можно построить эквивалентную ей грамматику Г', не содержащую цепных правил.

<<< < Предыдущая 1 2 3 4 56 / 226 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 > Следующая >>>

Соседние файлы в папке 4_sem

#
09.06.20151.38 Кб22Expr.py
#
09.06.2015731.64 Кб61Lects.pdf
#
09.06.201578.71 Кб25Progr.pdf
#
09.06.201538.31 Кб24Tasks.pdf
#
09.06.2015295.46 Кб22tpg.pdf