
- •Содержание
- •1.Рабочая программа
- •2.Модуль Вводный
- •3.Модуль Формальные грамматики и языки
- •3.1.Языки и цепочки символов. Способы задания языков
- •3.1.1.Цепочки символов. Операции над цепочками символов
- •3.1.2.Понятие языка. Формальное определение языка
- •3.1.3.Способы задания языков
- •3.1.4.Синтаксис и семантика языка
- •3.2.Определение грамматики
- •3.2.1.Особенности языков программирования
- •3.2.2.Определение грамматики. Форма Бэкуса—Наура
- •3.2.3.Принцип рекурсии в правилах грамматики
- •3.2.4.Другие способы задания грамматик
- •3.3.Классификация языков и грамматик
- •3.3.1.Классификация грамматик
- •3.3.2.Классификация языков
- •3.4.Контроль
- •4.Модуль Распознаватели, механизм вывода цепочек символов
- •4.1.Цепочки вывода. Сентенциальная форма.
- •4.1.1.Сентенциальная форма грамматики. Язык, заданный грамматикой
- •4.1.2.Левосторонний и правосторонний выводы
- •4.1.3.Однозначные и неоднозначные грамматики
- •4.1.4.Эквивалентность и преобразование грамматик
- •4.2.Распознаватели. Задача разбора
- •4.2.1.Общая схема распознавателя
- •4.2.2.Виды распознавателей
- •4.2.3.Классификация распознавателей по типам языков
- •4.3.Контроль
- •5.Модуль Регулярные грамматики и языки
- •5.1.Регулярные языки и грамматики
- •5.2.Леволинейные и праволинейные грамматики. Автоматные грамматики
- •5.3.Алгоритм преобразования регулярной грамматики к автоматному виду
- •5.4.Конечные автоматы
- •5.4.1.Определение конечного автомата
- •5.4.2.Детерминированные и недетерминированные конечные автоматы
- •5.4.3.Преобразование конечного автомата к детерминированному виду
- •5.5.Контроль
- •6.Модуль Контекстно-свободные грамматики и языки
- •6.1.Контекстно-свободные языки
- •6.1.1.Распознаватели кс-языков. Автоматы с магазинной памятью. Определение мп-автомата
- •6.2.Классы кс-языков и грамматик. Класс ll(k) грамматик.
- •6.3.Принципы построения распознавателей для ll(k)-грамматик
- •6.4.Левая факторизация
- •6.5.Удаление левой рекурсии
- •6.6.Алгоритм разбора для ll(1)-грамматик
- •6.7.Алгоритм построения множества first(1,a)
- •6.8.Алгоритм построения множества follow(1,a)
- •6.9.Восходящие распознаватели кс-языков без возвратов
- •6.9.1.Определение lr(k)-грамматики
- •6.10.Принципы построения распознавателей для lr(k)-грамматик
- •6.10.1.Грамматики простого предшествования
- •6.11.Распознаватели для lr(0) и lr(1) грамматик
- •6.11.1.Распознаватель для lr(0)-грамматики
- •6.11.2.Распознаватель для lr(1) грамматики
- •6.12.Контроль
- •7.Модуль Инструментальные средства для построения трансляторов
- •7.1.Инструментальные средства для построения компиляторов
- •7.1.1.Построитель лексических анализаторов Lex
- •7.2.Контроль
- •8.Модуль Особенности программирование трансляторов
- •8.1.Использование значений произвольных типов, алгоритм разбора
- •8.1.1.Алгоритм синтаксического разбора
- •8.1.2.Семантический стек
- •8.2.Неоднозначности и конфликты
- •8.3.Старшинство операций
- •8.4.Дополнительные возможности программ yacc и lex
- •8.4.1.Обработка ошибок
- •8.5.Совместное использование lex и yacc
- •8.5.1.Кодировка лексем и интерфейс
- •8.5.2.Сборка yacc-программ
- •8.6.Советы по подготовке спецификаций
- •8.6.1.Стиль
- •8.6.2.Использование левой рекурсии
- •8.6.3.Уловки анализа лексики
- •8.6.4.Входной синтаксис yacc'а
- •8.7.Контроль
- •9.Модуль Заключение
- •10.Обеспечение лабораторного практикума
- •11.Дополнительная информация. Примеры
- •11.4.Пример простейшего интерпретатора формул
- •11.5.Простой пример
- •11.6.Более сложный пример
- •11.7.Генераторы лексических и синтаксических анализаторов
- •11.8.Генераторы лексических и синтаксических анализаторов на java
- •11.9.Пакеты для разработки компиляторов
- •Список сокращений
- •Литература
- •Приложения Приложение 1. Учебно–методическая карта дисциплины “Системное программное обеспечение. Синтаксические анализаторы”
- •Приложение 2. Вопросы для зачета по дисциплине “Системное программное обеспечение. Синтаксические анализаторы”
- •Приложение 3. Методические указания к лабораторным работам по дисциплине «Системное программное обеспечение. Синтаксические анализаторы»
- •Порядок выполнения работы:
- •Контрольные вопросы
- •Лексический анализатор lex. Анализ структуры программ
- •Краткая теория:
- •Рассмотрим примеры:
- •Порядок выполнения работы:
- •Контрольные вопросы
- •Лексический анализатор lex, синтаксический анализатор yacc. Алгебраические вычисления
- •Краткая теория:
- •Порядок выполнения работы:
- •Контрольные вопросы
- •Лексический анализатор lex и синтаксический анализатор yacc. Изображение геометрических фигур
- •Краткая теория:
- •Создание метафайла и работа сним
- •Порядок выполнения работы:
- •Контрольные вопросы
- •Приложение 4. Организация рейтингового контроля по дисциплине «Системное программное обеспечение. Синтаксические анализаторы»
6.11.Распознаватели для lr(0) и lr(1) грамматик
6.11.1.Распознаватель для lr(0)-грамматики
Простейшим случаем LR(k) -грамматик являются LR(0) -грамматики. При k =0 распознающий расширенный МП-автомат совсем не принимает во внимание текущий символ, обозреваемый его считывающей головкой. Решение о выполняемом действии принимается только на основании содержимого стека автомата. При этом не должно возникать конфликтов между выполняемым действием (сдвиг или свертка), а также между различными вариантами при выполнении свертки.
Управляющая таблица для LR(0)-грамматики строится на основании понятия «левых контекстов» для нетерминальных символов: очевидно, что после выполнения свертки для нетерминального символа А и стеке МП-автомата ниже этого символа будут располагаться только те символы, которые могут встречаться и цепочке вывода слева от A. Эти символы н составляют «левый контекст» для A. Поскольку выбор между сдвигом или сверткой, а также между типом свертки в LR(0) -грамматиках выполняется только на основании содержимого стека, то LR(0) -грамматика должна допускать однозначный выбор на основе левого контекста для каждого символа.
Рассмотрим простую КС-грамматику G({a,b}, {S}, {S→aSS|b}, S). Пополненная грамматика для нее будет иметь вид G({a.b}, {S, S'}, (S'→S. S →aSS|b), S'). Эта грамматика является LR(0)-грамматикой. Управляющая таблица для нее приведена и табл. 6.1.
Таблица 6.1. Пример управляющей таблицы для LR(0)-грамматики
-
Стек
Действие
Переход
S
а
b
^и
сдвиг
1
2
3
S
успех, 1
а
сдвиг
4
2
3
b
свертка, 3
aS
сдвиг
5
2
3
aSS
свертка, 2
Колонка «Стек», присутствующая в таблице, в принципе не нужна для распознавателя. Она введена исключительно для пояснения каждого состояния стека автомата. Пустые клетки в таблице соответствуют состоянию «ошибка». Правила в грамматике пронумерованы от 1 до 3 (при этом будем считать, что состоянию «успех» — свертке к нулевому символу — в пополненной грамматике всегда соответствует первое правило). Распознаватель работает, невзирая на текущий символ, обозреваемый считывающей головкой расширенного МП-автомата, поэтому колонка «Действие» в таблице имеет только один столбец, не помеченный никаким символом, — указанное в ней данное действие выполняется всегда для каждой строки таблицы.
Рассмотрим примеры распознавания цепочек этой грамматики. Работу распознавателя будем отображать по шагам. Конфигурацию расширенного МП-автомата будем отображать в виде трех компонентов: не прочитанная еще часть входной цепочки символов, содержимое стека МП-автомата, последовательность номеров примененных правил грамматики (поскольку автомат имеет только одно состояние, его можно не учитывать). В стеке МП-автомата вместе с помещенными туда символами показаны и номера строк управляющей таблицы, соответствующие этим символам в формате {символ, номер строки).
Разбор цепочки abababb.
1. (abababb^к, {^и,0}, )
2. (bababb^к {^и,0},{a,2}, )
3. (аbаbb^к, {^и ,0}{а,2}{b,3}, )
4. (аbаbb^к, {^и,0){а,2}{S,4), 3)
5. (bаbb^к, {^и ,0}{а,2}{S,4}{а,2}, 3)
6. (аbb^к, (^и ,0}{а,2}{S,4}{а,2}{b,3}, 3)
7. (abb^к. {^и ,0){a,2}{S,4){a,2}{S,4}, 3,3)
8. (bb^к, {^и ,0}{а,2}{S,4}{а,2}{S,4}{а,2}, 3,3)
9. (b^к, {^и ,0}{a,2}{S,4}{a,2}{S,4}{a,2}{b,3}, 3,3)
10. (b^к.. {^и ,0}{a,2}{S,4}{a,2}{S,4}{a,2}{S,4}, 3,3,3)
11. (^к , {^и ,0}{a,2}{S,4}{a,2}{S,4}{a,2}{S,4}{b,3} 3,3,3)
12. (^к , {^и ,0}{a,2}{S,4}{a,2}{S,4}{a,2}{S,4}{S,5}, 3,3,3,3)
13. (^к , {^и,0}{a,2}{S,4}{a,2}{S,4}{S,5}, 3,3,3,3,2)
14. (^к , {^и,0}{а,2}{S,4}{S,5}, 3,3,3,3,2,2)
15. (^к , {^и,0}{S,1}, 3,3,3,3,2,2,2)
16. (^к , {^и,0}{S',*}, 3,3,3,3,2,2,2,1) - разбор завершен.
Соответствующая цепочка вывода будет иметь вид (используется правосторонний вывод): S' S aSS aSaSS aSaSaSS aSaSaSb aSaSabb aSababb abababb.
Разбор цепочки aabbb:
1. (aabbb^к, {^и,0}, )
2. (аbbb^и, {^и ,0}{а,2}, )
3. (bbb^к, {^и ,0}{a,2}{a,2}{b,3},)
4. (bb^к, {^и,0}{а,2}{а,2}{b,3}, )
5. (bb^к, {^и ,0}{a,2}{a,2}{S,4},3) .
6. (b^к , {^и,0}{а,2}{а,2}{S,4}{b,3}, 3)
7. (b^к, {^и ,0}{а,2}{а,2}{S,4}{S,5}, 3,3)
8. (b^к, {^и ,0}{а,2}{S,4}, 3,3,2)
9. (^к, {^и,0}{а,2){S,4){b,З}, 3,3,2)
10. (^к, {^и ,0}{а,2}{S,4}{S,5}, 3,3,2,3)
11. (^к, {^и ,0}{S,1}, 3,3,2,3,2)
12. (^к, {^и,0}{S',*}, 3,3,2,3,2,1) - разбор завершен.
Соответствующая цепочка вывода будет иметь вид (используется правосторонний вывод): S' S aSS aSb aaSSb aaSbb aabbb.
Разбор цепочки aabb:
1. (ааbb^к, {^и,0},)
2. (abb^к, {^и ,0}{а,2}, )
3. (bb^к, {^и,0}{а,2}{а,2}, )
4. (b^к, {^и,0}{а,2}{а,2}{b,3}, )
5. (b^к, {^и,0}{a,2}{a,2}{S,4}, 3)
6. (^к, {^и,0}{а,2}{а,2}{S,4}{b,3},3)
7. (^к, {^и,0}{а,2}{а,2}{S,4}{S,5}, 3,3)
8. (^к, {^и ,0}{а,2}{S,4}, 3,3,2)
9. Ошибка, невозможно выполнить сдвиг.
Распознаватель для LR(0) -грамматики достаточно прост. Приведенный выше пример можно сравнить с методом рекурсивного спуска или с распознавателем для LL(1)-грамматики — оба эти метода применимы к описанной выше грамматике. По количеству шагов работы распознавателя эти методы сопоставимы, но по реализации нисходящие распознаватели в данном случае немного проще.