
- •Теория вычислительных процессов и структур
- •1. Предварительные математические сведения
- •1.2. Операции над множествами Объединение множеств
- •Пересечение множеств
- •Разность множеств
- •1.3. Множества цепочек
- •1.4. Языки
- •1.5. Алгоритмы
- •1.6. Некоторые понятия теории графов
- •2. Введение в компиляцию
- •2.1. Задание языков программирования
- •2.2. Синтаксис и семантика
- •2.3. Процесс компиляции
- •2.4. Лексический анализ
- •2.5. Работа с таблицами
- •2.6. Синтаксический анализ
- •2.7. Генератор кода
- •Алгоритм.
- •2.8. Оптимизация кода
- •2.9. Исправление ошибок
- •2.10. Резюме
- •3. Теория языков
- •3.1. Способы определения языков
- •3.2. Грамматики
- •Пример.
- •3.3. Грамматики с ограничениями на правила
- •3.4. Распознаватели
- •3.5. Регулярные множества, их распознавание
- •3.6. Регулярные множества и конечные автоматы
- •3.7. Графическое представление конечных автоматов
- •3.8. Конечные автоматы и регулярные множества
- •3.9. Минимизация конечных автоматов
- •3.10. Контекстно-свободные языки
- •3.10.1. Деревья выводов
- •3.10.2. Преобразование кс–грамматик
- •3.10.3. Грамматика без циклов
- •3.10.4. Нормальная форма Хомского
- •3.10.5. Нормальная формула Грейбах
- •3.11. Автоматы с магазинной памятью
- •3.11.1. Основные определения
- •3.11.2. Эквивалентность мп-автоматов и кс-грамматик
- •4.1. Эквивалентность мп-автоматов и кс-грамматик
- •4.2. Ll(1)-грамматики
- •4.3. Ll(1)-таблица разбора
- •5. Синтаксический анализ снизу вверх
- •5.1. Разбор снизу вверх
- •5.2. Lr(1) - таблица разбора
- •5.3. Построение lr – таблицы разбора
- •5.4. Сравнение ll – и lr – методов разбора
- •6. Включение действий в синтаксис
- •6.1. Получение четверок
- •6.2. Работа с таблицей символов
- •7. Проектирование компиляторов
- •7.1. Число проходов
- •7.2. Таблицы символов
- •Identifier, type.
- •Int procedure rehash(int n)
- •Int procedure rehash(int n)
- •7.3. Таблица видов
- •8. Распределение памяти
- •8.1. Стек времени прогона
- •Integer a, b, X, y
- •Int table[1:10, -5:5].
- •8.2. Методы вызова параметров
- •8.3. Обстановка выполнения процедур
- •8.4. «Куча»
- •8.5. Счетчик ссылок
- •8.6. Сборка мусора
- •9. Генерация кода
- •(Тип – адреса, номер - блока, смещение).
- •9.2. Структура данных для генерации кода
- •9.3. Генерация кода для типичных конструкций
- •9.3.1. Присвоение
- •9.3.2. Условные зависимости
- •If b then c else d
- •9.3.3. Описание идентификаторов
- •9.3.4. Циклы
- •9.3.5. Вход и выход из блока
- •9.3.6. Прикладные реализации
- •9.4. Проблемы, связанные с типами
- •9.5. Время компиляции и время прогона
- •10. Исправление и диагностика ошибок
- •10.1. Типы ошибок
- •10.2. Лексические ошибки
- •10.3. Ошибки в употреблении скобок
- •Begin end
- •Case esac
- •10.4. Синтаксические ошибки
- •10.5. Методы исправления синтаксических ошибок
- •End begin
- •10.6. Предупреждения
- •10.7. Сообщения о синтаксических ошибках
- •10.8. Контекстно-зависимые ошибки
- •Identifier xyz not declared
- •Identifier blank alredy declared in block
- •10.9. Ошибки, связанные с употреблением типов
- •Int I; char c;
- •10.10. Ошибки, допускаемые во время прогона
- •10.11. Ошибки, связанные с нарушением ограничений
3.11. Автоматы с магазинной памятью
Автоматы с магазинной памятью являются естественной моделью синтаксического анализатора КС-языков.
Автомат с магазинной памятью – это односторонний распознаватель, в потенциально бесконечной памяти которого элементы информации хранятся и используются так же, как и патроны автоматического оружия, т.е. в каждый момент доступен только верхний элемент магазина (рис. 3.11).
|
|
|
|
Входная лента | ||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Управляющее Устройство с конечной памятью |
|
|
| |||
| ||||||||
|
|
|
|
| ||||
|
|
|
| |||||
|
|
|
| |||||
|
|
|
|
|
|
|
| |
|
|
|
|
|
|
Магазин |
|
Рис. 3.11. Автомат с магазинной памятью
Все КС-языки определяются недетерминированными автоматами с магазинной памятью, а практически все языки программирования определяются детерминированными автоматами с магазинной памятью.
3.11.1. Основные определения
Определение.
Автомат с магазинной памятью (МП-автомат) – это семерка
,
где
- конечное
множество символов состояния,
представляющих всевозможные состояния
управляющего устройства;
- конечный входной алфавит;
- конечный алфавит магазинных символов;
-
отображение
множества
во множество конечных подмножеств
множества
;
-
начальное состояние управляющего
устройства;
-
символ, находящийся в магазине в начальный
момент (начальный символ);
-
множество заключительных состояний.
Конфигурацией
МП-автомата
Р
называется тройка
,
где
- текущее состояние устройства;
-
неиспользованная часть входной цепочки;
первый символ цепочки
находится под входной головкой; если
,
то считается, что вся входная лента
прочитана;
-
содержимое магазина; самый левый символ
цепочки
считается верхним символом магазина;
если
,
то магазин считается пустым.
Такт работы МП-автомата Р будет представляться в виде бинарного отношения ⊢, определенного на конфигурациях. Будем писать
⊢
,
если
множество
содержит
,
где
,
,
,
и
.
Если
а=е,
то говорят о том, что МП-автомат Р,
находясь в состоянии q
и
имея а
в качестве текущего входного символа,
расположенного под входной головкой,
а Z
– в качестве верхнего символа магазина,
может перейти в состояние
,
сдвинуть головку на одну ячейку вправо
и заменить верхний символ магазина
цепочкой
магазинных символов. Если =е,
то верхний символ удаляется из магазина,
тем самым магазинный список сокращается.
Если а=е, будем называть этот такт е-тактом. В е-такте текущий входной символ не принимается во внимание и входная головка не сдвигается. Однако состояние управляющего устройства и содержимое памяти можут измениться. Заметим, что е-такт может происходить тогда, когда вся цепочка прочитана.
Начальной
конфигурацией МП-автомата
Р
называется конфигурация вида
,
где
,
т.е. управляющее устройство находится
в начальном состоянии, входная лента
содержит цепочку, которую нужно
распознать, и в магазине есть только
начальный символ
.
Заключительная
конфигурация
– это конфигурация вида
,
где
и
.
Говорят,
что цепочка w
допускается
МП-автоматом Р,
если
⊢*
для некоторых
и
.
L(P) – язык, определяемый автоматом Р – это множество цепочек, допускаемых автоматом Р.
Основное свойство МП-автоматов можно сформулировать следующим образом: «То, что происходит с верхним символом магазина, не зависит от того, что находится в магазине под ним».