2.9. Исправление ошибок

Предположим, что входом компилятора служит правильно построенная программа (однако, на практике очень часто это не так).

Компилятор имеет возможность обнаружить ошибки в программе по крайней мере на трех этапах компиляции:

лексического анализа;
синтаксического анализа;
генерации кода.

Если встретилась ошибка, то компилятору трудно по неправильной программе решить, что имел в виду ее автор. Но в некоторых случаях легко сделать предположение о возможном исправлении программы.

Например, если А=В*2С, то вполне правдоподобно допустить А=В*2*С. В общем случае компилятор зафиксирует эту ошибку и остановится. Однако некоторые компиляторы стараются провести минимальные изменения во входной цепочке, чтобы продолжить работу.

Перечислим несколько возможных изменений.

Замена одного знака. Если лексический анализатор выдает синтаксическое слово INTEJER в неподходящем для появления идентификатора месте программы, то компилятор может догадаться, что подразумевается слово INTEGER.
Вставка одной лексемы, т.е. заменить 2С на 2*С.
Устранение одной лексемы. DO 10 I=1,20,.
Простая перестановка лексем. I INTEGER на INTEGER I.

Далее мы подробно остановимся на реализации таких компиляторов.

2.10. Резюме

На рис. 2.5. приведена принципиальная модель компилятора, которая является лишь первым приближением к реальному компилятору. В реальности фаз может быть значительно больше, т.к. компиляторы должны занимать как можно меньший объем памяти.

Рис 2.8. Модель компилятора

Мы будем интересоваться фундаментальными проблемами, возникающими при построении компиляторов и других устройств, предназначенных для обработки языков.

Контрольные вопросы

Задание языков программирования.
Синтаксис и семантика.
Процесс компиляции.
Лексический анализ.
Работа с таблицами.
Синтаксический анализ.
Генерация кода.
Алгоритм генерации кода.
Оптимизация кода.
Исправление ошибок.

3. Теория языков

3.1. Способы определения языков

Мы определяем язык Lкак множество цепочекконечнойдлины в алфавите.

Первый вопрос - как описать языкLв том случае, когда он бесконечен. ЕслиL состоит из конечного числа цепочек, то самый очевидный способ – составить список всех цепочек.

Однако для многих языков нельзя установить верхнюю границу длины самой длинной цепочки. Следовательно, приходится рассматривать языки, содержащие сколь угодно много цепочек. Очевидно, такие языки нельзя определить исчерпывающим перечислением входящих в них цепочек, и необходимо искать другой способ их описания. И как прежде, мы хотим, чтобы описание языков было конечным, хотя описываемый язык может быть бесконечным.

Известно несколько способов описания языков, удовлетворяющих этим требованиям. Один из способов состоит в использовании порождающей системы, называемой грамматикой.

Цепочки языка строятся точно определённым способом с применением правил грамматики. Одно из преимуществ определения языка с помощью грамматики состоит в том, что операции, проводимые в ходе синтаксического анализа и перевода, можно сделать проще, если воспользоваться структурой, которую грамматика приписывает цепочкам (предложениям).

Второйметод описания языка – частичный алгоритм, который для произвольной входной цепочки останавливается и отвечает «да» после конечного числа шагов, если эта цепочка принадлежит языку.

Мы будем представлять частичный алгоритм, определяющий языки, в виде схематизированного устройства, которое будем называть распознавателем.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 1112 / 5012 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>