
- •Глава 1. Введение 2
- •Глава 2. Лексический анализ 6
- •2.4. Построение детерминированного конечного
- •Глава 3. Синтаксический анализ 20
- •Глава 8. Генерация кода 76
- •Глава 9. Системы автоматизации построения трансляторов 120
- •Глава 1. Введение
- •1.1. Место компилятора в программном обеспечении
- •1.2. Структура компилятора
- •Глава 2. Лексический анализ
- •2.1. Регулярные множества и регулярные выражения
- •2.2. Конечные автоматы
- •2.5. Программирование лексических анализаторов
- •2.6. Конструктор лексических анализаторов lex
- •Глава 3. Синтаксический анализ
- •3.1. Основные понятия и определения
- •3.2. Таблично-управляемый предсказывающий разбор
- •3.2.1. Алгоритм разбора сверху-вниз
- •3.2.2. Множества first и follow.
- •3.2.4. Ll(1)-грамматики
- •3.2.5. Удаление левой рекурсии
- •3.2.6. Левая факторизация
- •3.2.7. Рекурсивный спуск
- •3.2.8. Диаграммы переходов для рекурсивного спуска
- •3.2.9. Восстановление после синтаксических ошибок
- •3.3. Разбор снизу-вверх типа сдвиг-свертка
- •3.3.1. Основа
- •3.3.2. Lr(k)-анализаторы
- •3.3.4. Конфликты разбора типа сдвиг-свертка
- •3.3.5. Восстановление после синтаксических ошибок
- •Глава 4. Промежуточные представления программы
- •4.1. Представление в виде ориентированного графа
- •4.2. Трехадресный код
- •4.3. Линеаризованные представления
- •4.4. Организация информации в генераторе кода
- •4.5. Уровень промежуточного представления
- •Глава 5. Элементы теории перевода
- •5.1. Преобразователи с магазинной памятью
- •5.2. Синтаксически управляемый перевод
- •5.3. Атрибутные грамматики
- •5.3.1. Определение атрибутных грамматик
- •5.3.2. Атрибутированное дерево разбора
- •5.3.3. Язык описания атрибутных грамматик
- •Глава 6. Контекстные условия языков программирования
- •6.1. Описание областей видимости и блочной структуры
- •6.2. Структура среды Модулы-2
- •6.3. Занесение в среду и поиск объектов
- •Глава 7. Организация таблиц символов компилятора
- •7.1. Таблицы идентификаторов и таблицы символов
- •7.2. Таблицы идентификаторов
- •7.3. Таблицы символов и таблицы расстановки
- •7.4. Функции расстановки.
- •7.5. Таблицы на деревьях
- •7.7. Сравнение различных методов реализации таблиц
- •Глава 8. Генерация кода
- •8.1. Модель машины
- •8.2. Динамическая организация памяти
- •8.3. Назначение адресов
- •8.4. Трансляция переменных.
7.3. Таблицы символов и таблицы расстановки
Рассмотрим организацию таблицы символов с помощью таблицы
расстановки. Таблица расстановки - это массив указателей на списки
указателей на идентификаторы. В каждый такой список входят указатели
на идентификаторы, имеющие одно значение функции расстановки (рис.
7.3).
Вначале таблица расстановки пуста (все элементы имеют значение
NIL). При поиске идентификатора id вычисляется функция расстановки
H(id) и просматривается линейный список T[H]. Поиск в таблице может
быть описан следующей процедурой:
type Element= record IdenP:integer;
Next:pointer to Element;
end;
Pointer=pointer to Element
function Search(Id):Pointer;
var P:Pointer;
begin P:=T[H(Id)];
loop if P=nil then return(nil)
elsif IdenTab[P^.IdenP]=Id then return(P)
else P:=P^.Next
end end; end;
IdenTab - таблица идентификаторов. Занесение объекта в таблицу
может осуществляться следующей процедурой:
function Insert(Id):Pointer;
var P,H:Pointer;
begin P:=Search(Id);
if P<>nil then return(P)
else H:=H(Id); new(P);
P^.Next:=T[H]; T[H]:=P;
P^.Idenp:=Include(Id);
end;
return(P);
end;
|--| +------+ +------+
H----->| -+-x---->| |----->| |----->
|--| | +-->+------+ +------+
| | | |
|--| | +------------+
| +------+ |
+---| |---+
P-------->+------+
Рис. 7.4.
Процедура Include заносит идентификатор в таблицу
идентификаторов. Алгоритм иллюстрируется рис. 7.4.
7.4. Функции расстановки.
Много внимания было уделено тому, какой должна быть функция
расстановки. Основные требования к ней очевидны: она должна легко
вычисляться и распределять равномерно. Один из возможных подходов
заключается в следующем.
1. По символам строки s определяем положительное целое H.
Преобразование одиночных символов в целые обычно можно сделать
средствами языка реализации. В Паскале для этого служит функция ord, в
Си при выполнении арифметических операций символьные значения
трактуются как целые.
2. Преобразуем H, вычисленное выше, в номер списка, т.е. целое
между 0 и m-1, где m - размер таблицы расстановки, например, взятием
остатка при делении H на m.
Функции расстановки, учитывающие все символы строки, распределяют
лучше, чем функции, учитывающие только несколько символов, например в
конце или середине строки. Но такие функции требуют больше вычислений.
Простейший способ вычисления H - сложение кодов символов строки.
Перед сложением с очередным символом можно умножить старое значение H
на константу q. Т.е. полагаем H0=0, Hi=q*Hi1+ci для 1<=i<=k, k - длина
строки. При q=1 получаем простое сложение символов. Вместо сложения
можно выполнять сложение ci и q*Hi-1 по модулю 2. Переполнение при
выполнении арифметических операций можно игнорировать.
Функция Hashpjw, приведенная ниже [1], вычисляется, начиная с
H=0. Для каждого символа c сдвигаем биты H на 4 позиции влево и
добавляем c. Если какой-нибудь из четырех старших бит H равен 1,
сдвигаем эти 4 бита на 24 разряда вправо, затем складываем по модулю 2
с H и устанавливаем в 0 каждый из четырех старших бит, равных 1.
#define PRIME 211
#define EOS '\0'
int Hashpjw(s)
char *s;
{ char *p;
unsigned H=0, g;
for (p=s; *p != EOS; p=p+1)
{H=(H<<4)+(*p);
if (g = H & 0xf0000000)
{H=H^(g>>24);
H=H^g;
} }
return H%PRIME;
}
Рис. 7.5