Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Ульяновский Государственный Технический Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

compilers.docx

Скачиваний:

Добавлен:

09.11.2018

Размер:

108.47 Кб

Скачать

☆

<<< < Предыдущая 1 2 34 / 84 5 6 7 8 > Следующая >>>

1.4. Родственники компилятора

Как видно из рис. 1.3, входная информация для компилятора может порождаться одним или несколькими препроцессорами; кроме того, после компиляции может потребоваться дополнительная обработка для получения выполняемого машинного кода. В этом разделе мы рассмотрим типичное окружение, в котором работает компилятор.

Препроцессоры

Препроцессоры создают входной поток информации для компилятора. С их помощью можно выполнить следующие функции.

Обработка макросов. Пользователь может определить макросы — краткие записи длинных конструкций.

2. Включение файлов. В текст программы можно включить заголовочные файлы. Например, при обработке файла препроцессор С заменяет выражение #include <global. h> содержимым файла global. h.

3. "Интеллектуальные" препроцессоры. К старым языкам добавляются более современные возможности управления выполнением программы и работы со сложными структурами данных. Например, с помощью таких препроцессоров можно использовать встроенные макросы для построения циклов while или условных конструкций, отсутствующих в языке программирования.

4. Языковые расширения. Примером может послужить язык Equel ([413])— язык запросов к базе данных, внедренный в код С. Препроцессор получает инструкции, начинающиеся с # # (это инструкции доступа к базе данных, не имеющие никакого отношения к С), и переводит их в вызовы процедур, реализующих обращения к базе данных.

Обработчики макросов работают с двумя видами инструкций — определение макросов и их использование. Определения обычно указываются с помощью определенного символа или ключевого слова типа define или macro и состоят из имени определяемого макроса и его тела, формируя определение макроса. Зачастую макропроцессоры позволяют применять в определениях макросов формальные параметры, т.е. символы, заменяемые значениями при использовании макроса (в данном контексте "значение" — строка символов). Использование макроса представляет собой его имя с фактическими параметрами, т.е. значениями для подстановки вместо формальных параметров. Макропроцессор подставляет в тело макроса фактические значения вместо формальных параметров; затем преобразованное тело макроса замещает его имя в программе.

Пример 1.2

Т_ЕХ, о котором упоминалось в разделе 1.2, позволяет работать с макросами. Определение макроса имеет вид

\define <имя макроса> <шаблон> {<тело>}

Имя макроса представляет собой строку символов, начинающуюся с обратной косой черты. Шаблон — строка символов, в которой строки типа #1, #2 ... #9 рассматриваются как формальные параметры. Эти символы могут появляться в теле макроса сколько угодно раз. Например, следующий макрос определяет ссылку на Journal of the ACM.

\define \JACM #1;#2;#3.

{{\s1 J. ACM} {\bf #1}:#2, pp. #3.}

Имя макроса— \JACM, а шаблон—"#1; #2; #3."; точки с запятой разделяют отдельные параметры, а за последним параметром следует точка. Использование такого макроса должно иметь тот же вид, что и шаблон, с тем отличием, что вместо формальных параметров могут использоваться произвольные строки.⁴ Таким образом, мы можем записать

\JACM 17;4;715-728.

и получить при этом

J. АСМ 17:4, pp. 715-728.

Часть тела макроса { \ s1 J. АСМ} обеспечивает вывод текста J. АСМ наклонным (slanted⁵) шрифтом. Выражение {\bf #1} говорит о том, что первый фактический параметр должен быть выведен полужирным шрифтом (boldface). Этот параметр представляет собой номер тома журнала.

Т_ЕХ. позволяет использовать любые знаки пунктуации или строки текста для разделения тома, выпуска и номеров страниц в определении макроса \JACM. Можно обойтись и без разделителей — в этом случае Т_ЕХ будет считать фактическими параметрами отдельные символы или строки, взятые в фигурные скобки {} .

Ассемблеры

Некоторые компиляторы создают ассемблерный код, как в (1.5), который передается для дальнейшей обработки ассемблеру. Другие компиляторы самостоятельно выполняют работу ассемблера, производя перемещаемый машинный код, который непосредственно передается загрузчику/редактору связей. Читатель наверняка знает, как выглядит ассемблерный код и что такое ассемблер. Здесь же мы рассмотрим отношения между ассемблерным и машинным кодами.

Ассемблерный код представляет собой мнемоническую версию машинного кода, в которой вместо бинарных кодов операций используются их имена; кроме того, адресам памяти также могут присваиваться имена. Типичная последовательность инструкций выглядит как

MOV a, R1

ADD #2, R1 (1.6)

MOV R1, b

Этот код перемещает содержимое памяти по адресу а в регистр 1, затем добавляет к нему константу 2, рассматривая содержимое регистра 1 как число с фиксированной точкой, и сохраняет результат в именованной ячейке памяти b. Таким образом вычисляется b:= а+2.

Имеет ли язык ассемблера возможности работы с макросами, зависит от типа ассемблера.

Двухпроходный ассемблер

Простейший ассемблер делает два прохода по входному потоку (в данном случае проход — разовое считывание входного файла). При первом проходе находятся все идентификаторы, обозначающие ячейки памяти, и размещаются в таблице символов (отличной от таблицы символов компилятора). Идентификаторам назначаются адреса в памяти, так что после чтения (1.6) таблица символов может содержать записи, показанные на рис. 1.12. Мы предположили, что для каждого идентификатора выделяется одно слово памяти, состоящее из четырех байт, и адреса начинаются с нулевого адреса.

Идентификатор Адрес

а 0

b 4

Рис. 1.12. Таблица символов ассемблера с идентификаторами из (1.6)

При втором проходе ассемблер вновь сканирует входной поток. В этот раз он переводит каждый код операции в последовательность битов, представляющих операцию на машинном языке, а каждый идентификатор— в адрес, назначенный идентификатору в таблице символов.

В результате второго прохода обычно получается перемещаемый (relocatable) машинный код, что означает, что он может быть загружен в память с любого стартового адреса L. Если L будет добавлено ко всем адресам в коде, то все ссылки будут совершенно корректны. Таким образом, выходной код ассемблера должен различать части инструкций, ссылающиеся на адреса, которые могут быть перенесены.

Пример 1.3

Далее следует гипотетический машинный код, в который переводятся инструкции из (1.6).

0001 01 00 00000000 *

0011 01 10 00000010 (1.7)

0010 01 00 00000100 *

Инструкция представлена в виде слова, в котором первые четыре бита являются кодом инструкции (0001, 0010 и 0011 соответствуют загрузке, сохранению и сложению). Под загрузкой и сохранением подразумевается перемещение из памяти в регистр и наоборот. Следующие два бита определяют используемый регистр; 01 означает, что во всех трех командах используется первый регистр. Два последующих бита определяют "дескриптор". 00 означает режим обычной адресации, при котором последующие восемь бит представляют собой адрес памяти; дескриптор 10 указывает на "непосредственный" режим, когда последующие восемь бит являются операндом. Этот режим используется во второй команде (1.7).

В (1.7) есть также символ "*"— бит перемещаемости— который имеется у каждого операнда в перемещаемом машинном коде. Предположим, что адресное пространство содержит данные, загруженные начиная с адреса L. В этом случае символ * означает, что L должно быть добавлено к адресу операнда. Таким образом, если L=00001111, т.е. 15, то а и b размещаются по адресам 15 и 19. Теперь (1.7) в абсолютном (или непереме-щаемом) машинном коде будет выглядеть как

0001 01 00 00001111

0011 01 10 00000010 (1.8)

0010 01 00 00010011

Заметьте, у второй команды в (1.7) нет связанного бита перемещаемости, поэтому во второй команде прибавления L не происходит (так как, по сути, восьмибитовое значение представляет собой не адрес 2, а константу 2).

Загрузчики и редакторы связей

Обычно программа, называемая загрузчиком, выполняет две функции — загрузку и редактирование связей. Процесс загрузки заключается в получении перемещаемого машинного кода, изменении перемещаемых адресов, как было описано в примере 1.3, и размещении измененных команд и данных по корректным адресам в памяти.

Редактор связей позволяет собрать единую программу из нескольких файлов с перемещаемым машинным кодом. Эти файлы могут быть результатом различных компиляций; один или несколько из них могут представлять собой библиотечные файлы подпрограмм, предоставляемых системой и доступных любой программе.

Если эти файлы используются вместе, то необходимы внешние ссылки, благодаря которым код одного файла ссылается на содержимое другого. Такая ссылка может указывать на данные, определенные в одном файле и использованные в другом, или представлять собой точку входа процедуры, находящейся в одном файле и вызываемой из другого. Файл с перемещаемым машинным кодом должен содержать информацию в таблице символов для каждого данного или инструкции, на которые могут иметься внешние ссылки. Если заранее неизвестно, на что именно в коде могут иметься ссылки, то в качестве части перемещаемого машинного кода должна включаться полная ассемблерная таблица символов.

Например, код (1.7) должен предваряться таблицей

a 0

b 4

Если загружается файл с кодом (1.7), ссылающимся на Ь, то эта ссылка будет заменена на 4 плюс смещение, на которое перемещены данные из файла (1.7).

<<< < Предыдущая 1 2 34 / 84 5 6 7 8 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
08.05.2019171.01 Кб51BZhD_modul_2.doc
#
20.04.2015233.47 Кб82c-rigra.doc
#
23.03.20161.36 Mб502ChM_Laboratorny_praktikum_s_ispravleniami.pdf
#
23.03.2016357.17 Кб7Chumakin.pdf
#
23.03.2016328.16 Кб23cMS_lec.pdf
#
09.11.2018108.47 Кб12compilers.docx
#
23.03.201629.39 Mб11Dinox 2013 рус.pdf
#
20.04.201588.58 Кб16document.doc
#
01.05.20255.58 Mб0Donchenko_i_Nadykta_bezopasnost_pischevykh_prod...doc
#
24.05.20152.52 Mб1583Dzhaggernaut_metod_2_0.pdf
#
23.03.2016203.81 Кб9EECS-2006-1.pdf