Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТЯП, ТВП / ТЯПМТ / Пособие.doc
Скачиваний:
161
Добавлен:
11.05.2015
Размер:
2.37 Mб
Скачать

2.2. Синтаксис и семантика

Перевод обычно рассматривают как композицию двух более простых отображений. Первое из них, называемое синтаксическим отображением, связывает с каждым выходом (программа на исходном языке) некоторую структуру, которая служит аргументом второго отображения, называемого семантическим.

Почти всегда структурой любой программы является помеченное дерево. Поэтому сущность алгоритмов перевода обычно сводится к построению подходящих деревьев для входных программ

Рис. 2.1. Древовидная структура английского предложения

В качестве примера, как для цепочек строятся эти деревья, рассмотрим разбиение английского предложения на синтаксические категории (рис. 2.1).

The pig is in the pen.

Неконцевые вершины этого дерева помечены синтаксическими категориями, а концевые (листья), помечены концевыми, или терминальными, символами, в данном случае – английскими словами.

Аналогично можно программу, написанную на языке программирования, расчленить на синтаксические компоненты в соответствии с синтаксическими правилами, управляющими этим языком (рис. 2.2).

Пример.

Цепочка a+b*c.

Рис. 2.2. Дерево арифметического выражения

Процесс нахождения синтаксической структуры данного предложения называется синтаксическим анализом, или синтаксическим разбором.

Синтаксический разбор позволяет понять взаимоотношения между различными частями предложения. Термином «синтаксис» языка будем называть отношения, связывающие с каждым предложением языка некоторую синтаксическую структуру, тогда правильное предложение языка можно определить как цепочку символов, синтаксическая структура которой соответствует категории «предложение».

Естественно, нам нужно более строгое определение синтаксиса. Что и будет сделано позднее.

Вторая часть перевода – семантическое отображение, оно отображает структурированный вход в выход, который обычно является программой на машинном языке.

Термином «семантика языка» будем называть отображение, связывающее с синтаксической структурой каждой входной цепочки цепочку в некотором языке, рассматриваемую как «смысл» первоначальной цепочки.

Строгой теории синтаксиса и семантики пока еще нет, однако для простых случаев – языков программирования - есть два понятия, которые можно используются для разборки части необходимого описания.

Первое из них – понятие контекстно – свободной(КС) грамматики. В виде контекстно – свободной грамматики можно формализовать большую часть правил, предназначенных для описания синтаксической структуры.

Второе понятие – схема синтаксически управляемого перевода, с помощью которого можно задавать отображение одного языка в другой.

Оба этих понятия – цель дальнейшего изучения.

2.3. Процесс компиляции

Практически для всех компиляторов есть некоторые общие процессы, попробуем их выделить.

Исходная программа, написанная на некотором языке, есть цепочка знаков. Компилятор превращает эту цепочку знаков в цепочку битов – объектный код. В этом процессе превращения можно выделить следующие подпроцессы:

  1. лексический анализ;

  2. работа с таблицами;

  3. синтаксический анализ или разбор;

  4. генерация кода или трансляция в промежуточный код (например, Ассемблер);

  5. оптимизация кода;

  6. генерация объектного кода.

В конкретных трансляторах состав и порядок этих процессов может отличаться.

Кроме того, транслятор должен быть построен так, что никакая цепочка не может нарушить его работоспособности, т.е. он должен реагировать на любые из них («защита от дурака»).

Кратко рассмотрим каждый из этих процессов.