2.8 Способы построения лексических анализаторов

Имеется три основных способа реализации лексического анализатора.

Использование генератора лексических анализаторов, такого как LЕХ, для создания лексического анализатора по спецификациям, основанным на регулярных выражениях. В этом случае генератор предоставляет функции для чтения и буферизации ввода.
Написание лексического анализатора на подходящем языке программирования с использованием возможностей ввода – вывода этого языка для чтения входной информации.
Написание лексического анализатора на языке ассемблера и явное управление процессом чтения входной информации.

Эти методы перечислены в порядке усложнения их реализации. К сожалению, более трудные для реализации подходы часто дают более быстрые лексические анализаторы [3].

LEX — программа для генерации лексических анализаторов. Входной язык содержит описания лексем в терминах регулярных выражений. Результатом работы LEX является программа на некотором языке программирования, которая читает входной файл (обычно это стандартный ввод) и выделяет из него последовательности символов (лексемы), соответствующие заданным регулярным выражениям.

Принцип работы LEX достаточно прост: на вход ей подается текстовый файл, содержащий описания нужных лексем в терминах регулярных выражений, а на выходе получается файл с текстом исходной программы сканера, на заданном языке программирования (обычно — на С). Текст исходной программы сканера может быть дополнен вызовами любых функций из любых библиотек, поддерживаемых данным языком и системой программирования. Таким образом, LEX позволяет значительно упростить разработку лексических анализаторов, практически сводя эту работу к описанию требуемых лексем в терминах регулярных выражений.

Вопросы

1. Что представляет собой входной алфавит следующих языков программирования: Pascal, C, Lisp?

2. Какие существуют соглашения по использованию пробелов в каждом из языков, указанных в п.1?

3. Какую роль выполняет лексический анализ в процессе компиляции?

4. Как могут быть связаны между собой лексический и синтаксический анализ?

5. Почему большинство современных компиляторов используют фазу лексического анализа, при том, что она является необязательной?

3. Определение лексем

В определении лексем важную роль играют регулярные выражения. Каждый шаблон соответствует множеству строк, так что регулярные выражения можно рассматривать как имена таких множеств.

3.1 Строки и языки

Алфавит, или класс символов, обозначает любое конечное множество символов. Типичным примером символов могут служить буквы или алфавитно-цифровые символы. Множество {0,1} представляет собой бинарный алфавит. ASCII является примером компьютерного алфавита.

Строка над некоторым алфавитом – это конечная последовательность символов, взятых из алфавита. В теории языков термин предложение и слово часто используются как символы термина “строка”. Длина строки s, обычно обозначаемая как │s│, равна количеству символов в строке. Например, длина строки banana равна шести.

Пустая строка, обозначаемая как λ ( или ε), представляет собой специальную строку нулевой длины.

Язык обозначает произвольное множество строк над некоторым фиксированным алфавитом. Например, {λ} - множество, содержащее только пустую строку.

<<< < Предыдущая 1 2 3 4 5 67 / 587 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.04.20251.3 Mб3Вроде экзамен.doc
#
22.12.2018776.19 Кб54ВСЕ 2003.doc
#
25.08.20191.15 Mб74Всё о Кофе.docx
#
22.03.2015219.98 Кб126все ответы по фее. 1-60.docx
#
01.03.20251.38 Mб8все п практическим АФХД.doc
#
31.10.20182.51 Mб244Все_пособие_редактир.doc
#
19.09.2019555.1 Кб35вторая 20.docx
#
25.09.201933.73 Кб35вторая глава 2 вариант.docx
#
02.08.201975.26 Кб86Второстепенные члены предложения.doc
#
19.08.2019109.06 Кб38ВУК 1.doc
#
19.08.2019134.14 Кб5ВУК 2.doc