3.4 Регулярные определения

Для удобства записи регулярным выражениям можно давать имена и определять регулярные выражения с использованием этих имён так, как если бы это были символы. Если А является алфавитом базовых символов, то регулярное определение представляет собой последовательность вида

d₁→r₁

d₂→r₂

. . .

D_n→r_n

где каждая d_i – индивидуальное имя, а каждое r_i– регулярное выражение над символами из А U{d₁, d₂, …, d_i_-1}, т.е. базовыми символами и уже определенными именами. Ограничивая каждое r_i, символами из А и ранее определенными именами, можно построить регулярное выражение над А для любого r_i, заменяя (возможно, неоднократно) имена регулярных выражений обозначенными ими именами. Если r_iиспользует d_j для некоторого j≥i, то r_iможет оказаться определенно рекурсивно, и подстановка никогда не завершиться.

Для того чтобы отличить имена от символов, имена в регулярных выражениях выделяются полужирным шрифтом.

Пример 5

Множество идентификаторов Pascal представляет собой множество строк из букв и цифр, начинающихся с буквы. Регулярное определение этого множества:

letter →	A │ B │ . . . │ Z │ a │ b │ . . . │z
digit →	0 │ 1 │ . . . │ 9
id →	letter (letter │ digit)^*

Замечание

Не все языки могут быть описаны регулярными выражениями. Регулярные выражения не могут быть использованы для описания сбалансированных или вложенных конструкций. Например, с одной стороны, множество всех строк из сбалансированных скобок не может быть описано регулярным выражением. С другой стороны, это множество может быть описано посредством контекстно-свободной грамматики.

Регулярные выражения могут использоваться для описания только фиксированного количества повторений данной конструкции.

3.5 Распознавание лексем и регулярные выражения

Рассмотрим пример языка, порождаемого следующей грамматикой.

Пример 6

Рассмотрим следующий фрагмент грамматики:

stmt	→	if expr then stmt
	│	if expr then stmt else stmt
	│	λ
expr	→	term relop term
	│	term
term	→	id

где терминалы if, then, else, relop, id и num порождают множество строк, задаваемых следующими регулярными определениями:

if→	if
then→	then
else→	else
relop→	< │ <= │ = │ <> │ > │ >=
id→	letter ( letter │ digit ) *

где letter и digit определены так же, как и ранее.

Для этого фрагмента языка лексический анализатор будет распознавать ключевые слова if,then,else,а также лексемы, обозначенные relop, id. Для простоты считаем, что ключевые слова зарезервированы и, таким образом, не могут использоваться в качестве идентификаторов.

Цель – построение лексического анализатора, который сможет выделять из входного очередную лексему и, используя таблицу трансляции на рис. 8, выдавать пары, состоящие из значения лексемы и атрибута-значения. Атрибут-значение для операторов отношения определяется символическими константами LT,LE,EQ,NE,GT,GE.

Регулярное выражение	Лексема	Атрибут-значение
ws	–	–
if	if	–
then	then	–
else	else	–
Id	id	указатель на запись в таблице
num	num	указатель на запись в таблице
<	relop	LT
<=	relop	LE
=	relop	EQ
<>	relop	NE
>	relop	GT
>=	relop	GE

Рис. 8. Шаблоны регулярных выражений для лексем

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 589 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
27.12.20191.3 Mб0Вроде экзамен.doc
#
22.12.2018776.19 Кб45ВСЕ 2003.doc
#
25.08.20191.15 Mб63Всё о Кофе.docx
#
22.03.2015219.98 Кб116все ответы по фее. 1-60.docx
#
30.11.20191.38 Mб2все п практическим АФХД.doc
#
31.10.20182.51 Mб225Все_пособие_редактир.doc
#
19.09.2019555.1 Кб30вторая 20.docx
#
25.09.201933.73 Кб31вторая глава 2 вариант.docx
#
02.08.201975.26 Кб75Второстепенные члены предложения.doc
#
19.08.2019109.06 Кб36ВУК 1.doc
#
19.08.2019134.14 Кб5ВУК 2.doc