Использование автомата для решения задачи идентификации слов (различные классы лексем).

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

шпорки.docx

Скачиваний:

Добавлен:

01.04.2025

Размер:

352.68 Кб

Скачать

☆

<<< < Предыдущая 1 2 34 / 114 5 6 7 8 9 10 11 > Следующая >>>

Использование автомата для решения задачи идентификации слов (различные классы лексем).

Пара, класс символа и его значение, поступают на вход сканера, который выбирает для анализа тот ее элемент, который наиболее удобен в данный момент. Например, при анализе идентификатора удобнее манипулировать понятием "буква", тогда как при анализе действительного числа можно сразу смотреть значение буквы "E" или "e", означающей начало порядка. Следует также отметить, что во всех дальнейших рассуждениях будем считать, что понятия "буква" и "цифра" являются терминалами, как полученные в транслитераторе до начала лексического анализа. В предыдущей трактовке эти понятия считались нетерминальными символами.

Классификация лексем

Пусть дан алфавит: {a, b, c, i, l, }, где - символ окончания цепочки (обобщенный символ разделителя)

Задана грамматика: call, all, ill, ball, cab. Пусть ε – начальное состояние. Ошибочное состояние будем обозначать: 100

Способ 1: Таблица переходов

	a	B	C	I	l
Ε	‘a’	‘b’	‘c’	‘i'	100
‘a’	100	100	100	100	‘al’
‘al’	100	100	100	100	‘all’
‘all’	100	100	100	100	100	Распознали слово
‘c’	‘ca’	100	100	100	100
‘ca’	100	‘cab’	100	100	‘cal’
‘cab’	100	100	100	100	100	Распознали слово
‘cal’	100	100	100	‘call’	100
‘call’	100	100	100	100	100	Распознали слово
…

Можно сохранять только значащие переходы

Достоинство: простота

Недостатки:

Неэффективное использование памяти
Невозможность расширения

Первый недостаток можно устранить, если хранить не таблицу переходов, а список.

Способ 2: Список переходов

Ε	a	10	12			"all"
	b	20		100
	c	30	20	A	21
	i	40		100
	100		21	L	22
10	l	11		100
	100		22	L	23
11	l	12		100
	100		23			"ball"
				100

Преимущество: меньшее использование памяти

Способ 3: Список переходов (более оптимальный вариант)

ε	a	10	10	L		20	a		30	a	31	31	l
	b	20		L			l			b			l
	c	30			"all"		l				"cab"			"call"
	i	40		100				"ball"		100			100
	100						100

Преимущество: легко расширяемый автомат

Недостаток: полезен только тогда, когда слова начинаются с разных букв

Проблема: есть состояние, которое соответствует начальному состоянию, где перечислены все буквы, с которых могут начинаться слова.

Арифметические операции

К арифметическим операциям можно отнести и зарезервированные слова: div, not, and, xor, or.

+ - * /

< > =

<= >= <>

Автомат: {<, >, =, }

		<	>	=
	ε	“<”	“>”	“=”
1	<	100	“>”	“=”	“<”
2	<=	100	100	100	“<=”
3	<>	100	100	100	“<>”
4	>	100	100	“=”	“>”
5	>=	100	100	100	“>=”
6	=	100	100	100	“=”

Правила

Обозначения:

* - повторяется некоторое количество раз

? – может быть либо один раз, либо ни разу (для обозначения регулярной цепочки)

( )? и [ ] – эквивалентны

[+|-]digit*

Примеры: +1, -1, 0, +10

num digit*(.digit*)?(E(+|-)?digit)?

Пример: 10.875E-25

id letter((letter|digit)*)? // для идентификаторов

<<< < Предыдущая 1 2 34 / 114 5 6 7 8 9 10 11 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
16.09.201991.38 Кб39шпора.специальная.docx
#
01.03.2025607.72 Кб1Шпора1.docx
#
19.11.201984.48 Кб21шпорка вир инф.doc
#
18.09.20191.31 Mб3шпорка.docx
#
01.04.2025135.68 Кб0Шпорки статистикс.docx
#
01.04.2025352.68 Кб0шпорки.docx
#
01.05.202575.26 Кб0шпоры по финансовой математике.doc
#
11.09.201942.1 Кб5шпоры 1-15.docx
#
01.04.2025245.69 Кб0шпоры 2.docx
#
15.04.2019555.01 Кб5шпоры бд.doc
#
23.09.2019119.64 Кб1шпоры бух.docx