Построение конечного автомата по регулярной грамматике

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Череповецкий Государственный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Все_пособие_редактир.doc

Скачиваний:

241

Добавлен:

31.10.2018

Размер:

2.51 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 5813 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Построение конечного автомата по регулярной грамматике

Конечный автомат является хорошей математической моделью для представления алгоритмов распознавания лексем в лексическом анализаторе. При этом источником, по которому строится конечный автомат, является регулярная грамматика (а не регулярное выражение).

Если задана регулярная грамматика G = <N, T, P, S>, правила вывода которой имеют вид: А –> аВ или А–>а, где А, В ∈ N, а ∈ Т. Тогда конечный автомат А= <V, Q, δ, q₀, F>, задающий тот же самый язык, что порождает регулярная грамматика G , строится следующим образом:

V=T;
Q=N U {Z}, Z- заключительное состояние КА, не принадлежит N и T;
q₀= {S};
F={Z}
Отображение δ строится по правилам:

- каждому правилу подстановки в грамматике G вида А –> аВ ставится в соответствие команда (А,а) –> В;

- каждому правилу подстановки в грамматике G вида А –> а ставится в соответствие команда (А,а) –> Z.

Допустим обратный переход: конечному автомату А= <V, Q, δ, q₀, F>можно поставить в соответствие регулярную грамматику G = <N, T, P, S>, у которой:

T=V;
N=Q;
S={ q₀};
Множество правил подстановки Р строится таким образом: каждой команде автомата (q_i, a) –> q_k ставится в соответствие правило подстановки q_i –> а q_k, если q_k∈Q, либо q_i –> а , если q_k∈Z, где Z – заключительное состояние.

Вопросы

1. Что называется регулярным выражением?

2. Какая существует взаимосвязь между регулярным выражением и распознаваемой лексемой?

3. Что такое регулярное множество?

4. Как можно доказать эквивалентность двух регулярных выражений?

5. Как можно доказать эквивалентность двух языков?

4. Формальные языки и грамматики

4.1 Цепочки символов. Операции над цепочками символов

Цепочка символов – это произвольная последовательность символов, записанных один за другим. Понятие символа (или буквы) является базовым в теории формальных языков.

Цепочки символов обозначаются греческими буквами: ,,.

Цепочка – это последовательность, в которую могут входить любые допустимые символы. Цепочка – это необязательно некоторая осмысленная последовательность символов. Последовательность «аввв..аагрьь ,.. лл» - тоже пример цепочки символов.

Для цепочки символов важен состав и количество символов в ней, а также порядок символов в цепочке. Один и тот же символ может произвольное число раз входить в цепочку, Поэтому цепочки «а» и «аа », а также « аб » и «ба» - это различные цепочки символов. Цепочки символов и равны (совпадают ),=, если они имеют один и тот же состав символов, одно и тоже их количество и одинаковый порядок следования символов в цепочке.

Количество символов в цепочке называется длиной цепочки. Длина цепочки символа  обозначается как |. Очевидно, что если =, то и .

Основной операцией над цепочками символов является операция конкатенации (объединения или сложения) цепочек.

Конкатенация (сложение, объединение) двух цепочек символов - дописывание второй цепочки в конец первой. Конкатенация цепочек  и  обозначается как. Выполнив конкатенацию цепочек просто: например, если= «аб», а= «вг», то  = «абвг».

Так как в цепочке важен порядок символов, то операция конкатенации не обладает свойством коммутативности, то есть в общем случае  и  такие, что ≠ Также очевидно, что конкатенация обладает свойством ассоциативности, то есть ()).

Еще одна операция - итерация (повторение) цепочки n раз, где n N, n>0-это конкатенация цепочки самой с собой n раз. Итерация цепочки n раз обозначается какⁿ . Для операции повторения справедливы следующие равенства ∀ : ¹ =, ²=, ³=, …и т.д.

Среди всех цепочек символов выделяется одна особенная - пустая цепочка. Пустая цепочка символов – это цепочка, не содержащая ни одного символа. Пустую цепочку обозначают греческой буквой  (в литературе ее иногда обозначают латинской буквой e или греческой ε ).

Для пустой цепочки справедливы следующие равенства:

 ││=0;

∀: ==;
₁;

4. ∀ n ≥ 0: ⁿ;

5. ∀ :º=.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 5813 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.04.20251.3 Mб3Вроде экзамен.doc
#
22.12.2018776.19 Кб53ВСЕ 2003.doc
#
25.08.20191.15 Mб72Всё о Кофе.docx
#
22.03.2015219.98 Кб123все ответы по фее. 1-60.docx
#
01.03.20251.38 Mб7все п практическим АФХД.doc
#
31.10.20182.51 Mб241Все_пособие_редактир.doc
#
19.09.2019555.1 Кб35вторая 20.docx
#
25.09.201933.73 Кб35вторая глава 2 вариант.docx
#
02.08.201975.26 Кб84Второстепенные члены предложения.doc
#
19.08.2019109.06 Кб37ВУК 1.doc
#
19.08.2019134.14 Кб5ВУК 2.doc