Построение регулярного выражения для языка, заданного леволинейной грамматикой

Имеем леволинейную грамматику G(VT,VN,P,S), необходимо найти регулярное выражение над алфавитом VT, определяющее язык L(G), заданный этой грамматикой.

В данном случае преобразование не столь элементарно. Выполняется оно следующим образом:

1. Обозначим символы алфавита нетерминальных символов VN следующим образом: VN - {XI, Х2, ..., Хп}. Тогда все правила грамматики будут иметь вид: Xi-»Xjy или Xi-»y Xi.XjeVN, yeVT*; целевому символу грамматики S будет соответствовать некоторое обозначение Xk.

2. Построим систему уравнений с регулярными коэффициентами на основе переменных Х1,Х2,...,Хn:

Xi = а₀₁ + XiCtu + Х₂а₂₁ + ... + Х_па_п1

коэффициенты а₀₁, а₀₂,..., о._0п выбираются следующим образом: a₀_i = (yi + у₂ + ⁺ - ⁺ Ут). если во множестве правил Р грамматики G существуют правила Xj-yyi|y₂|...|y_m, и a₀_i = 0, если правил такого вида не существует;

коэффициенты a1, a_j₂, ..., a,j_n для некоторого j выбираются следующим образом: Oji = (у! + у₂ + ... + у_т), если во множестве правил Р грамматики G существуют правила X_i-»X_jy₁|Xjy₂ ...|Xjy_m, и Xjj = 0, если правил такого вида не существует.

3. Находим решение построенной системы уравнений.

Доказано, что решение для X_k (которое обозначает целевой символ S грамматики G) будет представлять собой искомое регулярное выражение, обозначающее язык, заданный грамматикой G. Остальные решения системы будут представлять собой регулярные выражения, обозначающие понятия грамматики, соответствующие ее нетерминальным символам. В принципе для поиска регулярного выражения, обозначающего весь язык, не нужно искать все решения — достаточно найти решение для X_k, если выражения для понятий грамматики не представляют отдельного интереса.

Например, рассмотрим леволинейную грамматику, определяющую язык десятичных чисел с плавающей точкой G({".", "-", "+", "О", "1". "2", "3", "4", "5", "6", "7", "8", "9"}, {<знак>, <дробное>, <целое>, <число>},Р,<число>):

Обозначим символы множества VN = {<знак>, <дробное>, <целое>, <число>} соответствующими переменными Х-1, получим: VN = {Х1 Х₂, Х₃, Х₄}.

Построим систему уравнений на основе правил грамматики G:

Эта система уравнений уже была решена выше. В данном случае нас интересует только решение для Х₄, которое соответствует целевому символу грамматики G <число>.

Решение для Х₄ может быть записано в виде:

Х₄ = (“-“ + “+" + λ.) ("."(0+1+2+3+4+5+6+7+8+9) + (0+1+2+3+4+5+6+7+8+9)(0+1+2+3+ +4+5+6+7+8+9)*"." + (0+1+2+3+4+5+6+7+8+9)) (0+1+2+3+4+5+6+7+8+9)*

Это и есть регулярное выражение, определяющее язык, заданный грамматикой G.

Связь регулярных выражений и конечных автоматов

Регулярные выражения и конечные автоматы связаны между собой следующим образом:

--- для любого регулярного языка, заданного регулярным выражением, можно построить конечный автомат, определяющий тот же язык;

--- для любого регулярного языка, заданного конечным автоматом, можно получить регулярное выражение, определяющее тот же язык.

Ниже будет рассмотрен алгоритм, реализующий построение конечного автомата по регулярному выражению. Алгоритм построения регулярного выражения по конечному автомату здесь не рассматривается — он не представляет интереса, поскольку, как будет показано ниже, проще построить грамматику, эквивалентную заданному конечному автомату, а потом уже найти регулярное выражение для заданного грамматикой языка (по алгоритму, который уже был выше рассмотрен) [5, 6, т. 1, 12, 26].

<<< < Предыдущая 1 2 3 4 5 6 78 / 118 9 10 11 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.202529.81 Кб0Gigienicheskaya_otsenka_doshkolnykh_uchrezhdeniy.docx
#
01.07.2025521.13 Кб0Gimnastika_dlya_rebenka_ot_1_goda_do_3_let.docx
#
01.07.202589.6 Кб0gimnastika_posle_sna.doc
#
26.09.2019497.15 Кб6gk_rf.doc
#
20.11.201853.7 Кб1Glagoly_individ_spryazhenia.docx
#
01.07.2025339.97 Кб1Glava10 r.doc
#
01.07.2025450.56 Кб0Glava11 r.doc
#
01.07.2025737.28 Кб0Glava12 r.doc
#
01.07.2025493.06 Кб1Glava13 r.doc
#
01.07.2025548.35 Кб0Glava14 r.doc
#
29.08.2019140.29 Кб2glava3_beremennost.doc