37. Регулярные языки и автоматы—распознаватели. Поиск языка автомата распознавателя с помощью итерации матрицы смежности.

Регулярные языки порождаются регулярными грамматиками, для которых АаВ или Аа, где а — либо терминал, либо пустая цепочка (В — нетерминал).

Множество регулярных языков равномощно множеству натуральных чисел, т.е. оно счётное.

Автоматом-распознавателем называется упорядоченная четвёрка , где — ориентированный мультиграф, S — входы, а T — выходы.

Для поиска языка автомата достаточно вычислить матрицу стоимостей автомата. Вычислим итерации с помощью систем линейных уравнений. Нам понадобится решить n = |Q| систем вида E_j = AE_j + ε_j, где А – квадратная матрица n-го порядка, элемент a_ij которой является регулярным выражением, служащим меткой дуги из вершины q_i в вершину q_j, если такая дуга существует, и равен регулярному выражению , если нет такой дуги; E_j – j-й столбец единичной матрицы, т.е. столбец, у которого все компоненты, кроме j-й, равны (нулю полукольца R(V)), а j-я компонента равна λ (единице полукольца R(V)). Решив указанные n систем, найдем матрицу стоимостей C = A* заданного конечного автомата. Но нам нужна не вся матрица стоимостей, а только элементы вида c_st, где s – номер начального, а t – один из номеров заключительного состояния. Поэтому, вместо того чтобы решать несколько систем линейных уравнений, достаточно решить одну: E = AE + β, где β – столбец, все компоненты которого равны (нулю полукольца R(V)), кроме компонент с номерами t₁,…,t_m, которые являются номерами заключительных состояний. Эти компоненты равны λ (единице полукольца R(V)). Другими словами, ко всем компонентам системы, соответствующим заключительным состояниям, добавляется слагаемое λ.

Решение системы будет иметь вид: E = A* β = A* , …, , λ, , …, , λ, , …, )^T

(Элементы λ находятся в строках с номерами t₁, …, t_m). В этой формуле, умножая матрицу А*, равную матрице С стоимостей, на столбец β, получим столбец, s-я компонента которого x_s будет равна произведению s-й строки матрицы С (c_s₁, …, c_st₁, …, c_stm, …, c_sn) на столбец β в этой формуле, т.е. x_s = c_st₁ + … + c_stm. Это и есть регулярное выражение, обозначающее язык конечного автомата.

38. Лемма о разрастании для регулярных языков, пример нерегулярного языка.

Лемма о разрастании регулярных языков утверждает, что любой регулярный язык допускает представление всех своих достаточно длинных цепочек в виде соединения трех цепочек, причем средняя цепочка из этих трех не пуста, ограничена по длине, и ее “накачка” – повторение любое число раз – или выбрасывание не выводит за пределы языка (т.е. дает цепочки, принадлежащие данному регулярному языку).

Лемма: Если L – регулярный язык, то существует натуральная константа k_L (зависящая от L), такая что для любой цепочки x L, длина которой не меньше k_L, x допускает представление в виде x = uvw, где v λ и |v| k_L, причем для любого n 0 цепочка x_n = uvⁿw L.

Док-во: Поскольку язык L регулярен, то, согласно теореме Клини, существует конечный автомат M = (V, Q, q₀, F, ), допускающий его, т.е. L = L(M). Положив k_L = |Q|, т.е. введя константу k_L как число состояний конечного автомата М, фиксируем произвольно цепочку x L, длина l которой не меньше k_L. Так как l > 0, то цепочка x не является пустой, и мы можем положить x = x(1)…x(l), l > 0.

С огласно теореме о детерминизации, автомат M является детерминированным, следовательно, существует единственный путь, ведущий из начального состояния q₀ в одно из заключительных состояний q_f, на котором читается x.

Так как длина l цепочки x не меньше числа состояний M, то есть числа всех вершин графа M, то, поскольку число вершин в любом пути ровно на единицу больше числа дуг в этом пути (т.е. длины пути), число вершин в рассмотренном выше пути будет больше, чем число всех вершин графа. Это значит, что хотя бы одна из вершин данного пути повторяется и она, таким образом, содержится в некотором контуре. Обозначим эту вершину через p. Тогда путь, несущий цепочку x, разбивается на три части: 1) путь из q₀ в p; 2) контур, проходящий через p; 3) путь из p в q_f.

Обозначим через u цепочку, читаемую на первой части пути, через v – цепочку, читаемую на контуре, а через w - цепочку, читаемую на третьей части, получим x = uvw, причем поскольку любой контур есть простой путь, то |v| k_L (длина простого пути не может быть больше, чем число вершин графа) и v λ, так как контур имеет ненулевую длину. Но теперь совершенно очевидно, что контур можно пройти любое число n раз или ни разу. В первом случае на этом пути будет прочитана цепочка uvⁿw при n > 0, а во втором цепочка uw. Таким образом, любая цепочка x_n = uvⁿw (n 0) содержится в языке L.

Пример нерегулярного языка.

L = L₁*, где L₁ = {aⁿbⁿ | n 0}. (стр. 541 Ткачев)

, к этому языку не применима лемма о разрастании.

Доказательство нерегулярности: Выберем достаточно большое и получим следующие варианты подцепочки v:

. Очевидно, что это целиком выведет за пределы языка, т.к. количество а растёт, а b — остаётся прежним.
. Аналогично.
. в данном случае возникнет вхождение подцепочки ba в слово, уже не принадлежащее нашему языку. Следовательно, язык L не регулярен

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 1112 / 1412 13 14 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
10.02.2015945.13 Кб43ekonomia_predpriatia.pdf
#
01.05.20251.22 Mб5EKONOMIChESKAYa_GEOGRAFIYa_lektsii.doc
#
09.02.20151.02 Mб51Ekonomika_dz_Petr.doc
#
01.07.202515 Mб0Ekzamen02.doc
#
01.07.2025375.14 Кб6Ekzamen_26-48 (1).docx
#
01.07.20251.03 Mб0Ekzamen_Diskra.docx
#
01.07.202511.05 Mб2Ekzamen_ekonomika_otvety.docx
#
09.02.201543.2 Кб135EKZAMEN_INFA.docx
#
01.05.202580.01 Кб7Ekzamen_po_informatike.docx
#
01.03.2025106.07 Кб22ekzamen_po_voenke_2.docx
#
19.09.201946.62 Кб30Ekzamen_voprosy_i_otvety.docx