Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Государственный университет — учебно-научно-производственный комплекс (бывш. ОрелГТУ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Шпоры по тяпу.docx

Скачиваний:

Добавлен:

01.04.2025

Размер:

807.52 Кб

Скачать

☆

1 / 181 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 > Следующая >>>

1. Операции над языками. Регулярные выражения.

На этапе лексического анализа необходимо распознавать, к какому классу принадлежит данная лексема. Задача состоит в построении лексических символов. Для каждого слова определяется формальный язык – множество последовательностей символов. Эти множества можно определять по индукции, т. е. берем базовое множество символов (элементов языка), а затем из них строим слова. В качестве базовых элементов могут выступать буквы или цифры.

Над множеством строк можно выполнять следующие операции:

1) Объединение (альтернатива). Если заданы два языка L и M, то объединением этих языков будет множество строк, каждое из которых принадлежит L или M:

L  M = {s | s  L  s M}

2) Конкатенация (сцепление строк). Если заданы языки L и M, то их конкатенацией будет язык, элементы которого получены путем приписывания элементу из L элемента из M:

LM = { append(s₁, s₂) | s₁ L  s₂ M}

Если L – это цифра, а M – буква, то LM = {“a1”, “a2”, …}

3) Замыкание Клини (итерация): обозначается как L^*и получается объединением всех языков Lⁱ, где 0 ≤ i ≤ ∞ .

L⁰  L¹  L² … L^* = ^∞_i₌₀Lⁱ

где L¹= L, L² = LL (кусочки по два элемента), L³ = LL², L⁰ =  - пустая строка.

4) Положительное замыкание Клини (без пустой строки):

L⁺ = ^∞_i₌₁Lⁱ

Такими операциями определяется язык, на основе которого строятся лексические единицы.

Формальные языки можно определить, пользуясь регулярными выражениями. С их помощью можно показать, как строятся элементы языка. Регулярные выражения над алфавитом  определяются индуктивно.

Операции, используемые в регулярных выражениях:

1)  (пустая строка) – это регулярное выражение, обозначающее множество, состоящее из одной пустой строки {}.

2) если a  , то a является регулярным выражением, обозначающим язык, содержащий один символ a - {a}.

3) если r и s – регулярные выражения, обозначающие языки, то L(r) и L(s), то можно построить следующие варианты выражений:

- (r) – регулярное выражение

- r|s – объединение (альтернатива) L(r)  L(s)

- rs – конкатенация L(r)L(s)

- r^* - регулярное выражение, обозначающее замыкание Клини L(r)*

Приоритет операций: замыкание Клини, конкатенация, альтернатива.

Цифра: (0|1|2|3…9)

Идентификатор: буква (буква | цифра)^*.

Для каждого регулярного выражения можно построить НКА, для любого НКА можно построить ДКА, ДКА можно минимизировать, т.е. находить автомат с минимальным числом состояний.

2. Недетерминированный конечный автомат: формальное определение, построение множества достижимых состояний.

Если язык задан регулярными выражениями, то для него можно построить конечный автомат.

КА представляется диаграммой переходов. Узлы - состояния, дуги – переходы, финальное состояние - двойной кружок (рис. конечный автомат для (a+b)*). Цепочка принимается автоматом, если существует путь из начального состояния в конечное, метки дуг которого формируют эту цепочку.

Автомат называется недетерминированным, если у него есть переходы из одного и того же состояния, помеченные одним и тем же символом, и если в нем присутствуют  - переходы.

Формально КА определяется пятеркой <S, , , s₀, F>,

S – конечное множество состояний;

 – конечное множество входных символов (алфавит);

d – отношение переходов, это подмножество S на Σ, к которому добавлена пустая строка;   s ×(  {})×s

s₀ – начальное состояние; s₀ S

F  S – множество финальных состояний.

Для каждой пары (начальное состояние и входной символ) можно определить множество конечных состояний.

Считая  функцией, через  (s,а) будем обозначать множество состояний, в которые конечный автомат может перейти из состояния s по входному сигналу а. Пользуясь функцией , можно описать поведение конечного автомата.

Функция переходов -  определяет для заданного состояния s и входной последовательности w множество состояний, в которых может оказаться автомат, обработав входную строку w. Определяется:

1) s’ (S,) если s’  (s, )

2) s’ (S,) если есть путь по  переходам, т.е. если есть состояние s’’  (S,) и одновременно s’  (s’’,)

3) когда строка не пустая: s’ (S,aw), если есть состояние s’’  (s, а) и s’ (s’’,w).

Язык распознается конечным автоматом, если он является множеством последовательностей:

Например, автомат A = <S, Σ, δ, s_o, F> распознаёт последовательности (язык):

L(A) { w | Δ(s₀,w) ∩ F ≠ ∅ }, если автомат детерминированный: L(A) { w | Δ(s₀,w) ∈ ∅ }.

1 / 181 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
27.04.201954.75 Кб4шпоры на теоретические вопросы труна.docx
#
28.03.20154.13 Mб467ШПОРЫ ОХТ.docx
#
01.04.2025995.95 Кб6Шпоры печать.docx
#
29.08.2019393.22 Кб11шпоры по вопросам.doc
#
25.09.2019402.43 Кб15шпоры по информатике.doc
#
01.04.2025807.52 Кб3Шпоры по тяпу.docx
#
26.09.2019464.38 Кб7шпоры по физике.doc
#
24.12.2018189.44 Кб7шпоры по экономике.doc
#
01.05.2025109.06 Кб3шпоры упр нед.doc
#
01.04.2025170.13 Кб4Шпоры экономика.docx
#
28.03.201558.91 Кб16шпоры.docx