Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Донской Государственный Технический Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

trans.doc

Скачиваний:

Добавлен:

01.03.2025

Размер:

1.07 Mб

Скачать

☆

1 / 281 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Лекция № 3 теория языков и формальных грамматик

3.1 Способы определения языков

Описание языков программирования во многом опирается на теорию формальных языков. Эта теория является фундаментом для организации синтаксического анализа и перевода.

Существует два основных способа определения языков:

– механизм порождения или генератор;

– механизм распознавания или распознаватель.

Они тесно связаны. Первый обычно используется для описания языков, а второй для их реализации. Оба способа позволяют описать языки конечным образом, несмотря на бесконечное число порождаемых ими цепочек.

Неформально язык L - это множество цепочек конечной длины в алфавите T. Механизм порождения позволяет описать языки с помощью системы правил, называемой грамматикой. Цепочки (предложения) языка строятся в соответствии с этими правилами. Достоинство определения языка с помощью грамматик в том, что операции, производимые в ходе синтаксического анализа и перевода, можно делать проще, если воспользоваться структурой, предписываемой цепочкам с помощью этих грамматик.

Механизм распознавания использует алгоритм, который для произвольной входной цепочки остановится и ответит «да» после конечного числа шагов, если эта цепочка принадлежит языку. Если цепочка не принадлежит языку, алгоритм ответит «нет». Распознаватели используются непосредственно при построении синтаксических анализаторов и являются как бы их формальной моделью. Распознаватели строятся на основе теорий конечных автоматов и автоматов с магазинной памятью.

3.2 Формальные грамматики

Грамматикой называется четверка

G = (N, T, P, S), (3.1)

где N - конечное множество нетерминальных символов

(нетерминалов),

T - множество терминалов (не пересекающихся с N),

S - символ из N, называемый начальным,

Р - конечное подмножество множества, называемого множеством правил: .

Множество правил Р описывает процесс порождения цепочек языка. Элемент p_i = (, ) множества Р называется правилом (продукцией) и записывается в виде   . Здесь  и  - цепочки, состоящие из терминалов и нетерминалов. Данная запись может читаться одним из следующих способов:

– цепочка  порождает цепочку ;

– из цепочки  выводится цепочка .

Таким образом, правило P имеет две части: левую, определяемую, и правую, подставляемую. То есть правило p_i - это двойка (p_i₁, p_i₂), где p _i₁ = - цепочка, содержащая хотя бы один нетерминал, p_i₂ = произвольная, возможно пустая цепочка ( - цепочка).

Если цепочка  содержит p_i₁, то, в соответствии с правилом p_i, можно образовать новую цепочку , заменив одно вхождение p_i₁ на p_i₂. Говорят также, что цепочка  выводится из  в данной грамматике.

Для описания абстрактных языков в определениях и примерах используются следующие обозначения:

– терминалы обозначаются буквами a,b,c,d или цифрами 0,1, ...,9;

– нетерминалы обозначаются буквами A, B, C, D, S (причем нетерминал S - начальный символ грамматики);

– буквы U, V, ..., Z используются для обозначения отдельных терминалов или нетерминалов;

– через , ,  ... обозначаются цепочки терминалов и нетерминалов;

– u, v, w, x, y, z - цепочки терминалов;

– для обозначения пустой цепочки (не содержащей ни одного символа) используется знак ;

– знак «» отделяет левую часть правила от правой и читается как «порождает» или «есть по определению». Например, A  cd, читается как «A порождает cd».

Эти обозначения определяют некоторый язык, предназначенный для описания правил построения цепочек, а значит, для описания других языков. Язык, предназначенный для описания другого языка, называется метаязыком.

Пример грамматики G1:

G1 = ({A, S}, {0, 1}, P, S), (3.2)

где P:

1. S  0A1;

2. 0A  00A1;

3. A  .

Выводимая цепочка грамматики G, не содержащая нетерминалов, называется терминальной цепочкой, порождаемой грамматикой G.

Язык L(G), порождаемый грамматикой G, - это множество терминальных цепочек, порождаемых грамматикой G.

Введем отношение _G непосредственного вывода на множестве , которое записывается следующим образом:

 _G  (3.3)

Данная запись читается:  непосредственно выводима из  для грамматики G = (N, T, P, S) и означает: если  – цепочка из множества и    – правило из Р, то  _G .

Через _G⁺ обозначим транзитивное замыкание (нетривиальный вывод за один и более шагов). Тогда  _G⁺  читается как:  выводима из  нетривиальным образом.

Через _G^* обозначим рефлексивное и транзитивное замыкание (вывод за ноль и более шагов). Тогда  _G^*  означает:  выводима из .

Пусть ^K – k-я степень отношения . То есть, если  ^K , то существует последовательность ₀₁₂₃ ... _k из к+1 цепочек

 = ₀, ₁, ... _i_{- 1}  _i, 1 ≤ i ≤ k и _k =  (3.4)

Пример выводов для грамматики G1:

S  0A1  00A11  0011; (3.5)

S ¹ 0A1; S ² 00A11; S ³ 0011; (3.6)

S ⁺ 0A1; S ⁺ 00A11; S ⁺ 0011; (3.7)

S * S; S * 0A1; S * 00A11; S * 0011, (3.8)

где 0011  L(G1).

1 / 281 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
09.11.2018269.82 Кб14TMO_RGR.doc
#
01.05.20251.9 Mб3Tokarno-vintorezny_stanok_Lab_1.doc
#
01.05.2025404.99 Кб1Tom1_,без фото.doc
#
01.07.202512.43 Mб0TPAP_LEKTsIYa_2_Elementy_TP.docx
#
01.04.2025755.71 Кб2TP_н31-36.doc
#
01.03.20251.07 Mб7trans.doc
#
19.05.201534.78 Mб565Trenirovochnye_metody_Westside-Barbell.pdf
#
19.05.2015174.29 Кб11Ts-242_1_vvvpeedelanyаааа.docx
#
01.07.2025111.96 Кб0TTP-103_1-8_seminar.docx
#
29.09.201991.14 Кб3Tukhkanen_Materialy_praktiki_IEU.doc
#
01.07.20251.93 Mб1TV_Gas34_2.doc