Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Новосибирский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

бАКАЛАВР_РАБОТА.docx

Скачиваний:

Добавлен:

01.05.2025

Размер:

2.13 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 3113 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

4.1.4 Иерархия классов модуля

На рис. 4.2 представлена иерархия классов сканера. Где AbstractLexer- интерфейс, посредством которого осуществляется взаимодействие с синтаксическим анализатором;Lexer–реализацияклассаAbstractLexer;Token – класс, абстракция сущности токен; а Word , IntLiteral и FloatLiteralклассы производные от класса Tokenпредставляют лексемы с атрибутом – внутреннее представление лексемы,например целое число или строка.

Использование интерфейсного класса в архитектуре приложения даёт возможностипоменять реализацию лексического анализатора без изменения других модулей.

Рисунок 4.2– Иерархия классов лексического анализатора

Листинг этого модуля представлен в Приложении В в разделе лексический анализатор.

4.2 Синтаксический анализатор

4.2.1 Функции синтаксического анализатора

При выполнении синтаксический анализатор получает строку токенов от лексического анализатора и проверяет, может ли эта строка порождаться грамматикой исходного языка.Синтаксический анализатор также называют парсером.

В случае установления непринадлежности входной цепочки множеству цепочек порождаемых грамматикой синтаксический анализатор долженсообщить обо всех выявленных ошибках, а кроме того обработать обычные, часто встречающиеся ошибки и продолжить работу с оставшейся частью программы, т.е. произвести их нейтрализацию.

В случае корректной программысинтаксический анализатор строит дерево разбора и передаёт его следующей части языкового процессора. Явное построение дерева разбора вызвано невозможностью выполнения некоторых семантических проверок непосредственно в процессе синтаксического анализа.

4.2.2 Спецификация грамматики

Грамматика представляет собой совокупность четырех компонент:

Терминалы. Они представляют собой базовые символы, из которых формируются строки. Термин “имя токена” является синонимом слова “терминал”;
Нетерминалы. Они представляют собой синтаксические переменные, которые обозначают множество строк. Эти множества строк, обозначаемые нетерминалами, помогают определить язык, порождаемы грамматикой;
Стартовый символ.Один из нетерминалов грамматики считается стартовым символом, и множество строк, которые он обозначает, является языком, определяемым грамматикой;
Продукции. Продукции грамматики определяют способ, которым терминалы и нетерминалы могут объединяться для создания строк. Каждая продукция состоит из следующих частей:

Заголовок или левая часть продукции, обычно представлена нетерминалом;
символ →;
Тело, или правая часть, состоящая из нуля или некоторого количества терминалов и нетерминалов. Эти компоненты тела описывают один из способов, которым могут быть построены строки нетерминалов в заголовке.

По классификации Хомского разработанная грамматика языкаLISMA является контекстно-свободной(КС). На КС-грамматики распространяется единственное ограничение: вид левой части каждой продукции может быть ограничен лишь единственным нетерминальным символом. Или грамматика G[S] = <N, T, P, S> называется КС-грамматикой, если каждая ее продукция имеет вид A→β, где A N, β (N T)^*.

Для анализа грамматики выбран нисходящий метод, в котором дерево разбора строится сверху (от корня) вниз (к листьям).Это в свою очередь накладывает ограничения на вид грамматики.Класс грамматик, для которых можно использовать нисходящие методы разбора, просматривающие к символов во входном потоке, часто называются классом LL(k).

Для грамматик класса LL(k) существует ряд требований:

отсутствие левой рекурсии, т.е. отсутствие продукций вида: A→⁺Aa, где A N, а T;
наличие левой факторизации, т.е. отсутствие продукций вида: A→aB₁| aB₂, где A N, а T, B₁ (N T)^*,B₂ (N T)^*;
должна быть однозначна (обязательное требование для любой грамматики). Это означает существование единственного дерева разбора для каждой программы.

Таким образом, разработанная грамматика принадлежит к классу LL(2) без возврата с просмотром вперёд двух символов.

Просмотр вперед используется, когда в грамматиках встречаются альтернативные правила, начинающиеся с одинаковых цепочек символов. Возникающая неоднозначность может быть разрешена путем предварительного просмотра правила на символов вперед до той границы, начиная с которой данное правило можно отличить от альтернативных.

Просмотр вперед – это один из возможных вариантов упорядочивания подстановок, обеспечивающий решение проблемы недетерминированности. Наряду с ним используются: преобразование грамматик к детерминированным и анализ с возвратами.

Возвраты производятся для альтернативных правил, начинающихся с одинаковых подцепочек. В этом случае появление отказа при разборе правила ведет к восстановлению текущей позиции в то положение, в котором находился анализатор до входа в данное правило. Использование возвратов может выступать в качестве альтернативы просмотру вперед.

Привести грамматику полностью к классу LL(1) не удалось ввиду особенностей языка, но ситуации, где используется просмотр вперёд двух символов, сведены к минимуму.

Терминальный словарь грамматики представлен токенами из таблицы 4.2.

Далее представлены пронумерованные (двойной номер обозначает альтернативные продукции) продукции грамматики в форме Бэкуса-Наура (BNF) с названием языковых конструкций, в некоторых случаях с комментариями. Все терминалы обозначены строками из прописных символов и выделены жирным шрифтом,нетерминалы обозначаются строками из строчных символов. Отдельно выделены продукции, в которых происходит просмотр вперёд на два символа, это понадобится при реализации метода разбора.

Программа - стартовый символ.Состоит из трёх частей: блока деклараций, классической части, гибридной части

program → declsDefins classicPart hybridPart

Блок деклараций переменных и макросов, а также задания глобальных начальных условий СДУ

declsDefins → declsDefins1 declsDefins
declsDefins → ε
выбор из 2.1 или 2.2 (предо смотр 2)

Макрос (с параметром или без)

declsDefins1 → MACROID param = expr ;

Явное определение константы

declsDefins1 → CONST ID = sign ;

Объявление массива

declsDefins1 → ARRAY ID [ NUM ] ;

Определение счётчика

declsDefins1 → COUNT ID = [ list_inter ] ;

Задание глобального начального условия с индексом (явно или неявно) или без индекса,неявное определение константы

declsDefins1 → ID index= sign;

Вспомогательные продукции

list_inter → interval list_inter1

list_inter1 → , interval list_inter1
list_inter1 → ε

interval → NUM – NUM

param → [ID ]
param → ε

sign → –sign
sign → literal

index → [ expr_i ]
index → ε

Классическая часть состоит из уравнений алгебраических и дифференциальных и условного оператора

classicPart → classicPart1 classicPart
classicPart → ε
выбор 10.1 или 10.2 (предо смотр 2)

classicPart1 → equation
classicPart1 → condition

Условный оператор

condition → IF ( bool ) THEN localValues ENDIF ;

Уравнение алгебраическое или дифференциальное

equation → IDder index = expr ;
localValues → localValue localValues1

localValues1 → localValue localValues1
localValues1 → ε

Локальное начальное условие с индексом (явное или неявное) и без него

localValue → ID index = expr ;

der → ‘
der → ~

Логическое выражение

bool → join bool1

bool1 → OR join bool1
bool1 → ε

join → equality join1

join1 → AND equality join1
join1 → ε

equality → rel equality1

equality1 → EQ rel
equality1 → NE rel
equality 1 → ε

rel → expr rel1

rel1 → < expr
rel1 → > expr
rel1 → LE expr rel1
rel1 → GE expr rel1
rel1 → ε

Арифметическоевыражение

expr → term expr1

expr1 → – term expr1
expr1 → + term expr1
expr1 → ε

term → unary term1

term1 → / unary term1
term1 → * unary term1
term1 → ε

unary → factor
unary → – unary
unary → NOT unary

factor → ( bool )
factor → ID spec
factor → REAL
factor → NUM

spec → index

Список фактических параметров функции

spec → (list _expr)

list _expr → expr list _expr1

list _expr1 → , expr list _expr1
list _expr1 → ε

Гибридная часть

hybridPart → localState hybridPart
hybridPart → ε

Локальное состояние

localState → ver IS body FROM list_ver ;

Условно-адресная пара

ver → ID cond

cond → [bool ]
cond → ε

Операторы – локальное начальное условие или уравнение

body → body1 body
body → ε

body1 → localValue
body1 → equation
выбор 40.1 или 40.2 (предосмотр 2)

Список условно-адресных пар

list_ver → ver list_ver1
list_ver → ε

list_ver1 → , ver list_ver1
list_ver1 → ε

Вспомогательныепродукции

literal → NUM
literal → REAL

Арифметическиевыражениядляиндексов, введеныдляупрощения семантических проверок

expr_i → term_i expr_i

expr1_i → + term_i expr1_i
expr1_i → – term_i expr1_i
expr1_i → ε

term_i → unary_i term1_i

term1_i → / unary_i term1_i
term1_i → * unary_i term1_i
term1_i → ε

unary_i → factor_i
unary_i → – unary_i

factor_i → (expr_i )
factor_i → ID
factor_i → NUM

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 3113 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025423.42 Кб0Афазия.doc
#
27.03.201510.85 Mб9Б.В.Барнет Материалы к ретроспективе фильмов.pdf
#
01.04.20253.98 Mб0базовое кафедральное пособие по эконом теории.doc
#
09.09.201938.81 Кб4Базы данных.docx
#
11.03.20162.46 Mб69базы_данных_конспект_лекций.pdf
#
01.05.20252.13 Mб0бАКАЛАВР_РАБОТА.docx
#
27.03.2015924.67 Кб153Баховцев. Ч1.doc
#
27.03.20152.98 Mб162Баховцев.Ч2.pdf
#
01.03.2025373.76 Кб2БД Задачи.doc
#
01.07.2025897.92 Кб0БД Курсовая работа.docx
#
27.03.201512.08 Mб82Безденежных.rtf