
- •Содержание
- •1.Рабочая программа
- •2.Модуль Вводный
- •3.Модуль Формальные грамматики и языки
- •3.1.Языки и цепочки символов. Способы задания языков
- •3.1.1.Цепочки символов. Операции над цепочками символов
- •3.1.2.Понятие языка. Формальное определение языка
- •3.1.3.Способы задания языков
- •3.1.4.Синтаксис и семантика языка
- •3.2.Определение грамматики
- •3.2.1.Особенности языков программирования
- •3.2.2.Определение грамматики. Форма Бэкуса—Наура
- •3.2.3.Принцип рекурсии в правилах грамматики
- •3.2.4.Другие способы задания грамматик
- •3.3.Классификация языков и грамматик
- •3.3.1.Классификация грамматик
- •3.3.2.Классификация языков
- •3.4.Контроль
- •4.Модуль Распознаватели, механизм вывода цепочек символов
- •4.1.Цепочки вывода. Сентенциальная форма.
- •4.1.1.Сентенциальная форма грамматики. Язык, заданный грамматикой
- •4.1.2.Левосторонний и правосторонний выводы
- •4.1.3.Однозначные и неоднозначные грамматики
- •4.1.4.Эквивалентность и преобразование грамматик
- •4.2.Распознаватели. Задача разбора
- •4.2.1.Общая схема распознавателя
- •4.2.2.Виды распознавателей
- •4.2.3.Классификация распознавателей по типам языков
- •4.3.Контроль
- •5.Модуль Регулярные грамматики и языки
- •5.1.Регулярные языки и грамматики
- •5.2.Леволинейные и праволинейные грамматики. Автоматные грамматики
- •5.3.Алгоритм преобразования регулярной грамматики к автоматному виду
- •5.4.Конечные автоматы
- •5.4.1.Определение конечного автомата
- •5.4.2.Детерминированные и недетерминированные конечные автоматы
- •5.4.3.Преобразование конечного автомата к детерминированному виду
- •5.5.Контроль
- •6.Модуль Контекстно-свободные грамматики и языки
- •6.1.Контекстно-свободные языки
- •6.1.1.Распознаватели кс-языков. Автоматы с магазинной памятью. Определение мп-автомата
- •6.2.Классы кс-языков и грамматик. Класс ll(k) грамматик.
- •6.3.Принципы построения распознавателей для ll(k)-грамматик
- •6.4.Левая факторизация
- •6.5.Удаление левой рекурсии
- •6.6.Алгоритм разбора для ll(1)-грамматик
- •6.7.Алгоритм построения множества first(1,a)
- •6.8.Алгоритм построения множества follow(1,a)
- •6.9.Восходящие распознаватели кс-языков без возвратов
- •6.9.1.Определение lr(k)-грамматики
- •6.10.Принципы построения распознавателей для lr(k)-грамматик
- •6.10.1.Грамматики простого предшествования
- •6.11.Распознаватели для lr(0) и lr(1) грамматик
- •6.11.1.Распознаватель для lr(0)-грамматики
- •6.11.2.Распознаватель для lr(1) грамматики
- •6.12.Контроль
- •7.Модуль Инструментальные средства для построения трансляторов
- •7.1.Инструментальные средства для построения компиляторов
- •7.1.1.Построитель лексических анализаторов Lex
- •7.2.Контроль
- •8.Модуль Особенности программирование трансляторов
- •8.1.Использование значений произвольных типов, алгоритм разбора
- •8.1.1.Алгоритм синтаксического разбора
- •8.1.2.Семантический стек
- •8.2.Неоднозначности и конфликты
- •8.3.Старшинство операций
- •8.4.Дополнительные возможности программ yacc и lex
- •8.4.1.Обработка ошибок
- •8.5.Совместное использование lex и yacc
- •8.5.1.Кодировка лексем и интерфейс
- •8.5.2.Сборка yacc-программ
- •8.6.Советы по подготовке спецификаций
- •8.6.1.Стиль
- •8.6.2.Использование левой рекурсии
- •8.6.3.Уловки анализа лексики
- •8.6.4.Входной синтаксис yacc'а
- •8.7.Контроль
- •9.Модуль Заключение
- •10.Обеспечение лабораторного практикума
- •11.Дополнительная информация. Примеры
- •11.4.Пример простейшего интерпретатора формул
- •11.5.Простой пример
- •11.6.Более сложный пример
- •11.7.Генераторы лексических и синтаксических анализаторов
- •11.8.Генераторы лексических и синтаксических анализаторов на java
- •11.9.Пакеты для разработки компиляторов
- •Список сокращений
- •Литература
- •Приложения Приложение 1. Учебно–методическая карта дисциплины “Системное программное обеспечение. Синтаксические анализаторы”
- •Приложение 2. Вопросы для зачета по дисциплине “Системное программное обеспечение. Синтаксические анализаторы”
- •Приложение 3. Методические указания к лабораторным работам по дисциплине «Системное программное обеспечение. Синтаксические анализаторы»
- •Порядок выполнения работы:
- •Контрольные вопросы
- •Лексический анализатор lex. Анализ структуры программ
- •Краткая теория:
- •Рассмотрим примеры:
- •Порядок выполнения работы:
- •Контрольные вопросы
- •Лексический анализатор lex, синтаксический анализатор yacc. Алгебраические вычисления
- •Краткая теория:
- •Порядок выполнения работы:
- •Контрольные вопросы
- •Лексический анализатор lex и синтаксический анализатор yacc. Изображение геометрических фигур
- •Краткая теория:
- •Создание метафайла и работа сним
- •Порядок выполнения работы:
- •Контрольные вопросы
- •Приложение 4. Организация рейтингового контроля по дисциплине «Системное программное обеспечение. Синтаксические анализаторы»
2.Модуль Вводный
Рассматриваемая в данном лекционном курсе тема непосредственно связана с задачей построения трансляторов и компиляторов формальных языков. К таким языкам относятся все известные на сегодняшний день языки программирования, языки открытых форматов файлов, таких, например, как DXF, RTF, XML-ориентированных форматов. Популярность и широкое распространение технологий, основанных на открытых форматах, явились следствием появления большого числа специализированных программных и аппаратных средств работы с такими форматами. Что, в первую очередь, определялось наличием хорошо проработанного и развитого математического аппарата теории формальных грамматик и формальных языков.
Сегодня, пожалуй, трудно назвать известное программное обеспечение, которое бы не работало с файлами данных отрытого формата или не использовало специализированный язык описания выполняемых действий, такие, например, как AutoCad Lisp, Printer post-script и другие.
Еще одним аспектом крайней популярности открытых форматов файлов является возможность взаимодействия различных приложений между собой. Таким образом, происходит унификация как самих форматов для различного рода информации, так и процедур «чтения» данных.
Процедура «чтения» текста, записанного на каком либо формальном языке, вычислительной машиной является также строгой формальной процедурой и носит название «парсинг» или синтаксический анализ. Программный объект, выполняющий парсинг, называется парсер, или синтаксический анализатор.
На сегодняшний день существует большое количество свободно распространяемых синтаксических анализаторов, наиболее известными являются:
Yet Another Compiler Compiler YACC, существующий как программа порождающая в результате своей работы исходный код на C или C++ синтаксического анализатора заданной формальной грамматики класса LR(1); [http://dinosaur.compilertools.net]
Generic Interpreter GI, который выполняет синтаксический разбор текста, заданного формальной грамматикой. Данное средство доступно только для Java программистов. [http://www.csupomona.edu/~carich/gi]
Развитие технологии синтаксического анализа привело к расслоению синтаксического анализатора на два слоя. На нижнем уровне выполняется распознавание лексем (слов) – тех кирпичиков текста, из которых он формируется. Если проводить аналогию с естественным языком, то можно сказать, что термин лексема является более широким, чем наше представление о словах. Лексема определяет семейство слов, объединяя их по структурным (лексическим) особенностям.
Если на стадии лексического анализа возникают проблемы с распознаванием лексем, то текст считается лексически некорректным.
Лексический анализатор является в большинстве случаев еще более универсальной машиной, чем синтаксический. Можно представить себе идеальный случай, когда все синтаксические анализаторы будут работать с одним универсальным лексическим анализатором, распознающим ограниченный, минимально необходимый набор лексем. Однако из-за сложности и оригинальности ряда задач такой шаг превращается в утопию.
Необходимо отметить, что наиболее известные языки программирования, такие как C, C++, java, prolog, и др. построены именно как контекстно-свободные языки, и большинство компиляторов и трансляторов языков программирования разработаны с использованием построителя синтаксических анализаторов Yacc и Lex.
Согласно учебному плану и рабочей программе по дисциплине «Системное программное обеспечение. Синтаксические анализаторы» для специальностей Т.10.03 «Вычислительные системы и сети» и Т.10.02 «Программное обеспечение информационных технологий» радиотехического факультета Учреждения образования «Полоцкий государственный университет» предусмотрено:
-
Вид занятий
Количество часов
Курс
3
Семестр
6
Лекции
32
Лабораторные работы
32
Самостоятельная работа
10
Консультации
2
Зачет
6 семестр
Современный уровень знаний в области формальных грамматик в сочетании с все возрастающей производительностью вычислительной техники определил переход к интерпретируемым языкам программирования. Такие языки в силу своей универсальности, то есть независимости от программно-аппаратной платформы, завоевали рынок корпоративных технологий. Это в первую очередь языки программирования java, C#, и другие языки .NET технологии.
Нужно отметить, что лексический анализ является прекрасно изученной областью науки, и он входит в теорию формальных грамматик как распознавание регулярных грамматик.