4 Программно-математическое обеспечение

4.1Лексический анализатор

4.1.1 Функции лексического анализатора

Лексический анализ – первая стадия анализа исходного текста программы, предназначенная для группировки терминальных символов входной цепочки в более крупные конструкции – лексемы. Этот процесс называется процессом лексемной декомпозиции. Лексический анализатор также называют сканером (лексером).

В процессе декомпозиции каждая распознанная лексема однозначно отображается в токен. Токенпредставляет собой пару, состоящую из имени токена и необязательного атрибута. Имя токена – это абстрактный символ, представляющий тип лексемы, например конкретное ключевое слово или последовательность входных символов, составляющих идентификатор. Имена токенов являются входными символами, обрабатываемыми синтаксическим анализатором.

Атрибутами токена являются:

–внутреннее представление лексемы, например строка или целочисленная константа.Это необязательный атрибут, его наличие зависит от типа лексемы;

– номер строки занимаемой лексемой в исходном тексте программы. В дальнейшем этот номер используется для локализации пользователем обнаруженной ошибки.

Лексический анализатор также реализует дополнительные функции:

контроль принадлежности терминального символа алфавиту входного языка с соответствующей диагностикой;
удаление из текста программы не несущих смысловой нагрузки символов (пользовательских комментариев, пробелов, символов табуляции и новой строки), использующихся для разделения токенов друг от друга во входной цепочке символов;
согласование сообщений об ошибках путем указания номера строки, в которой была сгенерирована ошибка;
контроль правильности лексемс соответствующей диагностикой;
контроль выхода за границу вещественного и целого типа (underflow, overflow) при преобразовании числовых лексем во внутреннее представление.

Теоретически, задачи, решаемые сканером, можно возложить на синтаксический анализатор. Но такой подход нецелесообразен по следующим причинам:

замена цепочек символов, представляющих элементарные конструкции языка, делает внутреннее представление программы более удобным для дальнейшего анализа синтаксическим анализатором, упрощает его реализацию. Последний манипулирует не отдельными символами, а законченными элементарными конструкциями, что облегчает их общее восприятие и дальнейший семантический анализ. Кроме этого, при построении лексем может осуществляться простейшая семантическая обработка. Например, преобразование и проверка числовых констант;
уменьшается длина программы, поступающей в синтаксический анализатор, за счет устранения из нее несущественных для дальнейшего анализа пробелов, комментариев, игнорируемых символов. Уменьшение размера текста повышает производительность распознавателя на последующих стадиях анализа;
один и тот же язык программирования может иметь различные внешние представления элементарных конструкций. Поэтому, наличие нескольких лексических анализаторов, порождающих на выходе одно и то же множество лексем, позволяет не переписывать синтаксический анализатор. Написать новый лексический анализатор намного проще, чем синтаксический;
лексический анализатор использует более специализированные, по сравнению с синтаксическим анализатором, методы разбора. Следовательно, на одних и тех же цепочках и при выполнении разбора одних и тех же конструкций его производительность будет выше;
блок лексического анализа естественным образом вписывается в иерархическую структуру языкового процессора, что тоже немаловажно при системном подходе к разработке языковых процессоров.

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 3110 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025423.42 Кб2Афазия.doc
#
27.03.201510.85 Mб9Б.В.Барнет Материалы к ретроспективе фильмов.pdf
#
01.04.20253.98 Mб1базовое кафедральное пособие по эконом теории.doc
#
09.09.201938.81 Кб5Базы данных.docx
#
11.03.20162.46 Mб71базы_данных_конспект_лекций.pdf
#
01.05.20252.13 Mб1бАКАЛАВР_РАБОТА.docx
#
27.03.2015924.67 Кб158Баховцев. Ч1.doc
#
27.03.20152.98 Mб172Баховцев.Ч2.pdf
#
01.03.2025373.76 Кб5БД Задачи.doc
#
01.07.2025897.92 Кб1БД Курсовая работа.docx
#
27.03.201512.08 Mб82Безденежных.rtf