
Тема 2.Лексические основы языка программирования Общие сведения о программах, лексемах и алфавите
В тексте на любом естественном языке можно выделить четыре основные структурные компоненты: символы, слова, словосочетания и предложения. Подобные элементы содержит и любой алгоритмический язык: символы, лексемы, выражения и операторы. Лексемы образуются из символов, выражения из лексем, а операторы из выражений и лексем. Объединенная единым алгоритмом совокупность операторов образует программу на алгоритмическом языке.
Алфавит языка (или его символы) – это основные неделимые знаки, с помощью которых пишутся все тексты на языке.
В алфавит языка С++ входят
арабские цифры
латинские буквы и знак подчеркивания
специальные знаки: “ ‘ {} . , & ? () [] < > и т.д.
пробельные символы (пробел, табуляция, символ перехода на новую строку)
Лексемы (или элементарные конструкции) – минимальная конструкция языка, имеющая самостоятельный смысл.
Из символов алфавита формируются следующие лексемы языка:
идентификаторы;
ключевые слова (служебные, зарезервированные);
знаки операций;
константы;
разделители (скобки, точка, запятая, пробельные символы).
Границы лексем определяются другими лексемами, такими как разделители, знаки операций и комментариями.
Рассмотрим каждый из видов лексем подробно.
Идентификатор – это набор символов, представляющих имя программного объекта. Правила написания идентификаторов в конкретном языке программирования указываются в справочниках по этому языку. Например в С++ идентификатор представляет собой последовательность из букв латинского алфавита, десятичных цифр и символов подчеркивания, начинающуюся не с цифры, причем прописные и строчные буквы различаются. На длину различаемой части идентификатора в С++ различные реализации накладывают свои ограничения (по стандарту длина не ограничена). Задание для самостоятельной работы: в справочной системе MS Visual Studio найти каковы ограничения на длину идентификатора.
Ключевые слова – это идентификаторы, зарезервированные в языке для специального использования. Ключевые слова языка также перечисляются в справочнике по языку, но знакомится с ними имеет смысл по мере изучения конструкций языка программирования.
Пример ключевых слов в языке С++:
int – ключевое слово для описания переменных целого типа
if – ключевое слово для построения условной конструкции
Знаки операций - это один или более символов, определяющих действия над операндами. Знаки операций обеспечивают формирование и последующие вычисление выражений. Выражение задает правило для получения значения. Один и тот же знак операции может употребляться в различных выражениях и по-разному интерпретироваться в зависимости от контекста. (Например, унарный и бинарный минус). Для каждой операции задан тип операндов, над которыми может выполняться данная операция. Операндами могут быть выражения и их частные случаи – константы и переменные. Операции делятся на унарные, бинарные и тернарую по количеству операндов (1,2,3 соответственно).
Примеры унарных операций
-7 унарный минус
a++ или ++a – операция инкремента (увеличения на единицу)
a-- или --a – операция декремента (уменьшения на единицу)
! a – операция отрицание
Все бинарные операции делятся на следующие основные группы:
аддитивные (+,-);
мультипликативные(*, /, %);
поразрядные (&,|, ^);
операции отношений (<, >, <=, >=, ==, !=);
логические (&&, ||);
присваивания (=, *=, );
и др.
Рассмотрим тернарную условную операцию.
выражение1? выражение2: выражение3;
Если истинно выржение1, то выполняется выражение2, иначе выполняется выражение3
Например, a>0?b=1:b=-1
Все операции разделены на группы по приоритетам. Если в выражении встречаются операции с разными приоритетами, то сначала выполняются те, у которых приоритет выше. Если все операции имеют одинаковый приоритет, то они выполняются в соответствии с правилом ассоциативности либо слева направо, либо справа налево. Например,
a==++b*c+d (++ * + ==)
-!a (-(!a))
Для изменения порядка выполнения операций используются круглые скобки.