- •Алфавіт мови
- •Лексичний устрій тексту програм
- •Лексеми
- •Лексичний аналіз
- •Позначення
- •Класифікація позначень
- •Напередвизначені позначення
- •Позначення, що визначаються
- •Класифікація типів
- •Класифікація напередвизначених типів
- •Скалярні типи
- •Дискретні типи
- •Перелічуваний тип
- •Символьний тип
- •Логічний тип
- •Дійсні типи
Алфавіт мови
Алфавіт будь-якої мови програмування є підмножиною символів (літер), представлених у спеціальній таблиці ASCII.
Зазвичай алфавіт складається з 52 великих і малих літер, 10 десяткових цифр та спеціальних символів, таких, скажімо як +, -, *, >. Алфавіт мови входить до стандартного (напередвизначеного) оточення мови (standard language environment), для того щоб різні реалізації одної мови (транслятори) були однаковими з точки зору обміну текстами мови.
Лексичний устрій тексту програм
На лексичному рівні інкапсуляції текст програми складається з наступних конструкцій:
- пробільні символи;
- коментарі;
лексеми.
Пробільні символи - це символи, які використовуються для відділення лексем і поліпшення читання програми. До пробільних належать такі символи: пробіл, табуляція, новий рядок. Коментарі - це послідовності символів, які не належать тексту програми (мові) і виконують опис пояснень у програмі. Наприклад, коментар у мові С – /*це коментар у мові С*/ чи – // це коментар у мові С.
Лексеми
Лексеми - це простіші програмні конструкції, що складають словниковий запас мови. Також лексеми – це капсули, що інкапсулюють символи алфавіту.
Капсула-лексема представляється розміченим ланцюжком наступного виду:
......S1*l1[l2...ln]*Sj...,
де Si, Sj, lk V,а, Si, Sj - пробільні символи чи символи інших лексем;
lk, де k = 1, ..., n - символи капсули-лексеми, при цьому l1 - перший символ, а ln - останній символ лексеми.
ASCII - American Standard Codes Information Interchange
-
DEC
HEX
CHAR
DEC
HEX
CHAR
DEC
HEX
CHAR
DEC
HEX
СНАЯ
DEC
HEX
СНАЯ
0
0
20
14
40
28
(
60
3C
<
80
50
Р
1
1
21
15
41
29
)
61
3D
=
81
51
Q
2
2
22
16
42
2A
*
62
3E
>
82
52
R
3
3
23
17
43
2B
+
63
3F
?
83
53
S
4
4
24
18
44
2C
,
64
40
@
84
54
Т
5
5
25
19
45
2D
–
65
41
A
85
55
U
6
6
26
1A
46
2E
.
66
42
В
86
56
V
7
7
27
1B
47
2F
/
67
43
С
87
57
W
8
8
28
1C
48
30
0
68
44
D
88
58
X
9
9
29
ID
49
31
1
69
45
Е
89
59
Y
10
A
30
1E
50
32
2
70
46
F
90
5A
Z
11
В
31
IF
51
33
3
71
47
G
91
5B
[
12
С
32
20
52
34
4
72
48
Н
92
5C
\
13
D
33
21
!
53
35
5
73
49
I
93
5D
]
14
E
34
22
"
54
36
6
74
4A
J
94
5E
^
15
F
35
23
#
55
37
7
75
4B
К
95
5F
_
16
10
36
24
$
56
38
8
76
4C
L
96
60
'
17
11
37
25
%
57
39
9
77
4D
М
97
61
a
18
12
38
26
&
58
ЗА
:
78
4E
N
98
62
b
19
13
39
27
'
59
3B
;
79
4F
О
99
63
с
100
64
d
106
6A
j
112
70
p
119
77
w
125
7D
}
101
65
e
107
68
k
113
71
q
120
78
x
126
7E
~
102
66
f
108
6C
l
114
72
r
121
79
y
127
7F
103
67
g
109
6D
m
115
73
s
122
7A
z
104
68
h
110
6E
n
117
75
u
123
7B
{
105
69
i
111
6F
o
118
76
v
124
7C
|
Примітка. 0 - 32-символи, що не відображуються