Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информат.учебник.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
6.88 Mб
Скачать
    1. Кодирование текстовых данных

Если каждому символу алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Восьми двоичных разрядов достаточно для кодирования 256 различных символов. Этого хватит, чтобы выразить различными комбинациями восьми битов все символы английского и русского языков, как строчные, так и прописные, а также знаки препинания, символы основных арифметических действий и некоторые общепринятые специальные символы, например символ «%».

Технически это выглядит очень просто, однако всегда существовали достаточно веские организационные сложности. В первые годы развития вычислительной техники они были связаны с отсутствием необходимых стандартов, а в настоящее время вызваны, наоборот, изобилием одновременно действующих и противоречивых стандартов. Для того, чтобы весь мир одинаково кодировал текстовые данные нужны таблицы кодирования, а это пока невозможно из-за противоречий между символами национальных алфавитов, а также противоречий корпоративного характера.

Для английского языка, захватившего де-факто нишу международного средства общения, противоречия уже сняты. Институт стандартизация США (ANSIAmerican National Standard Institute) ввел в действие систему кодирования ASCII (American Standard Code for Information Interchange – стандартный код информационного обмена США). В системе ASCII закреплены две таблицы кодирования – базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.

Первые 32 кода базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств (в первую очередь производителям компьютеров и печатающих устройств). В этой области размещаются так называемые управляющие коды, которым не соответствуют никакие символы языков, и, соответственно, эти коды не выводятся ни на экран, ни на устройства печати, но ими можно управлять тем, как производится вывод прочих данных.

Начиная с кода 32 по код 127 размещены коды символов английского алфавита, знаков препинания, цифр, арифметических действий и некоторых вспомогательных символов. Базовая таблица кодировки ASCII приведена в таблице 1.3.

Таблица 1.3.

Кодировка

Кодировка

Кодировка

Кодировка

Кодировка

Кодировка

Символ

Номер

Символ

Номер

Символ

Номер

Символ

Номер

Символ

Номер

Символ

Номер

Пробел

!

#

$

%

&

,

(

)

*

+

.

-

/

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

0

1

2

3

4

5

6

7

8

9

:

;

<

=

>

?

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

@

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

P

Q

R

S

T

U

V

W

X

Y

Z

[

\

]

^

__

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

`

a

b

c

d

e

f

g

h

i

j

k

l

m

n

o

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

p

q

r

s

t

u

v

w

x

y

z

{

|

}

~

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

Аналогичные системы кодирования текстовых данных были разработаны и в других странах. Однако поддержка производителей оборудования и программ вывела американский код ASCII на уровень международного стандарта, и национальным системам кодирования пришлось «отступить» во вторую, расширенную часть системы кодирования, определяющую значения кодов со 128 по 255. Отсутствие единого стандарта в этой области привело к множественности одновременно действующих кодировок. Только в России можно указать три действующих стандарта кодировки, но чаще всего используется, кодировка КОИ-8 приведем, приведем один из ее кодировки фрагментов (см. таблица 1.4.)

Таблица 1.4.

Кодировка

Кодировка

Кодировка

Кодировка

Символ

Номер

Символ

Номер

Символ

Номер

Символ

Номер

Ё

ё

ю

ь

ы

з

ш

э

щ

ч

ъ

Ю

А

161

163

192

216

217

218

219

220

221

222

223

224

225

Б

Ц

Д

Е

Ф

Г

Х

И

Й

К

Л

М

226

227

228

229

230

231

232

233

234

235

236

237

Н

О

П

Я

Р

С

Т

У

Ж

В

Ь

Ы

238

239

240

241

242

243

244

245

246

247

248

249

З

Ш

Э

Щ

Ч

Ъ

250

251

252

253

254

255

Аналогичный подход используется и для других видов информации, например цвета, чтобы передать весь диапазон цветов, доступный человеческому глазу, код каждой точки растра выражает не цвет сам по себе, а только его номер (индекс) в некой справочной таблице, называемой палитрой. Разумеется, эта палитра должна прикладываться к графическим данным – без нее нельзя воспользоваться методами воспроизведения информации на экране или бумаге (то есть, воспользоваться, конечно, можно, но из-за неполноты данных полученная информация не будет адекватной: листва на деревьях может оказаться красной, а небо – зеленым).