Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
пз_8_Представление информации в ПК.doc
Скачиваний:
8
Добавлен:
14.09.2019
Размер:
236.03 Кб
Скачать

4.4.4. Кодирование текстовой информации

Нажатие клавиш на клавиатуре приводит к тому, что в компьютер посылается сигнал в виде двоичного числа, представляющего собой одно из значений кодовой таблицы. Кодовая таблица  это внутреннее представление символов в компьютере. Во всем мире в качестве стандарта принята таблица ASCII (American Standart Code for Informational Interchange  американский стандартный код информационного обмена).

Для хранения двоичного кода одного символа выделен 1 байт = 8 бит. Учитывая, что каждый бит принимает значение 1 или 0, количество возможных сочетаний единиц и нулей равно 28 = 256. Следовательно, с помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов. Эти коды и составляют таблицу ASCII (табл. 4.4).

Например, при нажатии клавиши с буквой «H» в память компьютера записывается код 01001000, а для слова

HELLO  01001000 01000101 01001100 01001100 01001111.

При выводе буквы «H» на экран компьютер выполняет декодирование  на основании этого двоичного кода строится изображение символа.

Примечание. Цифры кодируются по стандарту ASCII в двух случаях  при вводе-выводе и когда они встречаются в тексте. Если цифры участвуют в вычислениях, то осуществляется их преобразование двоичный код по правилам перевода чисел из одной системы счисления в другую.

Для сравнения рассмотрим число 27 для двух вариантов кодирования.

При использовании в тексте это число потребует для своего представления 2 байта, поскольку каждая цифра будет представлена своим кодом в соответствии с таблицей ASCII . В двоичной системе – 00110010 00110111.

При использовании в вычислениях код этого числа будет получен по специальным правилам перевода и представлен в виде 8-разрядного двоичного числа 00011011, на что потребуется 1 байт.

В системе ASCII закреплены две таблицы кодирования: базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127: цифры, буквы латинского алфавита, знаки препинания, управляющие символы (см. табл. 4.4). Первые 32 символа являются управляющими и предназначены в основном для передачи команд управления. Их назначение может варьироваться в зависимости от программных и аппаратных средств. Расширенная таблица (символы с номерами от 128 до 255) американским стандартом не определена и предназначена для символов национальных алфавитов, псевдографических и некоторых математических символов. В разных странах могут использоваться различные варианты второй половины кодовой таблицы.

Таблица 4.4

Базовая таблица кодировки ASCII

32 пробел

48

0

64

@

80

Р

96

*

112

p

33 !

49

1

65

А

81

Q

97

а

113

q

34 "

50

2

66

В

82

R

98

b

114

r

35 #

51

3

67

С

83

S

99

с

115

s

36 $

52

4

68

D

84

Т

100

d

116

t

37 %

53

5

69

Е

85

U

101

е

117

u

38 &

54

6

70

F

86

V

102

f

118

v

39 '

55

7

71

G

87

W

103

g

119

w

40 (

56

8

72

Н

88

X

104

h

120

x

41 )

57

9

73

I

89

Y

105

i

121

y

42 *

58

:

74

J

90

Z

106

J

122

z

43 +

59

;

75

К

91

[

107

k

123

{

44 ,

60

<

76

L

92

\

108

I

124

|

45 

61

=

77

М

93

]

109

m

125

}

46 .

62

>

78

N

94

^

110

n

126

~

47 /

63

?

79

О

95

_

111

o

127

Отсутствие единого стандарта расширенной таблицы ASCII кодов привело к множественности одновременно действующих кодировок. Только в России можно указать несколько действующих стандартов кодировки. Так, например, кодировка символов русского языка, известная как кодировка Windows-1251, была введена «извне»  компанией Microsoft, но, учитывая широкое распространение программных продуктов этой компании в России, она глубоко закрепилась и нашла широкое распространение. Эта кодировка используется на большинстве локальных компьютеров, работающих на платформе Windows. Де-факто она стала стандартной в российском секторе World Wide Web.

Другая распространенная кодировка носит название КОИ-8 (код обмена информацией, восьмизначный). Сегодня кодировка КОИ-8 (табл. 4.5) имеет широкое распространение в компьютерных сетях на территории России и в некоторых службах российского сектора Интернета. В частности, в России она де-факто является стандартной в сообщениях электронной почты и телеконференций.

Таблица 4.5

Кодировка КОИ-8

128

144 ░

160 

176 ╟

192 ю

208

п

224

Ю

240

П

129 |

145 ▒

161 Ё

177 ╠

193 a

209

я

225

А

241

Я

130 ┌

146 ▓

162 ╒

178 ╡

194 б

210

р

226

Б

242

Р

131 ┐

147 

163 ё

179 Ё

195 ц

211

с

227

Ц

243

С

132

148 ■

164 ╓

180 ╢

196 д

212

т

228

Д

244

Т

133 ┘

149 •

165 ╔

181 ╣

197 e

213

у

229

Е

245

У

134 ├

150 √

166 ╕

182 ╤

198 ф

214

ж

230

Ф

246

Ж

135 ┤

151 ≈

167 ╖

183 ╥

199 г

215

в

231

Г

247

В

136 ┬

152 ≤

168 ╗

184 ╦

200 x

216

ь

232

X

248

Ь

137 ┴

153 ≥

169 ╘

185 ╧

201 и

217

ы

233

И

249

Ы

138 ┼

154

170 ╙

186 ╨

202 й

218

з

234

Й

250

3

139 ▀

155 ⌡

171 ╚

187 ╩

203 к

219

ш

235

К

251

Ш

140 ▄

156 

172 ╛

188 ╪

204 л

220

э

236

Л

252

Э

141 █

157 ²

173 ╜

189 ╫

205 м

221

щ

237

М

253

Щ

142 ▌

158 ·

174 ╝

190 ╬

206 н

222

ч

238

Н

254

Ч

143 ▐

159 

175 ╞

191 ё

207 о

223

ъ

239

О

255

Ъ