Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теоретическая Информатика

.pdf
Скачиваний:
64
Добавлен:
11.04.2015
Размер:
6.24 Mб
Скачать

§ 3. Кодовые таблицы

95

2. Кириллические кодовые таблицы

1°. К и р и л л и ч е с к и е к о д и р о в к и w i n , k o i 8 и d o s При передаче русских текстов с компьютера на компьютер, особенно в Интернете, возникает проблема перекодировки кириллицы. Дело в том, что в разных операционных системах русские буквы кодируются по-разному. Кроме того, в Интер- нете есть много текстов, набранных в устаревших кодировках. Три основные однобайтные русские кодировки win, koi8 и

dos одновременно присутствуют в русском Интернете.

1.Кодировка Windows 1251 или, сокращенно, кодировка win

используется при русском наборе в Windows.

Многие русские сайты в Интернете имеют веб-страницы в кодировке win.

2.Кодировка KOI8-R или, сокращенно, кодировка koi8 исполь- зуется при русском наборе в UNIX.

Под UNIX функционируют многие узлы в Интернете. Многие персональные компьютеры работают не в Windows, а

вUNIX, или используют их вместе. Кодировка koi8 широко распространена в Интернете еще и по той причине, что в не кодируются русские электронные письма.

3.Альтернативная кодировка DOS 866 или, сокращенно, ко-

дировка dos используется при русском наборе в ДОС, либо не- посредственно запущенной на компьютере (что бывает крайне редко), либо эмулируемой в Windows. Также многие русские тексты, выложенные в Интернете, были набраны еще в ДОС.

Эти однобайтные русские кодовые таблицы полностью приведены в приложениях.

Первые половины русских кодовых таблиц win, koi8 и dos, имеющие коды 32—127, совершенно одинаковы это между- народный стандарт аски-кодов, рассмотренный выше. Аски- коды входят в состав всех однобайтных кодовых таблиц. В табл. 2.15 показаны русские кодовые таблицы без аски-кодов.

Иногда эти кодовые таблицы публикуются с ошиб- ками (в издании их символы приходится набирать в ка- кой-то одной кодировке, например, в уникоде).

96

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Глава 2. Символы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а 2 . 1 5

 

Русские кодовые таблицы WIN, KOI8 и DOS без аски-кодов

 

Русская кодовая

 

 

Русская кодовая

 

 

Русская кодовая

 

 

 

таблица win

 

 

 

 

таблица koi8

 

 

 

таблица dos

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Символ

 

 

 

 

 

 

Символ

 

 

 

 

Символ

 

 

 

 

 

 

Код

 

 

 

 

 

 

 

Код

 

 

 

 

 

Код

 

 

Ђ

ђ

 

°

А

Р

а

р

 

 

ю

п

Ю

П

 

А

Р

а

р

Ё

 

 

0128

0144

0160

0176

0192

0208

0224

0240

 

128

144

160

176

192

208

224

240

 

128

144

160

176

192

208

224

240

 

 

Ѓ

Ў

±

Б

С

б

с

 

 

а

я

А

Я

 

 

Б

С

б

с

ё

 

 

0129

0145

0161

0177

0193

0209

0225

0241

 

129

145

161

177

193

209

225

241

 

129

145

161

177

193

209

225

241

 

 

 

ў

І

В

Т

в

т

 

 

б

р

Б

Р

 

 

В

Т

в

т

Є

 

 

0130

0146

0162

0178

0194

0210

0226

0242

 

130

146

162

178

194

210

226

242

 

130

146

162

178

194

210

226

242

 

 

ѓ

Ј

і

Г

У

г

у

 

 

ё

Ё

ц

с

Ц

С

 

 

Г

У

г

у

є

 

 

0131

0147

0163

0179

0195

0211

0227

0243

 

131

147

163

179

195

211

227

243

 

131

147

163

179

195

211

227

243

 

 

 

¤

ґ

Д

Ф

д

ф

 

 

д

т

Д

Т

 

 

Д

Ф

д

ф

Ї

 

 

0132

0148

0164

0180

0196

0212

0228

0244

 

132

148

164

180

196

212

228

244

 

132

148

164

180

196

212

228

244

 

 

 

Ґ

µ

Е

Х

е

х

 

 

е

у

Е

У

 

 

Е

Х

е

х

ї

 

 

0133

0149

0165

0181

0197

0213

0229

0245

 

133

149

165

181

197

213

229

245

 

133

149

165

181

197

213

229

245

 

 

¦

Ж

Ц

ж

ц

 

 

ф

ж

Ф

Ж

 

 

Ж

Ц

ж

ц

Ў

 

 

0134

0150

0166

0182

0198

0214

0230

0246

 

134

150

166

182

198

214

230

246

 

134

150

166

182

198

214

230

246

 

 

 

§

·

З

Ч

з

ч

 

 

г

в

Г

В

 

 

З

Ч

з

ч

ў

 

 

0135

0151

0167

0183

0199

0215

0231

0247

 

135

151

167

183

199

215

231

247

 

135

151

167

183

199

215

231

247

 

 

`

Ё

ё

И

Ш

и

ш

 

 

 

 

 

х

ь

Х

Ь

 

 

И

Ш

и

ш

°

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0136

0152

0168

0184

0200

0216

0232

0248

 

136

152

168

184

200

216

232

248

 

136

152

168

184

200

216

232

248

 

 

 

©

Й

Щ

й

щ

 

 

 

 

 

и

ы

И

Ы

 

 

Й

Щ

й

щ

 

 

0137

0153

0169

0185

0201

0217

0233

0249

 

137

153

169

185

201

217

233

249

 

137

153

169

185

201

217

233

249

 

 

Љ

љ

Є

є

К

Ъ

к

ъ

 

 

 

 

 

й

з

Й

З

 

 

К

Ъ

к

ъ

 

 

 

0138

0154

0170

0186

0202

0218

0234

0250

 

138

154

170

186

202

218

234

250

 

138

154

170

186

202

218

234

250

 

 

«

»

Л

Ы

л

ы

 

 

к

ш

К

Ш

 

 

Л

Ы

л

ы

 

 

0139

0155

0171

0187

0203

0219

0235

0251

 

139

155

171

187

203

219

235

251

 

139

155

171

187

203

219

235

251

 

 

Њ

њ

¬

ј

М

Ь

м

ь

 

 

°

 

л

э

Л

Э

 

 

М

Ь

м

ь

 

 

0140

0156

0172

0188

0204

0220

0236

0252

 

140

156

172

188

204

220

236

252

 

140

156

172

188

204

220

236

252

 

 

Ќ

ќ

-

Ѕ

Н

Э

н

э

 

 

²

м

щ

М

Щ

 

 

Н

Э

н

э

¤

 

 

0141

0157

0173

0189

0205

0221

0237

0253

 

141

157

173

189

205

221

237

253

 

141

157

173

189

205

221

237

253

 

 

Ћ

ћ

®

ѕ

О

Ю

о

ю

 

 

 

 

н

ч

Н

Ч

 

 

О

Ю

о

ю

 

 

0142

0158

0174

0190

0206

0222

0238

0254

 

142

158

174

190

206

222

238

254

 

142

158

174

190

206

222

238

254

 

 

Џ

џ

Ї

ї

П

Я

п

я

 

 

 

©

о

ъ

О

Ъ

 

 

П

Я

п

я

 

 

 

0143

0159

0175

0191

0207

0223

0239

0255

 

 

143

159

175

191

207

223

239

255

 

 

143

159

175

191

207

223

239

255

 

§ 3. Кодовые таблицы

97

2°. С и м в о л ы к и р и л л и ч е с к и х к о д и р о в о к Русские кодировки win, koi8 и dos отличаются друг от друга. Прописные и строчные 32 русские буквы, кроме буквы «ё»,

занимают всегда 4 полных столбца кодовых таблиц. В кодиров- ках win и koi8 это последние 4 столбца, а в кодировке dos — 3 первых столбца второй половины и предпоследний столбец.

В таблицах win и dos сначала расположены прописные рус- ские буквы, а затем строчные, а в koi8 — наоборот. Сорти- ровка русских букв в таблицах win и dos русская (а, б, в, г, д, е, …), а в таблице koi8 — латинская (а, б, ц, д, е, ф, …). Коды про- писной и строчной букв «ё» различны в разных кодировках.

Т а б л и ц а 2 . 1 6

Расположение русских букв в кодовых таблицах

 

 

 

 

 

 

Русская

Операцион-

Коды русских букв

Сортировка

кодировка

ная система

 

 

русских букв

прописных

строчных

1

win

Windows

192—223

224—255

Русская:

А, Б, В, Г, Д, Е, …

2

koi8

UNIX

224—255

192—223

Латинская:

А, Б, Ц, Д, Е, Ф, …

3

dos

DOS

128—159

160—175,

Русская:

224—239

А, Б, В, Г, Д, Е, …

 

 

 

 

Расширенные русские аски-коды аски-коды с 32 русскими буквами в любой кодировке.

Кроме русских букв в кодовых таблицах win, koi8 и dos на- ходятся также буквы других кириллических алфавитов, по- этому эти кодовые таблицы и называются кириллическими.

Т а б л и ц а 2 . 1 7

Буквы кириллических алфавитов в однобайтных кодировках

Кодировка

Кириллические буквы, отличные от русских

 

 

 

1

win

Ђ ђ Ѓ ѓ Љ љ Њ њ Ќ ќ Ћ ћ Џ џ Ў ў Ј ј Ґ ґ Є є Ї ї І і Ѕ ѕ

 

 

 

2

koi8

3

dos

Є є Ї ї Ў ў

98

Глава 2. Символы

Очевидно, что больше всего кириллических букв в кодовой таблице win (см. табл. 2.17). Но там нет псевдографики.

Псевдографика символы, позволяющие рисовать и закра- шивать прямоугольные таблицы.

Псевдографика присутствует только в кодовых таблицах koi8 и dos, в кодовой таблице win псевдографики нет (см. табл. 2.17). Связано это с областью использования кодовых таблиц. Кодовые таблицы koi8 и dos предназначены для опе- рационных систем, работающих с текстовым экраном, а кодо- вая таблица win — для ОС Windows, которая имеет графиче- ский экран.

Для использования псевдографики необходим либо тек- стовый режим экрана, либо моноширинный шрифт на гра- фическом экране. Причем в текстовых процессорах, таких, как Word, кроме моноширинного шрифта необходимо также за-

дать междустрочное расстояние точно равным кеглю шрифта

(см. рис. 2.18).

В кодировках koi8 и dos имеется 48 одинаковых символов псевдографики (3 столбца). Эта псевдографика позволяет:

1)рисовать прямоугольные таблицы простыми или двой- ными линиями или их сочетаниями;

2)заливать прямоугольники с разной насыщенностью.

128

136

 

182

 

183

160

184

 

130┌───┬─┐131 162╒═══╤═╕166

164╓───╥─╖167

165╔═══╦═╗168

 

129

138

188

189

161

190

140▄ ░144

134├───┼─┤135

175╞═══╪═╡178

176╟───╫─╢180

177╠═══╬═╣181

142▌ ▒145

│ │

│ │

║ ║

║ ║

143▐ ▓146

132└───┴─┘133 169╘═══╧═╛172

170╙───╨─╜173

171╚═══╩═╝174

139▀ █141

 

137

 

185

 

186

 

187

 

196

194

 

209

 

210

213

203

 

218┌───┬─┐191 213╒═══╤═╕184

214╓───╥─╖183

201╔═══╦═╗187

 

179

197

216

215

186

206

220▄ ░176

195├───┼─┤180

198╞═══╪═╡181

199╟───╫─╢182

204╠═══╬═╣185

221▌ ▒177

│ │

│ │

║ ║

║ ║

222▐ ▓178

192└───┴─┘217 212╘═══╧═╛190

211╙───╨─╜189

200╚═══╩═╝188

223▀ █219

 

193

 

207

 

208

 

202

 

Рис. 2.18. Псевдографика и их коды в кодировке koi8 (вверху) и dos (внизу)

§ 3. Кодовые таблицы

99

Псевдографика присутствует в стандартных двухбайтовых шрифтах Windows, а также в уникодах в октете 25 (см.

прил. 1.11).

В уникодах добавлены утолщенные, пунктирные, наклонные и закругленные линии и их сочетания.

Во вторых половинах кодовых таблиц koi8 и dos из-за на- личия в них русских букв (4 столбца) и псевдографики (3 столбца) почти не остается места для других символов. Только в кодовой таблице win размещено достаточно большое коли- чество знаков препинания типографского качества.

В аски-кодах имеются только прямые машинописные ка- вычки, а тире нет совсем (знак тире заменяют при наборе в аски-кодах знаком дефиса). В кодовой таблице win добавлено 8 двойных и одинарных кавычек или апострофов типограф- ского качества, тире и многоточие (см. табл. 2.19).

 

 

 

 

Т а б л и ц а 2 . 1 9

 

 

 

Знаки препинания из второй половины

 

 

 

кириллической кодовой таблицы WIN

 

 

 

 

 

 

Код

Знак пре-

Название

 

 

 

пинания

 

 

1

0130

Запятая, открывающаяся одинарная кавычка

 

 

 

 

 

 

2

0132

Левые открывающиеся кавычки «лапки»

 

 

 

 

 

 

3

0133

Многоточие

 

 

 

 

 

 

4

0145

Фигурный, или типографский, обратный

 

апострóф, закрывающаяся одинарная кавычка

 

 

 

 

 

5

0146

Фигурный, или типографский, апострóф

 

 

 

 

 

 

6

0147

Правые закрывающиеся кавычки «лапки»

 

 

 

 

 

 

7

0148

Фигурные, или типографские, прямые кавычки

 

 

 

 

 

 

8

0151

Тире, диапазон, диалог

 

 

 

 

 

 

9

0171

«

Левые открывающиеся кавычки «елочки»

 

 

 

 

 

 

10

0187

»

Правые закрывающиеся кавычки «елочки»

 

 

 

 

 

100

Глава 2. Символы

Как ни странно, но знака ударения нет в русских кодовых таблицах. Его можно найти в западноевропейской кодовой таблице Windows с кодом 0180.

Во вторых половинах кодовых таблиц koi8 и dos знаков препинания нет совсем.

Специальные знаки из второй половины кириллической кодовой таблицы win и их названия см. в приложениях.

Используемые в Windows и Интернете кодировки win, koi8 и dos для перекодировки русских букв пра- вильно передают только аски-коды и 32 русские буквы. Все остальные их символы, в том числе и буква «ё», мо- гут быть заменены совсем другими знаками.

3°. У п р а ж н е н и я

1.Закодируйте слова «bit» и «byte», которые по-английски означают «бит» и «байт», аски-кодами.

2.Запишите слова в трех различных русских однобайтных кодировках win, koi8 и dos.

а. Запишите слова «бит» и «байт» в русской однобайтной кодировке win.

б. Запишите слова «бит» и «байт» в русской однобайтной кодировке koi8.

в. Запишите слова «бит» и «байт» в русской однобайтной кодировке dos.

3.Расшифруйте слова, записанные в одной кодировке, по двум другим русским однобайтным кодировкам.

а. Расшифруйте слова «бит» и «байт», закодированные в упр. 2а в русской однобайтной кодировке win, в двух других кодировках koi8 и dos.

б. Расшифруйте слова «бит» и «байт», закодированные в упр. 2а в русской однобайтной кодировке koi8, в двух других кодировках win и dos.

в. Расшифруйте слова «бит» и «байт», закодированные в упр. 2а в русской однобайтной кодировке dos, в двух других кодировках win и koi8.

Глава 3

Текст

x2

ex $9999 ОРФО™

x1 x2 x3 H2O

а

 

 

 

 

 

 

 

б

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

гд

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Книж-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Альбомная

 

 

 

ная

 

 

 

 

 

 

 

 

 

 

 

 

ориента-

 

 

 

ориен-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ция

 

 

 

тация

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

102

Глава 3. Текст

 

Оглавление

 

Глава 3. Текст . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

101

 

§ 1. Шрифт . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

103

 

1. Параметры символов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

103

 

1°. Начертание букв и их размер . . . . . . . . . . . . . . . . . . . . . . .

103

 

2°. Смещение символов по вертикали. Соседние символы

106

 

3°. Упражнения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

109

 

2. Характеристики шрифтов . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

110

 

1°. Гарнитура шрифта . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

110

 

2°. Начертание шрифта . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

113

 

3°. Упражнения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

116

 

§ 2. Абзац . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

117

 

1. Абзац и красная строка . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

117

 

1°. Висячая строка. Форматирование абзаца . . . . . . . . . . . . .

117

 

2°. Красная строка и отбивка абзацев . . . . . . . . . . . . . . . . . . .

119

 

3°. Упражнения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

121

 

2. Параметры абзаца . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

122

 

1°. Отступ границ. Абзацный и межабзацный интервалы .

122

 

2°. Отступ первой строки абзаца. Выравнивание строк . . .

124

 

3°. Упражнения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

127

 

§ 3. Страница . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

128

 

1. Страница и лист . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

128

 

1°. Два понятия страницы. Структура страницы . . . . . . . . .

128

 

2°. Лист. Размер и ориентация листа . . . . . . . . . . . . . . . . . . . .

129

 

3°. Упражнения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

130

 

2. Виды страниц . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

131

 

1°. Основной и технический текст. Состав издания.

 

 

Нумерация страниц . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

131

 

2°. Ссылки: оглавление, список литературы, индексы

 

 

и ссылки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

133

 

3°. Упражнения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

134

§ 1. Шрифт

103

§1. Шрифт

1.Параметры символов

1°. Н а ч е р т а н и е б у к в и и х р а з м е р Исторически первыми появились прописные буквы, которы-

ми написаны самые старые рукописи. Отголоском этого явля- ется то, что арабские цифры имеют высоту прописных букв.

Тетради младших школьников для письма разлинованы, в них отведены строки. Две линии этих строк проведены по нижней и верхней границам строчных букв, которые вписыва- ются между этими линиями (см. рис. 3.1).

Строчные буквы обычные маленькие буквы, которые со- ставляют строку. Строка место для написания строчных букв.

Прописные буквы большие буквы, всегда выступающие над строкой.

Капитель буквы с начертанием прописных и высотой строчных.

Строчные буквы называют также обычными, прописные за-

главными, а капитель малыми прописными, или капительными.

а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я

a b c d e f g h i j k l m n o p q r s t u v w x y z

АБ В Г Д Е Ё Ж З И Й К Л М Н О П

РС Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я

A B C D E F G H I J K L M

N O P Q R S T U V W X Y Z

А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я

A B C D E F G H I J K L M

N O P Q R S T U V W X Y Z

Рис. 3.1. Русские и английские строчные (в верху), прописные (в середине) и капительные (в низу) буквы. Пунктиром показаны границы строк

104

Глава 3. Текст

Тексты набираются строчными буквами, поэтому они за- нимают мало места и быстро и легко читаются. ПРОПИСНЫЕ БУКВЫ ЧИТАТЬ ЗНАЧИТЕЛЬНО ТРУДНЕЕ. ДАЖЕ КАПИТЕЛЬ WORD СМОТРИТСЯ ЛУЧШЕ. Набор текста прописными буквами или капителью используется для выделения слов.

Набор прописными буквами в сообщениях, переда- ваемых по электронной почте, эквивалентен крику.

Как видно из рис. 3.1, буквы по начертанию существенно отличаются друг от друга. В частности:

1)начертание некоторых строчных букв отличается от на- чертания этих же прописных;

2)начертание большинства русских букв отличается от на- чертания каких-либо английских.

Кириллица буквы русского языка или схожего начерта- ния, латиница английского языка или схожего начертания.

Не спутайте кириллицу как начертание букв с ки- риллицей как старославянским алфавитом!

Буквы могут иметь разную высоту, ширину, наклон и, на- конец, набираться разными шрифтами. Причем слишком сильное искажение начертания символа может привести к то- му, что символ перестанет восприниматься при чтении. Таким образом, необходимо сохранять графическую сущность пись- менного знака, представляющего символ.

Графема изображение основы формы письменного знака. Символ всегда рисуется таким образом, чтобы его графема могла быть распознана. Тексты в книгах набираются доста- точно простыми шрифтами, которые очевидным образом пе-

редают графемы букв.

На рис. 3.2 показаны графемы первых прописных букв ки- риллицы и латиницы.

Рис. 3.2. Графемы первых пяти прописных русских (слева) и английских (справа) букв