Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Базовый курс ПК.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
7.06 Mб
Скачать

Лекция 4 Текстовые файлы.

Если каждому символу алфавита сопоставить определенное число (например, порядковый номер), то с помощью двоичного кода можно

кодировать и текстовую информацию. Восьми двоичных разрядов достаточно для кодирования 256 различных символов. Этого хватит, чтобы

выразить различными комбинациями восьми битов все символы английского и русского алфавитов, как строчные, так и прописные, а также

знаки препинания, символы основных арифметических действий и некоторые общепринятые специальные символы, например "@".

Теоретически это выглядит очень просто, однако всегда существовали достаточно веские органзационные сложности. В первые годы развития вычислительной техники они были связаны с отсутствием необходимых стандартов, а в настоящее время вызваны, наоборот, изобилием одновременно действующих и противоречивых стандртов. Для того, чтобы весь мир одинаково кодировал текстовые данные, нужны единые таблицы кодирования, а это пока невозможно из-за противоречий между символами национальных алфавитов, а также противоречий корпоративного характера.

Для английского языка, ставшего международным средством общения, противоречия уже сняты. Институт стандартизации США (ANSI –

American Standard Institute) ввел в действие систему кодирования ASCII (American Standard Code for Information Interchange – стандартный код

информационного обмена США). В системе ASCII закреплены две таблицы кодирования – базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам от 128 до 255.

Базовая ascii-кодировка

При нажатии алфавитно-цифровых (символьных) клавиш, клавиш , и , а также некоторых их комбинаций с или — генерируются однобайтовые ASCII-коды или двухбайтовые расширенные коды. Исторически сложилось так, что эта система кодировки была первой общепринятой в мире для компьютеров IBM.

Название ASCII представляет собой аббревиатуру английской фразы American Standard Code for Information Interchange  (Американский Стандартный Код для Обмена Информацией). Всего кодов 256 (с 0-го по 255-й). Первые 32 ASCII-кода (с 0 по 31) управляющие и используются для общения с периферийными устройствами или применяются для специальных целей различными программами. Им, как и остальным, присвоены определенные символы, но на экран их можно вывести только прямым обращением в видеопамять.

Чтобы в дальнейшем не было ошибок, запомните, что, например, ASCII 9 относится к клавише , а не к цифре 9, которая имеет по этому стандарту код ASCII 57.

Сначала в системах кодирования было много путаницы. Кодировок гуляло по миру множество. Была основная кодировка, болгарская, КОИ-7, КОИ-8, альтернативная и много других.

Многообразие способов кодирования связано с тем, что при разработке компанией IBM своих первых компьютеров и создании для них компанией Microsoft операционной системы MS DOS, было заложено очень трудно обходимое техническое ограничение на число используемых символов — не более 256. Это количество в то время полностью перекрывали все мыслимые потребности англоязычного пользователя. Странная, на первый взгляд, цифра 256 обусловлена тем, что это максимальное число (2•108), которое может быть записано в двоичной системе в 1-ном байте (8 бит, то есть восемь 0 и 1). А именно 1 байт отводился в MS DOS для хранения любого символа. Последствия этого ограничения со временем и начали проявляться при широком распространении компьютеров не только в англоязычных странах.

В конце концов все же пришли к разумному компромиссу:

  • первые 128 кодов (с 0-го по 127-й) с управляющими символами, некоторыми специальными знаками, цифрами и латинским алфавитом остаются в неприкосновенности;

  • коды со 176-го по 223-й сохранены за символами псевдографики;

  • остальные же коды отданы на откуп потребителям.

У нас наибольшее распространение получила альтернативная ASCII-кодировка, построенная именно по такому принципу: в оставшихся свободными кодах располагаются буквы русского (или другого национального) алфавита. Тем самым обеспечивалась преемственность программного обеспечения, разработанного в других странах, — здесь мы были не "впереди планеты всей...".

В альтернативной ASCII-кодировке:

  • прописные русские буквы:

  • имеют номера со 128 по 159 — (с "А" по "Я"),

  • буква "Ё" стоит особняком под номером 240.

  • строчные русские буквы (чтобы сохранить символы псевдографики) разбросаны:

  • буквы с "а" по "п" имеют номера со 160 по 175,

  • с "р" по "я" занимают позиции с 224 по 239,

  • буква "ё" снова на отшибе и имеет номер 241.