Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика. Лекции.doc
Скачиваний:
1199
Добавлен:
16.03.2016
Размер:
1.01 Mб
Скачать

2. Кодировка латинского алфавита и кириллицы

Система числового кодирования компьютерных символов построена следующим образом.

  1. Каждому символу, обозначенному на клавиатуре компьютера, присваивается двоичный восьмиразрядный код. Последовательность символов и их кодов формируется в кодировочную таблицу в порядке возрастания чисел и алфавитном порядке расположения букв. Кодировочная таблица компьютерных символов впервые была создана в США под названием ASCII (American Standard Code for Information Interchange) – американский стандартный код для обмена информацией19. Позже таблица ASCII-кодов была признана в качестве международного стандарта всеми странами, участвующими в глобальных информационных процессах. Иногда кодировочную таблицу упрощенно называют аски-код.

  2. В таблице ASCII все кодируемые символы делятся на две группы, в первую из которых включается 128 символов (от 0 до 127) стандартного или неизменяемого кода, а во вторую – следующие 128 символов (от 128 до 255), которые относятся к расширяемой или изменяемой части кода (табл.8.2).

  3. В первой стандартной группе кодируются буквы латинского алфавита, арабские цифры, математические знаки, знаки препинания и др. Кодировка первой группы символов является международной и обязательной для всех компьютеров, участвующих в процессе глобального обмена информацией.

Таблица 8.2

Представление символов в кодовой таблице ASCII

I половина - 128 символов (0-127)

II половина - 128 символов (128-255)

управляющие коды

Национальный алфавит.

В России, Украине, Белоруссии, Сербии, Болгарии - кириллица

латинский алфавит (26 букв)

арабские цифры

математические знаки

знаки препинания

  1. Вторая группа из 128 символов предоставлена для кодирования национальных алфавитов. Национальный алфавит русского языка (а также украинского, белорусского, болгарского) известен всему миру под названием кириллица.

Кириллица как славянская азбука была создана братьями Кириллом и Мефодием. Позже азбука была реформирована Петром I, реформированная кириллица служит до нашего времени. С появлением компьютеров кириллица была закодирована, исторически сложилось 6 способов кодировки кириллицы, различные версии кодировки появлялись одна за другой в процессе развития компьютерной техники. Со временем некоторые кодировки исчезли из употребления, к действующим в настоящее время относятся 4 кодировки.

Виды кодировок кириллицы

  1. CP1251 (Windows-кодировка) – создана для работы под операционной системой Windows.

  2. KOI-8r – используется для представления русских текстов в сети Интернет.

  3. ISO-8859 - кодировка кириллических текстов на основе международного стандарта, на территории России встречается редко.

  4. Unicode – сравнительно новая международная 4-х байтовая кодировка, которая отличается от предыдущих 1-байтовых версий широкими количественными возможностями и может использоваться для кодирования всех языков на планете Земля, в том числе, славянской азбуки кириллицы.

Наличие многих кодировок кириллицы иногда создает трудности по переходу из одной кодировки в другую. Для перехода между кодировками используются специальные программы, которые называются текстовыми конверторами. Современные конверторы способны самостоятельно определять исходную кодировку текста,  расшифровывать текст и представлять его на естественном языке.