Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Экзамен ЭВМ.docx
Скачиваний:
3
Добавлен:
01.05.2025
Размер:
946.11 Кб
Скачать

Вопрос №20 Представление символьной информации в эвм. Стандартные коды.

С точки зрения ЭВМ текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа "=", "()", "&" и т.п. и даже (обратите особое внимание!) пробелы между словами.

Каждый символ хранится в виде двоичного кода, который является номером символа. Можно сказать, что компьютер имеет собственный алфавит, где весь набор символов строго упорядочен. Количество символов в алфавите также тесно связано с двоичным представлением и у всех ЭВМ равняется 256. Иными словами, каждый символ всегда кодируется 8 битами, т.е. занимает ровно один байт.

Кодирование – выражение данных одного типа через данные другого типа.

Хранится не начертание буквы, а ее номер. Именно по этому номеру воспроизводится вид символа на экране дисплея или на бумаге. Поскольку алфавиты в различных типах ЭВМ не полностью совпадают, при переносе с одной модели на другую может произойти превращение разумного текста в "абракадабру". Такой эффект иногда получается даже на одной машине в различных программных средах: например, русский текст, набранный в MS DOS, нельзя без специального преобразования прочитать в Windows. Остается утешать себя тем, что задача перекодировки текста из одной кодовой таблицы в другую довольно проста и при наличии программ машина сама великолепно с ней справляется.

Наиболее стабильное положение в алфавитах всех ЭВМ занимают латинские буквы, цифры и некоторые специальные знаки. Это связано с существованием международного стандарта ASCII (American Standard Code for Information Interchange - Американский стандартный код для обмена информацией). В системе ASCII закреплены две таблицы кодирования – базовая и расширенная. Базовая таблица закрепляет значение кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.

Первые 32 кода базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств (в первую очередь производителям компьютеров и печатающих устройств). В этой области размещаются так называемые управляющие коды, которым не соответствуют никакие символы языков и, соответственно, эти коды не выводятся ни на экран, ни на устройства печати, но ими можно управлять тем, как производится вывод прочих данных.

Начиная с кода 32 по код 127 размещены символов английского алфавита, знаков препинания, цифр, арифметических действий и некоторых вспомогательных символов.

Стандарты кодировок:

  1. КОИ-8 - UNIX

  2. CP1251 («CP» означает «Code Page») - Microsoft Windows. Наиболее распространенная кодировка – это стандартная кириллистическая кодировка Microsoft Windows, обозначаемая сокращением CP1251 («CP» означает «Code Page»). Все Windows – приложения, работающие с русским языком, поддерживают эту кодировку.

  3. CP 866 - MS-DOS. Для работы в среде операционной системы MS-DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft – кодировка CP 866.

  4. Mac - Macintosh. Фирма Apple разработала для компьютеров Macintosh свою собственную кодировку русских букв (Mac)

  5. ISO 8859 – 5. Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO8859-5.

Наряду с кодом ASCII в ВС, в частности в сети Интернет, используется общий для всех стран мира универсальный код – Unicode (UCS-2). Этот код основан на паре байтов – машинном слове. 16 бит хватает для отображения 65535 символов. Unicode включает в себя все существующие алфавиты мира, а также множество математических, музыкальных, химических символов и многое другое. Существует кодировка и UCS-4, где для кодирования используют 4 байта, то есть можно кодировать более 4 млрд. символов.

КОИ-8 (код обмена информацией, восьмизначный) – её происхождение относится ко временам действия Совета Экономической Взаимопомощи государств Восточной Европы.

На компьютерах, работающих в операционной системе MS-DOS, могут действовать ещё две кодировки (кодировка ГОСТ и ГОСТ-альтернативная). Первая из них считалась устаревшей даже в первые годы появления персональной ВТ, но вторая используется и по сей день.

Международный стандарт, в котором предусмотрена кодировка символов русского алфавита, носит название кодировки ISO (International Standard Organization – Международный институт стандартизации). На практике данная кодировка используется редко.