Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по микропроцессорам Щеглов.DOC
Скачиваний:
22
Добавлен:
17.09.2019
Размер:
8.33 Mб
Скачать

1.3.2. Кодирование десятичных чисел и алфавитно-цифровой информации.

Современные ЭВМ обрабатывают не только числовую, но и текстовую, другими словами – алфавитно-цифровую информацию, содержащую цифры, буквы, знаки препинания, математические и другие символы. Именно такой характер имеют экономическая, планово-производственная, учётная информация, а также тексты программ на алгоритмических языках и другая информация. Характер этой информации такой, что для её представления требуются слова переменной длины.

Возможность ввода, обработки и вывода алфавитно-цифровой информации важна и для решения чисто математических задач, так как позволяет оформлять результаты вычислений в удобной форме – в виде таблиц с нужными заголовками и пояснениями.

Совокупность всех символов, используемых в вычислительной системе, представляет собой её алфавит. Символу соответствует машинная единица информации слог. Так называют группу двоичных разрядов, служащую для представления символа в машине (двоичный код символа). Если группа включает k разрядов, то с её помощью можно кодировать 2k символов.

Наибольшее распространение получило представление алфавитно-цифровой информации с помощью 8-разрядных слогов, называемых байтами. С помощью байта можно кодировать 256 различных символов.

Для представления алфавитно-цифровой информации в ЭВМ используются различные стандарты двоичных кодов обмена информацией. Так в ЕС ЭВМ использовались восьмибитные коды для обмена и обработки информации КОИ-8, ДКОИ, в вычислительных системах IBM 360 и 370 восьми битный код EBCDIC (Extended Binary Coded Decimal Interchange Code) – расширенный двоично-кодированный десятичный код для обмена информацией. Каждый из переменных стандартов позволяет кодировать до 256 различных символов.

В мини ЭВМ, микро ЭВМ и персональных ЭВМ используются коды обмена информацией, ядром которых является семибитный код ASCII (American National Standard Code for Information Interchange) – Американский национальный стандартный код для обмена информацией. Этот код позволяет кодировать 128 различных символов включающие прописные и строчные буквы латинского алфавита. Добавление восьмого разряда к коду ASCII позволяет кодировать национальные алфавиты и символы псевдографики. ASCII код символа соответствует нулевому значению этого дополнительного разряда.

Например, в коде EBCDIC букве А соответствует код (С1)16, B – (C2)16, S – (E2)16. В ASCII коде латинские буквы от A до Z последовательными двоичными кодами от (41)16 до (5А)16.

Для представления текстовой информации используются строки символов. Строки символов изображаются в ЭВМ полем переменной длины. Так в ЕС ЭВМ длина поля может изменяться от 1 до 256 байт. В систему команд ЭВМ вводятся специальные команды для обработки строк символов.

В ЭВМ, поддерживаются десятичную арифметику, десятичные числа представляются либо в распакованном (зонном) формате, либо в упакованном формате. При представлении чисел в распакованном формате каждая цифра записывается в виде байта, значение которого определяется применяемым кодом обмена информации. Так в коде EBCDIC цифры 0,1,2,…,9 изображаются байтами (F0)16, (F1)16, (F2)16,…, (F9)16. Старшие четыре разряда заполняются единицами: (1111)2=(F)16. Они образуют зонную часть представления, поэтому распакованный формат называют зонным. Младшие четыре разряда образуют двоичное значение цифры в BCD – формате с весами 8421:

00000, 10001, 20010, 30011, 40100, 50101, 60110, 70111, 81000, 91001/

Для эффективного использования памяти, уменьшения длин программ и времени решения задач десятичные данные необходимо представлять последовательностями из любого числа цифр – полями переменной длины, которые могут содержать 1,2,… цифр. Так в ЕС ЭВМ десятичные числа представляются полями переменной длины от 1 до 16 байтов.