Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Teoria_kodirovania.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
427.75 Кб
Скачать
  1. Кодирование алфавитно-цифровой информации в компьютере.

Современные вычислительные машины обрабатывают не только числовую, но и текстовую, иначе говоря, алфавитно-цифровую информацию, содержащую цифры, буквы, знаки препинания, математические и другие обозначения, называемые символами. > Существуют символы трех типов: цифры    0, 1, 2,   .   .   .,9

буквы    Аа, ВЬ, ... , Zz

специальные символы . . . «+», «—», «•», «,», « = », пробел, «:», «;»

Термин «буквенно-цифровая информация» относится и к цифрам, и к буквам, и к специальным символам. Совокупность символов, используемых каким-либо устройством, называется набором символов или алфавитом этого устройства.    Именно такой характер имеет экономическая, планово-производственная, учетная, бухгалтерская, статистическая и другая информация, содержащая наименование предметов, фамилии людей и т. д. Характер этой информации таков, что для ее представления требуются слова переменной длины. Возможность ввода, обработки и вывода алфавитно-цифровой информации важна и для решения чисто математических задач, так как позволяет оформлять результаты вычислений в удобной форме — в виде таблиц с нужными заголовками и пояснениями.     Чтобы иметь возможность представлять в ЭВМ информацию, выраженную символами алфавита, необходимо сами символы закодировать определенным образом.    Код — это система символов, отображающих сообщение в данном алфавите. Все ЭВМ работают в двоичном коде (режиме).    Существует несколько систем кодирования. В ЕС ЭВМ применяют четыре системы, одна из которых основана на представлении символов 7-разрядным двоичным кодом, две — 8-разрядным и 12-позиционная, которая предназначена для представления символов на 12-позиционных перфокартах. Наибольшее распространение получило представление алфавитно-цифровой информации посредством восьмиразрядного кода.Каждый код представляет одну двоичную цифру или один двоичный разряд, или один бит.    Бит (binary digit — двоичная цифра) — двоичная единица количества информации.    Байт принят в качестве основной единицы количества инфор-мации и представляет собой группу из восьми соседних двоичных разрядов (бит), которой вычислительная машина может оперировать как единым целым при передаче, хранении и обработке данных (информации).

Цифровые вычислительные машины Единой системы относятся к символьно-ориентированным ЭВМ. При использовании каждой команды в соответствии с указаниями, содержащимися в ней, они обрабатывают по одному или по нескольку байтов информации. Каждый такой байт эквивалентен либо символу определенного входного языка, либо числу или его части в зависимости от его значения и системы счисления, в которой оно выражено.

Байт был принят в качестве основной машинной единицы информации для того, чтобы возможно было создать системы машин, процесс обработки информации в которых был бы независим от размеров преобразуемых слов. Этот выбор обусловил внедрение единой иерархической структуры данных. В порядке увеличения количества разрядов эта структура содержит (рис. 34) фиксированные составные единицы (полуслово, слово, двойное слово) и информационную единицу переменной длины (поле). Полуслово состоит из двух байт, слово — из четырех и двойное слово — из восьми (соответственно 16, 32 и 64 двоичных разрядов); поле может быть любой длины в пределах от 1 до 256 байт. В байте разряды нумеруются от 0 до 7, в полуслове — от О до 15, в слове — от 0 до 31, в двойном слове — от 0 до 63.

Для представления алфавитно-цифровой информации в вычислительной системе необходимо закодировать все используемые символы — цифры, буквы, знаки препинания, математические и специальные знаки, управляющие и другие символы, образующие ее алфавит. Код символа — это машинная единица информации, которая представляется группой двоичных разрядов, называемой слогом. Длина слога зависит от количества символов в алфавите и может быть различной, но преимущественное распространение получили восьмиразрядные (байтовые) слоги, посредством которых можно закодировать 256 символов. Организованная совокупность кодов всех символов образует алфавитно-цифровой код.

Код знака числа (если он нужен) помещается на место зоны в младший разряд. В системе ДКОИ плюс кодируется четверкой   и зона — 1111, а в системе   соответственно 1010, 1011 и 0101. Например, число —7.362 в зонном формате при работе с кодом ДКОИ имеет вид

Упакованный формат использует каждый байт для представления двух чисел, кроме младшего байта, в котором правая четверка битов отводится для кода знака. Если левая четверка битов самого старшего байта окажется свободной, она заполняется нулями, т. е. десятичное число всегда занимает целое число байтов. Например:

При выполнении арифметических операций используется только упакованный формат, в котором десятичное число может занимать до 16 байт, что соответствует 31 десятичному разряду и знаку. Зонный формат используется при операциях ввода-вывода десятичных данных. В вычислительных системах предусматривается возможность взаимного преобразования форматов, причем информация о месте расположения разделительного знака дробного числа фиксируется в самой программе.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]