- •Информатика как наука и как вид практической деятельности.
- •Место информатики в системе наук, направления развития информатики.
- •Направления развития теоретической информатики.
- •Понятие информации. Свойства информации.
- •7. Информация и данные.
- •Структурные типы данных
- •Теория информации. Основные понятия теории информации.
- •Теория кодирования. Основные понятия теории кодирования.
- •Вероятностный подход к определению количества информации.
- •Понятие энтропии, свойства энтропии. Условная энтропия.
- •Условная энтропия
- •Кодирование и декодирование. Эффективность кодирования.
- •Системы счисления.
- •Кодирование алфавитно-цифровой информации в компьютере.
- •Двоичное кодирование. Прямой, обратный, дополнительный код.
- •Прямой код двоичного числа
- •Обратный код двоичного числа
- •Дополнительный код двоичного числа
- •Кодирование текстовой информации.
- •Кодирование графической информации.
- •Разделимые коды. Префиксные коды. Равномерные коды. Избыточные коды.
- •Формула Хартли. Формула Шеннона.
- •Коды с обнаружением ошибок. Коды с исправлением ошибок. Блочные коды.
- •Оптимальные коды. Метод Хафмана.
- •Кодирование Хаффмана
- •Коды Хемминга. Величины Хемминга.
- •Систематические коды[править | править вики-текст]
- •Самоконтролирующиеся коды[править | править вики-текст]
- •Самокорректирующиеся коды[править | править вики-текст]
- •Теоремы Шеннона.
- •Криптографический подход.
- •Машина Тьюринга.
- •Кодирование по Шеннону-Фано
Кодирование алфавитно-цифровой информации в компьютере.
Современные вычислительные машины обрабатывают не только числовую, но и текстовую, иначе говоря, алфавитно-цифровую информацию, содержащую цифры, буквы, знаки препинания, математические и другие обозначения, называемые символами. > Существуют символы трех типов: цифры 0, 1, 2, . . .,9
буквы Аа, ВЬ, ... , Zz
специальные символы . . . «+», «—», «•», «,», « = », пробел, «:», «;»
Термин «буквенно-цифровая информация» относится и к цифрам, и к буквам, и к специальным символам. Совокупность символов, используемых каким-либо устройством, называется набором символов или алфавитом этого устройства. Именно такой характер имеет экономическая, планово-производственная, учетная, бухгалтерская, статистическая и другая информация, содержащая наименование предметов, фамилии людей и т. д. Характер этой информации таков, что для ее представления требуются слова переменной длины. Возможность ввода, обработки и вывода алфавитно-цифровой информации важна и для решения чисто математических задач, так как позволяет оформлять результаты вычислений в удобной форме — в виде таблиц с нужными заголовками и пояснениями. Чтобы иметь возможность представлять в ЭВМ информацию, выраженную символами алфавита, необходимо сами символы закодировать определенным образом. Код — это система символов, отображающих сообщение в данном алфавите. Все ЭВМ работают в двоичном коде (режиме). Существует несколько систем кодирования. В ЕС ЭВМ применяют четыре системы, одна из которых основана на представлении символов 7-разрядным двоичным кодом, две — 8-разрядным и 12-позиционная, которая предназначена для представления символов на 12-позиционных перфокартах. Наибольшее распространение получило представление алфавитно-цифровой информации посредством восьмиразрядного кода.Каждый код представляет одну двоичную цифру или один двоичный разряд, или один бит. Бит (binary digit — двоичная цифра) — двоичная единица количества информации. Байт принят в качестве основной единицы количества инфор-мации и представляет собой группу из восьми соседних двоичных разрядов (бит), которой вычислительная машина может оперировать как единым целым при передаче, хранении и обработке данных (информации).
Цифровые вычислительные машины Единой системы относятся к символьно-ориентированным ЭВМ. При использовании каждой команды в соответствии с указаниями, содержащимися в ней, они обрабатывают по одному или по нескольку байтов информации. Каждый такой байт эквивалентен либо символу определенного входного языка, либо числу или его части в зависимости от его значения и системы счисления, в которой оно выражено.
Байт был принят в качестве основной машинной единицы информации для того, чтобы возможно было создать системы машин, процесс обработки информации в которых был бы независим от размеров преобразуемых слов. Этот выбор обусловил внедрение единой иерархической структуры данных. В порядке увеличения количества разрядов эта структура содержит (рис. 34) фиксированные составные единицы (полуслово, слово, двойное слово) и информационную единицу переменной длины (поле). Полуслово состоит из двух байт, слово — из четырех и двойное слово — из восьми (соответственно 16, 32 и 64 двоичных разрядов); поле может быть любой длины в пределах от 1 до 256 байт. В байте разряды нумеруются от 0 до 7, в полуслове — от О до 15, в слове — от 0 до 31, в двойном слове — от 0 до 63.
Для представления алфавитно-цифровой информации в вычислительной системе необходимо закодировать все используемые символы — цифры, буквы, знаки препинания, математические и специальные знаки, управляющие и другие символы, образующие ее алфавит. Код символа — это машинная единица информации, которая представляется группой двоичных разрядов, называемой слогом. Длина слога зависит от количества символов в алфавите и может быть различной, но преимущественное распространение получили восьмиразрядные (байтовые) слоги, посредством которых можно закодировать 256 символов. Организованная совокупность кодов всех символов образует алфавитно-цифровой код.
Код
знака числа (если он нужен) помещается
на место зоны в младший разряд. В системе
ДКОИ плюс кодируется четверкой
и
зона — 1111, а в системе
соответственно
1010, 1011 и 0101. Например, число —7.362 в зонном
формате при работе с кодом ДКОИ имеет
вид
Упакованный формат использует каждый байт для представления двух чисел, кроме младшего байта, в котором правая четверка битов отводится для кода знака. Если левая четверка битов самого старшего байта окажется свободной, она заполняется нулями, т. е. десятичное число всегда занимает целое число байтов. Например:
При выполнении арифметических операций используется только упакованный формат, в котором десятичное число может занимать до 16 байт, что соответствует 31 десятичному разряду и знаку. Зонный формат используется при операциях ввода-вывода десятичных данных. В вычислительных системах предусматривается возможность взаимного преобразования форматов, причем информация о месте расположения разделительного знака дробного числа фиксируется в самой программе.
