Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
kurs_toi1.docx
Скачиваний:
89
Добавлен:
02.05.2015
Размер:
753.33 Кб
Скачать

3.2. Двоичное кодирование информации в компьютере

В компьютере для представления информации используется двоичное кодирование, так как удалось создать надежно работающие технические устройства, которые могут со стопроцентной надежностью сохранять и распознавать не более двух различных состояний (цифр):

  • электромагнитные реле (замкнуто/разомкнуто), широко использовались в конструкциях первых ЭВМ;

  • участок поверхности магнитного носителя информации (намагничен/размагничен);

  • участок поверхности лазерного диска (отражает/не отра­жает);

  • триггер, может устойчиво находиться в одном из двух состояний, широко используется в оператив­ной памяти компьютера.

Все виды информации в компьютере кодируются на машинном языке, в виде логических последовательностей нулей и единиц.

Информация в компьютере представлена в двоичном коде, алфавит которого состоит из двух цифр (0 и 1).

Цифры двоичного кода можно рассматривать как два равновероятных состояния (события). При записи двоичной цифры реализуется выбор одного из двух возможных состояний (одной из двух цифр) и, следовательно, она несет количество информации, равное 1 биту.

Даже сама единица измерения количества информации бит (bit) получила свое название от английского словосочетания Binary digiT (двоичная цифра).

Важно, что каждая цифра машинного двоичного кода несет информацию в 1 бит. Таким образом, две цифры несут информацию в 2 бита, три цифры — в 3 бита и так далее. Количество информации в битах равно количеству цифр двоичного машинного кода.

Каждая цифра машинного двоичного кода несет количество информации, равное одному биту.

3.3.Кодирование текстовой информации

В настоящее время большая часть пользователей при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др. 

Традиционно для того чтобы закодировать один символ используют количество информации равное 1 байту, т. е. I = 1 байт = 8 бит. При помощи формулы(2.1), которая связывает между собой количество возможных событий N и количество информации I, можно вычислить сколько различных символов можно закодировать (считая, что символы - это возможные события):

N=2I = 28 = 256,

т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов.

Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255.

Необходимо помнить, что в настоящее время для кодировки русских букв используют пять различных кодовых таблиц (КОИ - 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой кодировке.

Впрочем, в большинстве случаев о перекодировке текстовых документов заботится на пользователь, а специальные программы - конверторы, которые встроены в приложения.

Начиная с 1997 г. последние версии Microsoft Windows&Office поддерживают новую кодировку Unicode, которая на каждый символ отводит по 2 байта, а, поэтому, можно закодировать не 256 символов, а 65536 различных символов.

Пример решения задачи. Объем сообщения, содержащего 1024 символа, составил 1/512 часть Мбайта. Определить мощность алфавита.

Решение

Q = 1/512 * 1024 * 1024 * 8 = 16384 бит. - перевели в биты информационный объем сообщения.

I = Q / K = 16384 /1024 =16 бит - приходится на один символ алфавита.

N = 216 = 65536 символов - мощность использованного алфавита.

Именно такой алфавит используется в кодировке Unicode, который должен стать международным стандартом для представления символьной информации в компьютере.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]