Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Измерение и кодирование информации.docx
Скачиваний:
7
Добавлен:
04.11.2018
Размер:
104.71 Кб
Скачать

Объемный (технический) подход

Объемный способ является самым простым способом измерения информации. Объем информации – это количество символов в сообщении. Поскольку, например, одно и то же число может записано многими разными способами (с использованием разных алфавитов), этот способ чувствителен к форме представления сообщения.

В вычислительной технике вся обрабатываемая и хранимая информация вне зависимости от ее природы (число, текст, изображение) представляется в двоичной форме, то есть с использованием алфавита, состоящего всего из двух символов (цифр) 0 и 1. В двоичной системе счисления знаки 0 и 1 называют битами (от английского выражения BInary DigiTs двоичные цифры). Отметим, что создатели компьютеров отдают предпочтение именно двоичной системе счисления, потому, что в техническом устройстве наиболее просто реализовать два противоположных физических состояниях.

Объем информации, записанной двоичными знаками (цифрами) в памяти компьютера или на внешнем носителе информации, подсчитывается просто по количеству требуемых для такой записи двоичных символов. При этом невозможно нецелое число битов (в отличие от вероятностного подхода).

Таким образом, количество информации в сообщении определяется по формуле

I=k*H, (3)

где k – количество символов в сообщении,

Н – количество информации в битах, содержащееся в одном символе любого языка (подсчитывается по формуле Хартли).

Для измерения больших объемов информации были введены более крупные, чем бит, единицы количества информации. Так, двоичное слово из восьми бит содержит один байт информации. Именно один байт требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256=28).

Широко используются также ещё более крупные единицы информации:

1 килобайт (Кбайт) = 1024 байт;

1 мегабайт (Мбайт) = 1024 килобайт;

1 гигабайт (Гбайт) = 1024 мегабайт;

1 терабайт (Мбайт) = 1024 гигабайт;

1 петабайт (Пбайт) = 1024 терабайт.

Рассмотрим пример. В сообщении, записанном на языке, алфавит которого состоит из 32 символов, содержится 80 символов. Какое количество информации в байтах содержит данное сообщение? Количество символов в алфавите N=32. По формуле Хартли количество информации, содержащее в одном символе, Н=log232=5 бит. Количество информации в сообщении I=k*H=80*5=400 бит=4008 байт=50 байт.

Приведем в качестве примера еще одну задачу. Необходимо определить, какой объем информации содержит реферат, набранный на компьютере и содержащий 88 страниц, если на каждой странице 50 строк, а в каждой строке – в среднем 60 символов.

Для представления текстов в компьютере используется алфавит из 256 символов. Один символ такого алфавита несет Н=log2256=8 бит или 1 байт информации. Значит, одна страница будет содержать 5060=3000 байт информации. Объем все информации в реферате:

300088=264000 байт,

2640001024 Кбайт=257,87125 Кбайт,

257,871251024 Мбайт=0,2518 Мбайт.

Между вероятностным и объемным количеством информации соотношение неоднозначное. Далеко не всякий текст, записанный двоичными символами, допускает измерение объема информации в вероятностном смысле, но заведомо допускает его измерение в объемном смысле. Если некоторое сообщение допускает измеримость количества информации в обоих смыслах, то они не обязательно совпадают, при этом вероятностное измерение информации не может быть больше объемного.