Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика - Лабораторный практикум(для студентов).doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
4.54 Mб
Скачать

Тема 1. Единицы измерения информации. Системы счисления Единицы измерения информации

Единица измерения информации называется бит (bit) – сокращение от английских слов binary digit, что означает двоичная цифра.

Пример. Если подбросить монету и проследить, какой стороной она упадет, то мы получим определенную информацию. Обе стороны монеты «равноправны», поэтому одинаково вероятно, что выпадет как одна, так и другая сторона. В таких случаях говорят, что событие несет информацию в 1 бит.

Пример. Если положить в мешок два шарика разного цвета, то, вытащив вслепую один шар, мы также получим информацию о цвете шара в 1 бит.

В информатике часто используется величина, называемая байтом (byte),

1 байт = 8 бит.

И если бит позволяет выбрать один вариант из двух возможных, то байт – из 256 (28) вариантов.

Наряду с байтами, для измерения количества информации используются более крупные единицы:

1 Кбайт (килобайт) = 210 байт = 1024 байта;

1 Мбайт (мегабайт) = 210 Кбайт = 1024 Кбайта;

1 Гбайт (гигабайт) = 210 Мбайт = 1024 Мбайта.

1 Тбайт (терабайт) = 240 байта = 1024 Гбайта,

1 Пбайт (петабайт) = 250 байта = 1024 Тбайта.

Содержательный подход к измерению информации

Пусть в некотором сообщении содержатся сведения о том, что произошло одно из N равновероятных событий. Тогда количество информации х, заключенное в этом сообщении, и число событий N связаны формулой:

. (1)

Решение уравнения (1) имеет вид:

. (2)

То есть именно такое количество информации необходимо для устранения неопределенности из N равнозначных вариантов. Формула (2) носит название формулы Хартли. Получена она в 1928 г. американским инженером Р. Хартли.

Алфавитный подход к измерению информации

При алфавитном подходе, если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой (равновероятно), то количество информации, которое несет каждый символ (информационный вес одного символа), вычисляется по формуле (2), где N – мощность алфавита (полное количество символов, составляющих алфавит выбранного кодирования).

В алфавите, который состоит из двух символов (двоичное кодирование), каждый символ несет 1 бит (21) информации; из четырех символов – каждый символ несет 2 бита информации(22); из восьми символов – 3 бита (23) и т.д. Один символ из алфавита мощностью 256 (28) несет в тексте 8 битов информации. Алфавит из 256 символов используется для представления текстов в компьютере. Один байт информации можно передать с помощью одного символа кодировки ASCII. Если весь текст состоит из K символов, то при алфавитном подходе размер содержащейся в нем информации I определяется по формуле:

, (3)

где x – информационный вес одного символа в используемом алфавите.

Пример. Книга содержит 100 страниц; на каждой странице – 35 строк, в каждой строке – 50 символов. Необходимо рассчитать объем информации, содержащийся в книге.

Страница содержит

3550 = 1750 байт информации.

Объем всей информации в книге (в разных единицах):

1750100 = 175000 байт.

175000÷1024 = 170,8984 Кбайт.

170,8984÷1024 = 0,166893 Мбайт.