Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лк2.Информация и энтропия. Измерение информации.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
229.12 Кб
Скачать

Алфавитный подход

В 1946 г. американский ученый-статистик Джон Тьюки предложил название бит (bit — аббревиатура от BInary digiT), одно из главных понятий XX века. Тьюки избрал бит для обозначения одного двоичного разряда, способного принимать значение 0 или 1. 

Количество информации подменяется понятием информационного объема сообщения. Письменное сообщение кодируется алфавитным языком, количество информации считается равным произведению количества символов сообщения на количество информации, содержащееся в каждом символе. Если, например, алфавит состоит из тридцати двух символов, то каждый символ содержит пять бит информации. Информационный объем сообщения из 35 символов такого алфавита равен 35 * 5 = 175 битам.

В широко используемом алфавите ASCII содержится 256 символов, и каждый символ содержит 8 бит информации (кодируется восемью двоичными символами). Соответственно, информационный объем сообщения из 35 символов равен 35 * 8 = 280 битам.

Единица измерения «бит» слишком мала для практического использования. Особое название имеет 4 бита — ниббл (полубайт, тетрада, четыре двоичных разряда)

Чаще используют более крупные единицы измерения:

1 байт = 8 бит

1 Кбайт = 210 байт

1 Мбайт = 210 Кбайт

1 Гбайт = 210 Мбайт

1Тбайт = 210 Гбайт

Чему равно «кило»?

Долгое время разнице между множителями 1000 и 1024 старались не придавать большого значения. Во избежание недоразумений следует чётко понимать различие между двоичными кратными единицами, обозначаемыми согласно ГОСТ 8.417-2002 как «Кбайт», «Мбайт», «Гбайт» и т. д. (два в степенях кратных десяти) и единицами килобайт, мегабайт, гигабайт и т. д., понимаемыми как научные термины (десять в степенях кратных трём).

Последние по определению равны соответственно 103, 106, 109 байт.

В качестве терминов для «Кбайт», «Мбайт», «Гбайт» и т. д. МЭК3 предлагает «кибибайт», «мебибайт», «гибибайт» и т. д., однако эти термины критикуются за непроизносимость и не встречаются в устной речи.

В различных областях информатики предпочтения в употреблении десятичных и двоичных единиц тоже различны. Причём, хотя со времени стандартизации терминологии и обозначений прошло уже несколько лет, далеко не везде стремятся прояснить точное значение используемых единиц.

Измерения в байтах

Десятичная приставка

Двоичная приставка

Название

Символ

Степень

Название

Символ

Степень

 

ГОСТ

 

МЭК

байт

B

100

байт

B

байт

20

килобайт

kB

103

кибибайт

KiB

Кбайт

210

мегабайт

MB

106

мебибайт

MiB

Мбайт

220

гигабайт

GB

109

гибибайт

GiB

Гбайт

230

терабайт

TB

1012

тебибайт

TiB

Тбайт

240

петабайт

PB

1015

пебибайт

PiB

Пбайт

250

эксабайт

EB

1018

эксбибайт

EiB

Эбайт

260

зеттабайт

ZB

1021

зебибайт

ZiB

Збайт

270

йоттабайт

YB

1024

йобибайт

YiB

Йбайт

280

1 Слово введено в науку в 1865 г. немецким физиком Клаузиусом (Clausius Rudolf Julius Emanuel, 1822-1888), для кинетической теории газов. По аналогии со словом энергия, означающем «в действии, в работе», он составил слово из двух древнегреческих: έν — в, и τροπία— поворот, перемена. Получившемуся слову он придавал смысл «в трансформации, в перемене», имея в виду «содержание трансформации».

2 Ясно почему: «орёл» — это изображение на лицевой части монеты двуглавого орла Российского герба, а «решка» — она образовалась от «решетки», или вензеля, — узорного переплетения царских инициалов.

3 МЭК; англ. International Electrotechnical Commission, IEC — международная некоммерческая организация по стандартизации в области электрических, электронных и смежных технологий. Некоторые из стандартов МЭК разрабатываются совместно с Международной организацией по стандартизации (ISO).

Страница 8 из 8