Алфавитный подход
В 1946 г. американский ученый-статистик Джон Тьюки предложил название бит (bit — аббревиатура от BInary digiT), одно из главных понятий XX века. Тьюки избрал бит для обозначения одного двоичного разряда, способного принимать значение 0 или 1.
Количество информации подменяется понятием информационного объема сообщения. Письменное сообщение кодируется алфавитным языком, количество информации считается равным произведению количества символов сообщения на количество информации, содержащееся в каждом символе. Если, например, алфавит состоит из тридцати двух символов, то каждый символ содержит пять бит информации. Информационный объем сообщения из 35 символов такого алфавита равен 35 * 5 = 175 битам.
В широко используемом алфавите ASCII содержится 256 символов, и каждый символ содержит 8 бит информации (кодируется восемью двоичными символами). Соответственно, информационный объем сообщения из 35 символов равен 35 * 8 = 280 битам.
Единица измерения «бит» слишком мала для практического использования. Особое название имеет 4 бита — ниббл (полубайт, тетрада, четыре двоичных разряда)
Чаще используют более крупные единицы измерения:
1 байт = 8 бит
1 Кбайт = 210 байт
1 Мбайт = 210 Кбайт
1 Гбайт = 210 Мбайт
1Тбайт = 210 Гбайт
Чему равно «кило»?
Долгое время разнице между множителями 1000 и 1024 старались не придавать большого значения. Во избежание недоразумений следует чётко понимать различие между двоичными кратными единицами, обозначаемыми согласно ГОСТ 8.417-2002 как «Кбайт», «Мбайт», «Гбайт» и т. д. (два в степенях кратных десяти) и единицами килобайт, мегабайт, гигабайт и т. д., понимаемыми как научные термины (десять в степенях кратных трём).
Последние по определению равны соответственно 103, 106, 109 байт.
В качестве терминов для «Кбайт», «Мбайт», «Гбайт» и т. д. МЭК3 предлагает «кибибайт», «мебибайт», «гибибайт» и т. д., однако эти термины критикуются за непроизносимость и не встречаются в устной речи.
В различных областях информатики предпочтения в употреблении десятичных и двоичных единиц тоже различны. Причём, хотя со времени стандартизации терминологии и обозначений прошло уже несколько лет, далеко не везде стремятся прояснить точное значение используемых единиц.
Измерения в байтах |
||||||
Десятичная приставка |
Двоичная приставка |
|||||
Название |
Символ |
Степень |
Название |
Символ |
Степень |
|
|
ГОСТ |
|
|
|
МЭК |
|
байт |
B |
100 |
байт |
B |
байт |
20 |
килобайт |
kB |
103 |
кибибайт |
KiB |
Кбайт |
210 |
мегабайт |
MB |
106 |
мебибайт |
MiB |
Мбайт |
220 |
гигабайт |
GB |
109 |
гибибайт |
GiB |
Гбайт |
230 |
терабайт |
TB |
1012 |
тебибайт |
TiB |
Тбайт |
240 |
петабайт |
PB |
1015 |
пебибайт |
PiB |
Пбайт |
250 |
эксабайт |
EB |
1018 |
эксбибайт |
EiB |
Эбайт |
260 |
зеттабайт |
ZB |
1021 |
зебибайт |
ZiB |
Збайт |
270 |
йоттабайт |
YB |
1024 |
йобибайт |
YiB |
Йбайт |
280 |
1 Слово введено в науку в 1865 г. немецким физиком Клаузиусом (Clausius Rudolf Julius Emanuel, 1822-1888), для кинетической теории газов. По аналогии со словом энергия, означающем «в действии, в работе», он составил слово из двух древнегреческих: έν — в, и τροπία— поворот, перемена. Получившемуся слову он придавал смысл «в трансформации, в перемене», имея в виду «содержание трансформации».
2 Ясно почему: «орёл» — это изображение на лицевой части монеты двуглавого орла Российского герба, а «решка» — она образовалась от «решетки», или вензеля, — узорного переплетения царских инициалов.
3 МЭК; англ. International Electrotechnical Commission, IEC — международная некоммерческая организация по стандартизации в области электрических, электронных и смежных технологий. Некоторые из стандартов МЭК разрабатываются совместно с Международной организацией по стандартизации (ISO).
Страница
