Избыточность информации
Место для хранения информации в памяти компьютера и на жестком диске (и на других носителях информации) всегда рассчитывают по формуле Хартли, то есть рассчитывают на равновероятное распределение символов в алфавите (которым записана информация). Если же на самом деле вероятности появления символов разные, то реальное количество информации, хранящееся в сообщении, оказывается меньше, чем отведенное для его хранения место. Место расходуется неэффективно. Это явление называется избыточностью информации.
Чтобы устранить избыточность используют программы архиваторы, которые могут сжать информацию. Сообщение будет занимать меньше места в памяти или на диске, если устранить избыточность.
Иногда избыточность вводят специально. Потеря части сообщения не является проблемой, если информация избыточна. В этм прдложнии отерна чсть укв,но ео вс ещеможн прочсть. Искусственную избыточность создают для передачи информации по ненадежным каналам связи, где возможна потеря части информации при передаче, или для хранения на ненадежных носителях информации, где часть информации может быть искажена при считывании. Такая схема используется, например, для оптических (CD, DVD и BlueRay) дисков.
Кратные единицы количества информации
Один бит это очень маленькая единица информации. В процессе проектирования вычислительных машин у инженеров возникла необходимость использовать более крупные единицы информации. Термин Байт был введен инженером по имени Вернер Бухгольц при проектировании компьютера IBM 7030 в 1956 году. В этом компьютере байт был равен 6 битам. Другое название термина байт – машинное слово. Впрочем, в разных компьютерах машинное слово может иметь различную длину. Были компьютеры с размером машинного слова в 7 и 9 бит. Современные компьютеры используют машинное слово длиной 32 бит или даже 64 бит. А значение единицы байт было зафиксировано и она считается равной 8 битам.
1 Байт = 8 бит
Для
больших объемов информации используются
кратные единицы. В их названии по
историческим причинам стали использовать
приставки из системы Си : килобайт,
мегабайт, гигабайт и т.п. Однако
схемотехнические решения, принятые при
проектировании оперативной памяти
компьютеров, требовали, чтобы размер
памяти всегда был кратен степени двойки.
Тот факт, что
позволил
использовать «двоичные» кратные
приставки: 1 килобайт = 1024 байта, один
мегабайт = 1024 килобайта и т.д.
Однако «обычные» из системы Си и «двоичные» кратные приставки с одинаковыми названиями «кило» «мега» и т.д. породили путаницу с измерением объемов носителей информации. Наиболее известное проявление этого феномена – скандал вокруг объемов жестких дисков. Производители измеряли его с помощью «обычных» приставок, а операционная система компьютера с помощью «двоичных». В результате показываемый операционной системой объем диска оказывался «меньше» заявленного производителем. В США это привело даже к коллективному судебному иску покупателей к фирме-производителю жестких дисков Seagate (и этот иск был удовлетворен).
Для устранения путаницы был принят специальный международный стандарт МЭК (международной электротехнической комиссии). По этому стандарту двоичные приставки должны содержать в названии слог «би» (binary – двоичный): кибибайт, мебибайт, гибибайт и т.д.
