1.6.Файлы и файловая структура

1.6.1. Единицы представления данных

Сообщения обычно содержат информацию о каких-либо событиях. Количество информации для событий с различными вероятностями определяется по следующей формуле:

где I – количество информации, N – количество возможных событий, p_i- вероятности отдельных событий.

Если события равновероятны, то количество информации определяется по следующим формулам:

I = log₂N
N = 2^I.

В информатике за единицу количества информации принят 1 бит - количество информации, содержащееся в сообщении, уменьшающем неопределенность знаний в два раза. Совокупность двоичных разрядов, выражающих числовые или иные данные, образует некий битовый рисунок. Практика показывает, что с битовым представлением удобнее работать, если этот рисунок имеет регулярную форму. В качестве таких форм используются группы из восьми битов, которые называются байтами. Пример представления чисел в виде битов представлен в таблице:

Десятичное число	Двоичное число	Байт
1	1	0000 0001
2	10	0000 0010
…	…	…
255	11111111	1111 1111

Понятие о байте, как группе взаимосвязанных битов, появилось вместе с первыми образцами электронной вычислительной техники. Долгое время оно было машиннозависимым, то есть для разных вычислительных машин длина байта была разной. Только в конце 60-х годов понятие байта стало универсальным и машиннонезависимым.

Во многих случаях целесообразно использовать не восьмиразрядное кодирование, а 16-разрядное, 24-разрядное, 32-разрядное и более. Группа из 16 взаимосвязанных бит (двух взаимосвязанных байтов) в информатике называется словом. Соответственно, группы из четырех взаимосвязанных байтов (32 разряда) называются удвоенным словом, а группы из восьми байтов (64 разряда) - учетверенным словом.

1.6.2. Единицы измерения данных

Наименьшей единицей измерения является байт. Поскольку одним байтом кодируется один символ текстовой информации, то для текстовых документов размер в байтах соответствует лексическому объему в символах (исключение представляет универсальная кодировка UNICODE).

Более крупная единица измерения – килобайт (Кбайт). Условно можно считать, что 1 Кбайт примерно равен 1000 байт. Условность связана с тем, что для вычислительной техники, работающей с двоичными числами, более удобно представление чисел в виде степени двойки, и потому на самом деле 1 Кбайт равен 2¹⁰ байт (1024 байт). Там, где это не принципиально, с инженерной погрешностью (до 3 %) лишними байтами можно пренебречь. В килобайтах измеряют сравнительно небольшие объемы данных. Условно можно считать, что одна страница неформатированного машинописного текста составляет около 2 Кбайт.

Более крупные единицы измерения данных образуются добавлением префиксов мега-, гига-, тера-; в более крупных единицах пока нет практической надобности.

1 Мбайт = 1024 Кбайт = 10²⁰ байт;

1 Гбайт = 1024 Мбайт = 10³⁰ байт;

1 Тбайт = 1024 Гбайт = 10⁴⁰ байт.

При переходе к более крупным единицам «инженерная» погрешность, связанная с округлением, накапливается и становится недопустимой, поэтому на старших единицах измерения округление производится реже.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 1314 / 1714 15 16 17 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.20257.45 Mб0ГИДРОБИОЛОГИЯ.лабораторные.Карманова.doc
#
02.09.2019508.42 Кб5ГИС как система управления.doc
#
18.04.2019152.06 Кб9ГКН c 5 по 9 тему.doc
#
07.11.2018520.7 Кб9гл1-1.doc
#
19.03.2016437.25 Кб133гл1-1.doc
#
01.07.2025683.01 Кб0Глава 1 Информатика, основные понятия.doc
#
19.11.201969.63 Кб10Глава 10.doc
#
15.08.201988.68 Кб26ГЛАВА 2. ЭКОНОМИКА СТРОИТЕЛЬСТВА.docx
#
15.08.20192.4 Mб20ГЛАВА 3. ОСНОВЫ УПРАВЛЕНИЯ ПРОЕКТАМИ.docx
#
15.08.2019112.23 Кб10ГЛАВА 4. ОСНОВЫ МАРКЕТИНГА.docx
#
19.11.2019153.09 Кб6Глава 4.doc