
- •Глава 1
- •Глава 1 Основные понятия и определения информатики
- •1.1. Информатизация общества
- •1.1.1. Информационные ресурсы, продукты и услуги
- •1.1.2. Информационный рынок и его правовое регулирование
- •1.2. Информация, её виды и свойства
- •1.3. Данные и операции с ними
- •1.4. Кодирование данных
- •1.4.1. Кодирование целых и вещественных чисел
- •1.4.1.1. Системы счисления
- •1.4.1.2. Единичные системы счисления
- •1.4.1.3.Непозиционные системы счисления
- •1.4.1.4. Позиционные системы счисления
- •1.4.1.5. Перевод целых чисел из одной системы счисления в другую
- •1.4.1.6. Перевод дробных чисел из одной системы счисления в другую
- •1.4.1.7. Перевод произвольных чисел
- •1.4.2. Представление числовых данных в компьютере
- •1.4.3. Кодирование текстовых данных
- •1.4.4. Кодирование графической информации
- •1.4.5. Кодирование звуковой информации
- •1.5. Структуры данных
- •1.5.1. Линейные структуры (списки данных, векторы данных)
- •1.5.2. Табличные структуры ( матрицы)
- •1.5.3. Иерархические структуры данных
- •1.5.4. Упорядочение структур данных
- •1.6.Файлы и файловая структура
- •1.6.1. Единицы представления данных
- •1.6.2. Единицы измерения данных
- •1.6.3. Единицы хранения данных
- •1.6.4. Файловая структура
- •1.7. Информатика и информационные технологии
- •1.7.1. Предмет и задачи информатики
- •1.7.2. Виды информационных технологий
- •Контрольные вопросы
- •Тесты для самоконтроля
1.6.Файлы и файловая структура
1.6.1. Единицы представления данных
Сообщения обычно содержат информацию о каких-либо событиях. Количество информации для событий с различными вероятностями определяется по следующей формуле:
|
|
где I – количество информации, N – количество возможных событий, pi- вероятности отдельных событий.
Если события равновероятны, то количество информации определяется по следующим формулам:
I = log2N |
|
N = 2I . |
|
В информатике за единицу количества информации принят 1 бит - количество информации, содержащееся в сообщении, уменьшающем неопределенность знаний в два раза. Совокупность двоичных разрядов, выражающих числовые или иные данные, образует некий битовый рисунок. Практика показывает, что с битовым представлением удобнее работать, если этот рисунок имеет регулярную форму. В качестве таких форм используются группы из восьми битов, которые называются байтами. Пример представления чисел в виде битов представлен в таблице:
Десятичное число |
Двоичное число |
Байт |
1 |
1 |
0000 0001 |
2 |
10 |
0000 0010 |
… |
… |
… |
255 |
11111111 |
1111 1111 |
Понятие о байте, как группе взаимосвязанных битов, появилось вместе с первыми образцами электронной вычислительной техники. Долгое время оно было машиннозависимым, то есть для разных вычислительных машин длина байта была разной. Только в конце 60-х годов понятие байта стало универсальным и машиннонезависимым.
Во многих случаях целесообразно использовать не восьмиразрядное кодирование, а 16-разрядное, 24-разрядное, 32-разрядное и более. Группа из 16 взаимосвязанных бит (двух взаимосвязанных байтов) в информатике называется словом. Соответственно, группы из четырех взаимосвязанных байтов (32 разряда) называются удвоенным словом, а группы из восьми байтов (64 разряда) - учетверенным словом.
1.6.2. Единицы измерения данных
Наименьшей единицей измерения является байт. Поскольку одним байтом кодируется один символ текстовой информации, то для текстовых документов размер в байтах соответствует лексическому объему в символах (исключение представляет универсальная кодировка UNICODE).
Более крупная единица измерения – килобайт (Кбайт). Условно можно считать, что 1 Кбайт примерно равен 1000 байт. Условность связана с тем, что для вычислительной техники, работающей с двоичными числами, более удобно представление чисел в виде степени двойки, и потому на самом деле 1 Кбайт равен 210 байт (1024 байт). Там, где это не принципиально, с инженерной погрешностью (до 3 %) лишними байтами можно пренебречь. В килобайтах измеряют сравнительно небольшие объемы данных. Условно можно считать, что одна страница неформатированного машинописного текста составляет около 2 Кбайт.
Более крупные единицы измерения данных образуются добавлением префиксов мега-, гига-, тера-; в более крупных единицах пока нет практической надобности.
1 Мбайт = 1024 Кбайт = 1020 байт;
1 Гбайт = 1024 Мбайт = 1030 байт;
1 Тбайт = 1024 Гбайт = 1040 байт.
При переходе к более крупным единицам «инженерная» погрешность, связанная с округлением, накапливается и становится недопустимой, поэтому на старших единицах измерения округление производится реже.