Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
EiTI_lektsii.doc
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
2.46 Mб
Скачать

2.5. Файловая структура, единицы и способы измерения данных

Существует множество систем представления данных. Наименьшей единицей такого представления является бит (двоичный разряд).

В настоящее время в качестве таких форм используются группы из восьми битов, которые называются байтами. Именно 8 бит требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256 = 28).

Группа из двух взаимосвязанных байтов в информатике называется словом.

Более крупная единица измерения – килобайт (Кбайт), который равен 210 байт (1024 байт).

Более крупные единицы измерения данных образуются добавлением префиксов мега-, гига-, тера-; в более крупных единицах пока нет практической надобности.

1 Килобайт (Кбайт) = 1024 байт = 210 байт

………………………………………………

1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт.

Количество информации можно измерить по формуле

A = –log2 (k),

где k = n / N – средняя частота;

n – число повторений одного объекта;

N – число всей совокупности.

Пример. Буква «а» в некотором тексте встречается 15 раз, общее количество букв в тексте 300.

Решение:

k = 15/300 = 0,05

–log2 0,05 = 4,32 бит.

Ответ: буква «а» занимает в тексте 4,32 бит.

При хранении данных решаются две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ.

Для обеспечения доступа необходимо, чтобы данные имели упорядоченную структуру в виде адресных данных.

В качестве единицы хранения данных принят объект переменной длины, называемый файлом. Файл это последовательность произвольного числа байтов, обладающая уникальным собственным именем. Обычно в отдельном файле хранят данные, относящиеся к одному типу.

В определении файла особое внимание уделяется имени. Оно фактически несет в себе адресные данные, без которых данные, хранящиеся в файле, не станут информацией из-за отсутствия метода доступа к ним [22].

Хранение файлов организуется в иерархической структуре, которая называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги (папки). Путь доступа к файлу начинается с имени устройства и включает все имена каталогов, через которые он проходит. В качестве разделителя используется символ «\» (обратная косая черта).

Уникальность имени файла обеспечивается тем, что полным именем файла считается собственное имя файла вместе с путем доступа к нему. Понятно, что в этом случае на одном носителе не может быть двух файлов с тождественными полными именами. В Интернете также не может быть двух файлов с одинаковыми полными именами, так как в масштабах Всемирной сети каждый компьютер имеет уникальный адрес.

Лекция 3

Арифметические основы компьютера

3.1. Понятия о системах счисления

Система счисления – это совокупность знаков и правил отображения чисел. Основание системы счисления – количество знаков, используемых для изображения чисел. Основание системы счисления показывает, во сколько раз единица данного разряда больше единицы предыдущего разряда.

Существуют непозиционные и позиционные системы счисления.

В непозиционных системах счисления вес цифры не зависит от ее позиции в записи числа.

Непозиционные системы – системы, алфавит которых содержит неограниченное количество символов, причем количественный эквивалент любой цифры постоянен и зависит только от ее начертания. Позиция цифр в числе значения не имеет. Так, в римской системе счисления в числе XXXII (тридцать два) вес цифры X в любой позиции равен десяти.

Непозиционные системы строятся по принципу аддитивности (англ. Add – сумма) – количественный эквивалент числа определяется как сумма цифр.

В позиционных системах счисления вес каждой цифры изменяется в зависимости от ее положения (позиции) в последовательности цифр, изображающих число. Например, в десятичном числе 757,7 первая семерка означает 7 сотен, вторая – 7 единиц, а третья – 7 десятых долей единицы. Сама же запись числа 757,7 означает сокращенную запись суммы 700 + 50 + 7 + 0,7 = 7  102 + 5  101 + 7  100 + + 7  101 = 757,7.

Вес цифры числа равен степени, где основание степени равно основанию системы счисления, а показатель – номеру позиции цифры в числе.

Развернутая форма записи числа равна сумме произведений цифры числа на ее вес и служит для перевода чисел из любой системы счисления в десятичную.

Основанием системе счисления может служить любое натуральное число: 2, 3, 4 и т.д., т.е. возможно бесчисленное множество позиционных систем.

Десятичная система счисления называется арабской.

Число 60 является основанием древней вавилонской шестидесятеричной системы счисления, к которой восходит деление часа на 60 мин и угла на 360 °. Традицию считать дюжинами (в году 12 мес., в сутках два периода по 12 ч, в футе 12 дюймов) распространили англосаксы (двенадцатеричная система счисления). В Китае широко использовалась пятеричная система счисления (табл. 3).

Таблица 3

Позиционные системы счисления

Основание q

Система счисления

Цифры (алфавит)

2

Двоичная

0, 1

3

Троичная

0, 2

...

...

...

8

Восьмеричная

0, 1, 2, 3, 4, 5, 6, 7

10

Десятичная

0, 1, 2, 3, 4, 5, 6, 7, 8, 9

16

Шестнадцатеричная

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, В, С, D, E, F

В позиционной системе счисления значительно легче производить арифметические операции, например, необходимо сложить числа 29,7 и 8,2.

В римской системе счисления (XXIX,VII + VIII,II) такую операцию провести достаточно трудно, если не сказать невозможно.

Компьютеры используют двоичную систему, так как она имеет ряд преимуществ:

  1. для ее реализации нужны технические устройства с двумя устойчивыми состояниями (есть ток – нет тока, низкое или высокое напряжение);

  2. представление информации посредством только двух состояний надежно и помехоустойчиво;

  3. двоичная арифметика намного проще десятичной;

  4. простота реализации процессов хранения, передачи и обработки информации на компьютере.

Недостаток двоичной системы – быстрый рост числа разрядов, необходимых для записи чисел [21].

Для обозначения адресов расположения данных в памяти компьютера и других целей удобнее пользоваться не двоичным и десятичным, а шестнадцатеричным представлением чисел.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]