Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛЕЩИНСКИЙ.docx
Скачиваний:
16
Добавлен:
21.12.2018
Размер:
471.39 Кб
Скачать

1.3. Представление данных в эвм

Для того чтобы с помощью различных программ эффективно работать с данными, необходимо понимать, как эти данные представляются в ЭВМ. В компьютере данные хранятся в особом непривычном для нас виде. В основе такого представления лежит специфическая система счисления.

Компьютеры работают в основном с байтами. В каждом байте содержится 8 битов, то есть 8 нулей и единиц (если написать на бумаге), 8 положений “включено” и “выключено” (в ОЗУ), 8 намагниченных или ненамагниченных точек (в НЖМД).

Любая информация представляется в ЭВМ как последовательность байтов. В самих байтах нет ничего, что позволяет их трактовать как числа, текстовые или другие данные. В любом случае информация кодируется в виде последовательности нулей и единиц, то есть чисел. Их интерпретация зависит от того, какая программа и какое действие с ними совершает в данный конкретный момент.

Если в программе предполагается работа с числами, то байты интерпретируются как числа. Если в программе предусматриваются действия с текстовыми данными, то байты интерпретируются как условные числовые коды, обозначающие знаки текста. Одно и то же сочетание битов может быть, например, буквой А или числом 65. Все зависит от цели использования, которая реализована в программе.

Мы в повседневной жизни привыкли оперировать десятичными числами. Другими словами, обычно мы используем десятичную систему счисления, основой которой является число 10, а используемые для записи чисел цифровые знаки могут быть от 0 до 9. Для ЭВМ это неудобно, поскольку в ней данные представляются в виде последовательности нулей и единиц, то есть цифры могут быть только 0 или 1. Такая система счисления называется двоичной. Любое число можно представить как в двоичной, так в любой другой системе счисления.

1.3.1. Единицы измерения количества и объема информации

Например, в слове информатика 11 знаков. Если это слово составлено с использованием 32-значного алфавита, то имеем N = 32 и m = 11. Тогда количество информации в этом слове равно

I = 11× = 11×5 = 55 бит

Мы привыкли измерять длину в метрах, вес в килограммах. В компьютере наименьшей единицей информации является бит. Количество информации, содержащейся в m-разрядном сообщении (состоящем из m знаков), когда каждый знак равновероятно взят из N-значного (то есть состоящего из N знаков) алфавита, вычисляется по формуле

I = m×,

Каждый бит может принимать одно из двух значений (0 или 1), поэтому последовательность из I бит может принимать N = 2I различных значений. Следовательно, для любого N-значного алфавита количество бит, которое требуется для представления любого из этих знаков, вычисляется по формуле

I = ,

которая называется формулой Хартли. Эта величина принимается в качестве количества информации, содержащейся в сообщении, состоящем из одного знака N-значного алфавита, когда каждый знак может быть равновероятно взят из этого алфавита.

Формула Хартли предполагает, что каждый знак равновероятно берется из алфавита. Если вероятности появления знаков различны, то количество информации, содержащейся в сообщении, состоящем из m знаков, вычисляется по формуле Шеннона

I =,

где Pi – вероятность появления i–го знака.

которая следует из формулы Хартли. Количество знаков в алфавите называется его мощностью.

Например: в слове информатика – 11 знаков и, если использован 32-значный алфавит, то в этом слове содержится количество информации, равное 11* log2 (32) = 55 бит.

При этом, в частности, невозможно нецелое количество битов (в отличие от количества информации).

Поскольку каждый бит обеспечивает представление одного из двух значений 0 или 1, то каждый байт может принимать 28 = 256 различных значений от 00000000 до 11111111.

Объем информации, записанной двоичными знаками в памяти компьютера или на внешнем носителе информации, подсчитывается просто по количеству двоичных знаков, которое требуется для такой записи. Чаще всего в качестве наименьшей единицы измерения объема информации используется байт, состоящий из 8 бит (1 б = 8 бит). Поскольку каждый бит может принимать одно из 2х значений, то каждый байт может принимать 2^8=256 различных значений от 00000000 до 11111111. В каждой ячейке внутренней памяти содержится 1 байт. Байты объединяются в более крупные наборы в зависимости от цели использования (ввод, вывод, передача по каналам связи между устройствами и т.д.).

Соответственно, 1 Кб = 1024 б, 1 Мб = 1024 Кб (около одного миллиона байтов), а 1 Гб = 1024 Мб (около одного миллиарда байтов).

Для измерения объема памяти используются и более крупные, чем бит или байт, единицы измерения, называемые килобайтом (Кб), мегабайтом (Мб) и гигабайтом (Гб). Переход от меньшей единицы измерения к большей осуществляется с помощью коэффициента 210 = 1024. Для измерения памяти большого объема используют единицы измерения терабайт (1 Тб = 1024 ГБ) и петабайт (1 ПБ = 1024 Тб)

Информация представляется в компьютере последовательностью байтов. В самих байтах нет ничего, что позволяет их трактовать как числа, текстовые данные или какие-либо другие. В любом случае информация кодируется (представляется) в виде последовательности 0 и 1, т.е. положительных целых двоичных чисел. Их интерпретация зависит от того, какая программа и какое действие с ними совершается в данный конкретный момент. Если предполагается работа с числами, то байты интерпретируются как числа, если текст, значит байты – условные числовые коды, обозначающие знаки текста.