Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
224
Добавлен:
11.06.2015
Размер:
9.28 Mб
Скачать

Формула Шеннона:

где I –количество информации, N – количество возможных событий, pi – вероятность отдельного события.

Помимо двух рассмотренных подходов к определению количества информации, существуют и другие. Важно помнить, что любые теоретические результаты применимы лишь к определённому кругу случаев, очерченному первоначальными допущениями.

Количество информации, приходящейся на один элемент сообщения, называется удельной информативностью или энтропией.

Некоторые свойства энтропии:

1. Энтропия является величиной вещественной, ограниченной и неотрицательной.

2. Энтропия минимальна и равна нулю, если сообщение известно заранее.

3. Энтропия максимальна, если все состояния элементов сообщений равновероятны.

4. Энтропия бинарных (двоичных) сообщений может изменяться от нуля до единицы.

В качестве единицы информации Клод Шеннон предложил принять один бит (англ. bit – binary digit – двоичная цифра).

Бит в теории информации – количество информации, необходимое для различения двух равновероятных сообщений (типа «орел» – «решка», «чет» – «нечет» и т.п.).

В вычислительной технике битом называют наименьшую «порцию» памяти компьютера, необходимую для хранения одного из двух знаков «0» и «1», используемых для внутримашинного представления данных и команд.

Бит – слишком мелкая единица измерения. На практике чаще применяется более крупная единица – байт, равная восьми битам. Именно восемь битов требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256=28).

Широко используются также ещё более крупные производные единицы информации:

1 Килобайт (Кбайт) = 1024 байт = 210 байт,

1 Мегабайт (Мбайт) = 1024 Кбайт = 220 байт,

1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:

1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт,

1 Петабайт (Пбайт) = 1024 Тбайт = 250 байт.

За единицу информации можно было бы выбрать количество информации, необходимое для различения, например, десяти равновероятных сообщений. Это будет не двоичная (бит), а десятичная (дит) единица информации.

Контрольные вопросы

1.2.1. Что понимается под количеством информации?

1.2.2. Какие математические понятия используют при определении количество информации?

1.2.3. Как определяется количество информации по формуле Хартли?

1.2.4. Как определяется количество информации по формуле Шеннона?

1.2.5. Как называется минимальная единица количества информации?

1.2.6. Дайте определение бита.

1.2.7. Сколько бит содержится в одном байте?

1.2.8. Сколько бит нужно для кодирования одного символа?

1.2.9. Сколько байт содержится в одном килобайте?

1.2.10. Сколько мегабайт содержится в одном терабайте?

1.3. Позиционные системы счисления

Существуют различные способы записи чисел, например: можно записать число в виде текста – сто двадцать три; римской системе счисления – CXXIII; арабской – 123.

Совокупность приемов записи и наименования чисел называется системой счисления.

Числа записываются с помощью символов, и по количеству символов, используемых для записи числа, системы счисления подразделяются на позиционные и непозиционные.

Если для записи числа используется бесконечное множество символов, то система счисления называется непозиционной. Примером непозиционной системы счисления может служить римская. Например, для записи числа один используется буква I, два и три выглядят как совокупности символов II, III, но для записи числа пять выбирается новый символ V, шесть – VI, десять – вводится символ X, сто – С, тысяча – М и т.д. Бесконечный ряд чисел потребует бесконечного числа символов для записи чисел. Кроме того, такой способ записи чисел приводит к очень сложным правилам арифметики.

Позиционные системы счисления для записи чисел используют ограниченный набор символов, называемых цифрами, и величина числа зависит не только от набора цифр, но и от того, в какой последовательности записаны цифры, т.е. от позиции, занимаемой цифрой, например, 125 и 215. Количество цифр, используемых для записи числа, называется основанием системы счисления, в дальнейшем его обозначим q.

В повседневной жизни мы пользуемся десятичной позиционной системой счисления, q = 10, т.е. используется 10 цифр: 0 1 2 3 4 5 6 7 8 9.

Рассмотрим правила записи чисел в позиционной десятичной системе счисления. Числа от 0 до 9 записываются цифрами, для записи следующего числа цифры не существует, поэтому вместо 9 пишут 0, но левее нуля образуется еще один разряд, называемый старшим, где записывается (прибавляется) 1, в результате получается 10. Затем пойдут числа 11, 12, но на 19 опять младший разряд заполнится и мы его снова заменим на 0, а старший разряд увеличим на 1, получим 20. Далее по аналогии 30, 40 ... 90, 91, 92 ... до 99. Здесь заполненными оказываются два разряда сразу; чтобы получить следующее число, мы заменяем оба на 0, а в старшем разряде, теперь уже третьем, поставим 1 (т.е. получим число 100) и т.д. Очевидно, что, используя конечное число цифр, можно записать любое сколь угодно большое число. Заметим также, что производство арифметических действий в десятичной системе счисления весьма просто.

Число в позиционной системе счисления с основанием q может быть представлено в виде полинома по степеням q. Например, в десятичной системе мы имеем число

124,45 = 1  102 + 2  101 + 3  100 + 4  10–1 + 5  10–2,

а в общем виде это правило запишется так:

X(q) = xn–1qn–1 + xn–2qn–2 + … + x1q1 +x0q0 + x–1q–1 + x–2q–2 + … + x–mq–m.

Здесь X(q) – запись числа в системе счисления с основанием q;

хi – натуральные числа меньше q, т.е. цифры;

n – число разрядов целой части;

m – число разрядов дробной части.

Записывая слева направо цифры числа, мы получим закодированную запись числа в q-ичной системе счисления:

X(q) = xn–1 xn–2 x1 x0, x–1 x–2 x–m.

В информатике, вследствие применения электронных средств вычислительной техники, большое значение имеет двоичная система счисления, q = 2. На ранних этапах развития вычислительной техники арифметические операции с действительными числами производились в двоичной системе ввиду простоты их реализации в электронных схемах вычислительных машин. Например, таблица сложения и таблица умножения будут иметь по четыре правила:

0 + 0 = 0

0  0 = 0

0 + 1 = 1

0  1 = 0

1 + 0 = 1

1  0 = 0

1 + 1 = 1

1  1 = 1

А значит, для реализации поразрядной арифметики в компьютере потребуются вместо двух таблиц по сто правил в десятичной системе счисления две таблицы по четыре правила в двоичной.

Соответственно на аппаратном уровне вместо двухсот электронных схем – восемь.

Но запись числа в двоичной системе счисления длиннее записи того же числа в десятичной системе счисления в log2 10 раз (примерно в 3,3 раза). Это громоздко и не удобно для использования, так как обычно человек может одновременно воспринять не более пяти-семи единиц информации, т.е. удобно будет пользоваться такими системами счисления, в которых наиболее часто используемые числа (от единиц до тысяч) записывались бы одной-четырьмя цифрами.

Как это будет показано далее, перевод числа, записанного в двоичной системе счисления, в восьмеричную и шестнадцатеричную очень сильно упрощается по сравнению с переводом из десятичной в двоичную. Запись же чисел в них в три раза короче для восьмеричной и в четыре для шестнадцатеричной системы, чем в двоичной, но длины чисел в десятичной, восьмеричной и шестнадцатеричной системах счисления будут различаться ненамного. Поэтому, наряду с двоичной системой счисления, в информатике имеют хождение восьмеричная и шестнадцатеричная системы счисления.

Восьмеричная система счисления имеет восемь цифр: 0 1 2 3 4 5 6 7. Шестнадцатеричная – шестнадцать, причем первые 10 цифр совпадают по написанию с цифрами десятичной системы счисления, а для обозначения оставшихся шести цифр применяются большие латинские буквы, т.е. для шестнадцатеричной системы счисления получим набор цифр: 0123456789ABCDEF.

Если из контекста не ясно, к какой системе счисления относится запись, то основание системы записывается после числа в виде нижнего индекса. Например, одно и то же число 231, записанное в десятичной системе, запишется в двоичной, восьмеричной и шестнадцатеричной системах счисления следующим образом:

231(10) = 11100111(2) =347(8) = Е7(16).

Запишем начало натурального ряда в десятичной, двоичной, восьмеричной и шестнадцатеричной системах счисления (таблица соответствия).

Десятичная

Двоичная

Восьмеричная

Шестнадцатеричная

0

0

0

0

1

1

1

1

2

10

2

2

3

11

3

3

4

100

4

4

5

101

5

5

6

110

6

6

7

111

7

7

8

1000

10

8

9

1001

11

9

10

1010

12

А

11

1011

13

В

12

1100

14

С

13

1101

15

D

14

1110

16

Е

15

1111

17

F

16

10000

20

10

17

10001

21

11

Если необходимо знать, какому числу в одной системе счисления соответствует число в другой, то можно составить таблицу соответствия, подобную приведенной выше, и найти в ней нужное число. Но есть и менее громоздкие, универсальные способы перевода чисел из одной системы счисления в другую.

Надо понимать, что разные позиционные системы счисления – это только разные формы записи одних и тех же величин. Математические правила вычислений при этом не меняются.

Соседние файлы в папке К экзамену