Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Prakt_Inform_Lomtadze_Shishkina.doc
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
12.1 Mб
Скачать

3.1.2. Количество информации в сообщении о том, что произошло одно из n равновероятных событий

Количество информации в сообщении о том, что произошло одно из N равновероятных событий, рассчитывается по формуле Хартли: I = log2N. Смысл этой формулы становится понятным из простого примера: чтобы узнать, на какой из восьми полок находится требуемая книга, надо получить ответ «да» или «нет» на 3 вопроса:

  1. Книга на одной из четырёх верхних полок? Допустим, получен ответ «нет». Заметим, что в этом ответе 1 бит информации.

  2. Книга на одной из двух самых нижних полок? Пусть получен ответ «да». В этом ответе также 1 бит информации.

  3. Книга на нижней полке? Если получен ответ «нет», а это ещё один бит информации, то ясно, что книга находится на второй снизу полке.

Таким образом, задав три вопроса, мы узнали, что книга находится на второй снизу полке из восьми. Поэтому в сообщении «книга на второй из восьми полок» содержится I = log28 = 3 бита информации.

Также заметим, что за единицу количества информации (1 бит) принимается такое её количество, которое содержится в информационном сообщении, уменьшающем неопределенность знания в два раза.

3.1.3. Алфавитный подход к измерению количества информации

Алфавит – это множество из N символов для записи текста; N – мощность алфавита. Например, в коде ASCII 256 символов (N = 256). По формуле Хартли информация о том, что очередной из N равновероятных символов такой-то: I=log2N=8. Значит, 1 символ в тексте, закодированном в ASCII, содержит 8 бит, или 1 байт информации. Если использовать кодировку Unicode, то в 1 символе будет 2 байта информации.

3.2. Кодирование информации

3.2.1. Данные – формализованная информация

Под информацией понимают как исходные данные, т. е. результаты наблюдений или измерений, характеризующие некоторые объекты или явления, так и конечные документы, являющиеся основой для принятия решений. Термин «данные» обычно употребляется по отношению к формализованной информации. Понятие «формализация» тесно связано с понятием «модель». Дело в том, что человек в своей деятельности никогда не рассматривает объект или явление во всех возможных аспектах. Для достижения практических целей всегда выделяются свойства объекта, представляющиеся существенными для решения текущих задач. Другими словами, явление или объект описывается ограниченным набором параметров. Формализованное описание объекта набором параметров, по существу, и есть построение его модели. От того, насколько при построении модели учтены существенные для круга решаемых задач свойства объектов или явлений, зависит успешность решения этих задач, успешность применения математических методов и средств вычислительной техники.

Итак, информация об объектах и явлениях обычно формализуется. Чаще всего она представляется в виде таблиц: в одной строке таблицы – параметры одного объекта. Кроме табличного, часто применяется графический способ представления информации. Причем информация, представленная в виде графиков, карт, схем и чертежей, – формализованные данные. А вот рисунки, фотографии, картины, аудио- и видеозаписи – это неформализованная информация, поясняющая и дополняющая формализованные данные.

3.2.2. Системы кодирования, объёмы данных, системы счисления

Для того чтобы записывать информацию перечисленных видов на магнитные, электронные и другие носители, используются системы кодирования. Такие системы разработаны для кодирования текстовой, числовой, графической (чертежи, рисунки, фотографии, картины), аудио- (звуковой) и видео- (видеофильмы, видеоклипы, анимация) информации. Система кодирования – это совокупность правил кодового обозначения объектов.

При всех видах кодирования информация представляется в виде битов. Бит – это один двоичный разряд: 0 или 1. Для того чтобы закодировать алфавитно-цифровой символ, число, звук или цвет точки в графическом документе, естественно, не обойтись одним битом. Поэтому для кодирования, хранения и передачи информации биты объединяются в байты – в группы по 8 битов. В одном байте можно закодировать 28 = 256 комбинаций состояний битов – от 00000000 до 11111111. Следовательно, в 1 байте можно закодировать алфавитно-цифровой символ, а также цвет точки (пикселя) или отрезка линии, если используется не более 256 цветов или оттенков серого цвета. Для кодирования других элементов информации применяются комбинации байтов (по 2, 4, 8 и более). Поэтому объем данных (хранимых или передаваемых), а также емкость запоминающих устройств принято измерять в байтах, килобайтах (1 Кбайт = 1024 байт), мегабайтах (1 Мбайт = 1024 Кбайт), гигабайтах (1 Гбайт = 1024 Мбайт) и терабайтах (1 Тбайт = 1024 Гбайт). В одном килобайте можно закодировать примерно полстраницы текста. Следовательно, для кодирования текста одной средней книги (без учёта рисунков) требуется примерно 1 мегабайт памяти. Соответственно в 1 гигабайте можно закодировать приблизительно 1000 книг, но только если не учитывать рисунки.

Для того чтобы записать состояние байта, можно использовать 8 двоичных, 3 десятичных или 2 шестнадцатеричных цифры, т. е. можно воспользоваться одной из систем счисления, применяемых в информационных технологиях. Система счисления – это способ именования и изображения чисел с помощью символов, имеющих определенные количественные значения. В двоичной системе два таких символа: 0 и 1. Эта система удобна для хранения информации в электронных устройствах, в которых обычно четко фиксируются два состояния: намагничено – не намагничено, проводит – не проводит и т. п. В десятичной системе счисления 10 символов: 0,1,2,3,4,5,6,7,8,9, а в шестнадцатеричной – 16: 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F. Повсеместное распространение именно десятичной системы связано с тем, что человек учился считать на пальцах, а их у него оказалось 10. Для записи содержимого памяти компьютеров гораздо удобнее шестнадцатеричная система. Так содержимое одного полубайта в двоичной, десятичной и шестнадцатеричной системах счисления записывается следующим образом (табл. 3.1).

Таблица 3.1

Запись содержимого полубайта в разных системах счисления

Двоичная система

Десятичная система

Шестнадцатеричная система

0000

0

0

0001

1

1

0010

2

2

0011

3

3

0100

4

4

0101

5

5

0110

6

6

0111

7

7

1000

8

8

1001

9

9

1010

10

A

1011

11

B

1100

12

C

1101

13

D

1110

14

E

1111

15

F

Поскольку байт состоит из двух полубайтов, то содержимое 1 байта памяти всегда можно записать двумя шестнадцатеричными цифрами.

Соседние файлы в предмете Информатика