Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
inf.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
491.92 Кб
Скачать

9. Существо подходов к измерению количества информации.

Важнейшим пунктом в развитии Информатики, как науки, следует считать введение количественной меры информации.

Принципиально выделяют понятия:

- количество информации в сообщении Х - I(Х) ;

- объем данных - Vд.

В Информатике различают три подхода к измерению информации:

- объемный (семантическая мера);

- алгоритмический;

- энтропийный.

Объемный подход предполагает измерение семантической информации как объема данных - VД . При этом под данными понимают факты и идеи, представленные в формализованном виде, позволяющем передавать или обрабатывать их при помощи некоторого процесса (соответствующих технических средств) [Словарь по кибернетике, с.147]. Соответствующую количественную оценку информации называют объемом информации, понимая под объемом информации в сообщении – количество символов в сообщении.

В вычислительной технике вся обрабатываемая и хранимая информация вне зависимости от ее природы (число, текст, видео или, аудио-информация и т.д.) представляется в двоичной форме (с использованием алфавита, состоящего всего из двух символов «1» или «0»), что позволило ввести стандартную единицу измерения объема данных – бит (от английского binary digit – двоичная цифра). Так, если сообщение имеет вид 10110110, то говорят, что передаваемый в нем объем данных равен VД = 8 дв. ед. или 8 бит.

Более крупной единицей измерения объема данных являет байт, равный 8 битам. Еще более крупная единица – Килобайт. обозначается 1К или 1 Кбайт, который равен 1024 байт (210 байт). Соответственно 1 Мбайт (Мегабайт) равен 1024 Кбайт, 1 Гбайт (Гигабайт) равен 1024 Мбайт, 1 Тбайт (Терабайт) равен 1024 Гбайт.

При использовании десятичной системы счисления объем данных измеряется в десятичных единицах –дитах. Например, сообщение, 3956748, передаваемое в десятичной системе счисления имеет объем, равный 7 дес. ед. или 7 дит. Иногда эту единицу измерения называют Хартли.

Для измерения смыслового содержания информации используется. так называемая, тезаурусная мера пользователя. Тезаурус – это совокупность сведений, которыми располагает пользователь или система. Считается, что для данного пользователя в поступившем сообщении имеется семантический смысл, если с получением сообщения тезаурус пользователя увеличивается.

В качестве относительной меры количества семантической информации может использоваться коэффициент содержательности

C = Ic/ Vд , ( 1 )

где Ic – количество семантической информации в сообщении.

Прагматическая мера информации определяет полезность или ценность полученной информации для достижения какой-либо прагматической цели системы. Как правило, она измеряется в тех же единицах, что и оцениваемая целевая функция.

Существо алгоритмического подхода заключается в следующем.

Компьютерная программа, осуществляющая печать сообщения, состоящего из одного символа, например 11111...1, достаточно проста. Для печати последовательности меняющихся символов (меандра), например 1010101...10 уже более сложна. Если же необходимо получать случайную, не поддающуюся никаким закономерностям последовательность символов 1000101001, то в данном случае никакой «короткой» программой не обойтись. В теории алгоритмов показано, что длина программы, производящей хаотическую последовательность, близка к длине самой последовательности.

Такие рассуждения позволяют предположить, что любому сообщению можно поставить в соответствие некоторую количественную характеристику, отражающую сложность (размер) программы, которая позволяет его реализовать. Ввиду того, что имеется большое разнообразие, как вычислительных средств, так и языков программирования (разных способов задания алгоритмов), то для определенности задаются некоторой универсальной вычислительной машиной, например, машиной Тьюринга и тогда предполагаемая количественная характеристика – сложность слова (сообщения) определяется как минимальное число состояний машины Тьюринга, требующееся для его воспроизведения.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]