Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Экономическая информатика.docx
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
329.21 Кб
Скачать

2.5.3. Синтаксическая мера информации.

В качестве синтаксической меры количество информации представляет объем данных.

Объём данных Vd в сообщении  измеряется количеством символов (разрядов) в этом сообщении. Как мы упоминали, в двоичной системе счисления единица измерения – бит. На практике, наряду с этой «самой мелкой» единицей измерения данных чаще применяется более крупная единица - "байт", равная 8 бит. Для удобства в качестве измерителей используются кило (103) -, мега (106)-, гига (109)- и тера (1012)- байты и т.д.. В знакомых всем байтах измеряется объем кратких письменных сообщений, толстых книг, музыкальных произведений, изображений, а также программных продуктов. Понятно, что эта мера никак не может характеризовать того - что, и зачем несут эти единицы информации. Измерять в килобайтах роман Л.Н.Толстого «Война и мир» полезно – например, чтобы понять – сможет ли он разместиться на свободном месте твердого диска. Это столь же полезно, как измерять размер книги – ее высоту, толщину и ширину, чтобы оценить, поместится ли она на книжной полке, или взвешивать ее – на предмет того, выдержит ли портфель совокупную тяжесть.

2.5.4. Семантическая мера информации.

Итак, одной синтаксической меры информации явно недостаточно для характеристики сообщения: в нашем примере с погодой в последнем случае сообщение приятеля содержало ненулевой объем данных, но не содержало нужной нам информации. Заключение о полезности информации следует из рассмотрения содержания сообщения. Для измерения смыслового содержания информации, т.е. её количества на семантическом уровне, введем понятие тезаурус получателя информации.

Тезаурус – это совокупность сведений, и связей между ними, которыми располагает получатель информации. Можно сказать, что тезаурус – это накопленные знания получателя.

В очень простом случае, когда получателем является техническое устройство - персональный компьютер – здесь тезаурус формируется «вооружением» компьютера - заложенными в него программами и устройствами, позволяющими принимать, обрабатывать и представлять текстовые сообщения на разных языках, использующих разные алфавиты, шрифты, а также аудио- и видеоинформацию с локальной или всемирной сети. Если компьютер не снабжен сетевой картой, нельзя ожидать получения на него сообщений от коллег с сети ни в каком виде. Отсутствие драйверов с русскими шрифтами не позволит работать с сообщениями на русском языке и т.д.

Если получателем является человек, его тезаурус – это тоже своеобразное интеллектуальное вооружение человека – арсенал его знаний. Он также образует своеобразный фильтр для поступающих сообщений. Поступившее сообщение обрабатывается с использованием имеющихся знаний с целью получения информации. Если тезаурус очень богат – арсенал знаний глубок и многообразен, он позволит извлекать информацию из практически любого сообщения. Маленький тезаурус, содержащий скудный багаж знаний, может стать препятствием для понимания сообщений, требующих лучшей подготовки.

Заметим однако, что одного понимания сообщения для влияния на принятие решения мало – надо, чтобы в нем содержалась нужная для этого информация, которой нет в нашем тезаурусе и которую мы в него хотим включить. В случае с погодой – в нашем тезаурусе не было последней, «актуальной» информации о погоде в районе университета. Если полученное сообщение изменяет наш тезаурус, может измениться и выбор решения. Такое изменение тезауруса и служит семантической мерой количества информации – своеобразной мерой полезности полученного сообщения.

Формально – количество семантической информации Is , включаемой в дальнейшем в тезаурус, определяется соотношением тезауруса получателя Si и содержанием передаваемой в сообщении  информации S.

Графически вид этой зависимости показан на рисунке 9.2.

Рассмотрим случаи, когда количество семантической информации Is равно или близко к нулю:

при Si = 0 получатель не воспринимает поступающую информацию;

при 0SiS0 получатель воспринимает, но не понимает поступившую в сообщении информацию;

при Si   получатель имеет исчерпывающие знания и поступающая информация не может пополнить его тезауруса.

При тезаурусе SiS0 количество семантической информации Is получаемое из вложенной в сообщение  информации S вначале быстро растет с ростом собственного тезауруса получателя, а затем – начиная с некоторого значения Si - падает. Падение количества полезной для получателя информации происходит от того, что багаж знаний получателя стал достаточно солидным и удивить его чем-то новым становится все труднее.

Это можно проиллюстрировать на примере студентов, изучающих экономическую информатику и читающих материалы сайтов по корпоративным ИС (кстати, попробуйте www.cfin.ru). Вначале при формировании первых знаний об информационных системах чтение мало что дает – много непонятных терминов, аббревиатур – даже заголовки не все понятны. Настойчивость в чтении книг, посещении лекций и семинаров, общении с профессионалами – помогают пополнить тезаурус. Со временем чтение материалов сайта становится приятным и полезным, а к концу профессиональной карьеры – после написания многих статей и книг – получение новых полезных сведений с популярного сайта будет случаться намного реже.

Можно говорить об оптимальном для данной информации S тезаурусе получателя, при котором им будет получена максимальная информация Is , а также – оптимальной информации в сообщении  для данного тезауруса Si. В нашем примере, когда получателем является компьютер, оптимальный тезаурус означает, что его аппаратная часть и установленное программное обеспечение воспринимают и правильно интерпретируют для пользователя все содержащиеся в сообщении  символы, передающие смысл информации S. Если в сообщении есть знаки, которые не соответствуют содержимому тезауруса – часть информации будет утрачена и величина Is уменьшится.

С другой стороны, если мы знаем, что получатель не имеет возможности получать тексты на русском (его компьютер не имеет нужных драйверов), а иностранных языков на которых наше сообщение может быть послано – ни он ни мы не изучали, для передачи необходимой информации мы можем прибегнуть к транслитерации – написанию русских текстов, с использованием букв иностранного алфавита, хорошо воспринимаемого компьютером получателя. Так мы приведем в соответствие нашу информацию с имеющимся в распоряжении получателя тезаурусом компьютера. Сообщение будет выглядеть некрасиво, но всю необходимую информацию получателю удастся прочитать.

Итак, максимальное количество семантической информации Is из сообщения  получатель приобретает при согласовании ее смыслового содержания S с тезаурусом

Si (при Si = Si opt ).

Информация из одного и того же сообщения может иметь смысловое содержание для компетентного пользователя и быть бессмысленной для пользователя некомпетентного.

Количество семантической информации в сообщении, получаемом пользователем, является величиной индивидуальной, персонифицированной – в отличие от синтаксической информации. Однако измеряется семантическая информация также как синтаксическая – в битах и байтах.

Мы намеренно не станем обсуждать вопросы о качестве формирующей тезаурус информации – эта сложная тема не является предметом наших рассуждений. Для простоты изложения, будем считать, что получаемые сообщения отправлены не с целью ввести нас в заблуждение и наши тезаурусы сформированы только из верной информации.

Относительной мерой количества семантической информации cлужит коэффициент содержательности C, который определяется как отношение количества семантической информации к её объёму данных Vd, содержащихся в сообщении :

.