- •Вопрос 1. Синтаксические и семантические аспекты информации
- •Вопрос 2. Определение ценности информации. Апостериорный подход
- •Вопрос 3. Меры ценности информации
- •3.1. Мера ценнности информации (а.Харкевича)
- •3.2. Мера ценности информации в.Корогодина
- •3.3. Ценность количества информации
- •Вопрос 4. Классификация мер количества информации
Раздел 1. Информация о физических величинах
Лекция № 2
Тема. Синтаксические, семантические и прагматические аспекты информации
Учебные вопросы.
Вопрос 1. Синтаксические и семантические аспекты информации 1
Вопрос 2. Определение ценности информации. Апостериорный подход 9
Вопрос 3. Меры ценности информации 13
Вопрос 4. Классификация мер количества информации 18
Вопрос 1. Синтаксические и семантические аспекты информации
К. Шеннон разрабатывал свою теорию для практических нужд связи, где важно дословно, без искажений, передать текст, и не важно, понял ли получатель смысл этого текста.
Вернемся к формуле Шеннона и проанализируем текст «Завтра будет буря». Осмысленность или информация текста «Завтра будет буря» очевидна. Достаточно, однако, сохранив все элементы (буквы) этого сообщения, переставить их случайным образом, например, «рдеа Звубуб траяи», как оно утратит всякий смысл. Но бессмысленной информации не бывает. Согласно формуле Шеннона оба предложения содержат одинаковое «количество информации». О какой же информации здесь идет речь? Или, вообще, можно ли говорить об информации по отношению к разрозненным элементам сообщения?..
Недостаточность Шенноновского подхода привела к появлению теорий, исследующих смысловое содержание информации, ее ценности.
Автором самой известной из них является Колин Черри.
Семиотическая теория информации К.Черри
В курсе лекций 50-х годов и опубликованной монографии «Человек и информация» (перевод со второго издания в 1972 г.) К. Черри удается показать далеко не тривиальную сложность элементарного речевого общения, связанную с зависимостью передачи сообщения и его восприятия от огромного числа субъективных факторов и факторов среды.
Это позволяет автору сделать вывод о невозможности прямого переноса идей математической теории связи на человеческое общение. Она, по его мнению, «…может помочь в изучении обмена информацией между людьми, но не может дать объяснения сущности этого обмена…». Одним из оснований для такого вывода является то обстоятельство, что математическая теория информации игнорирует семантическую и прагматическую сторону сообщений.
Его теория называется «Семиотическая теория информации».
В дальнейшем множество ученых работало в области. Среди них
Юлий Анатольевич Шрейдер (28.10.27-24.08.98) - математик (в 1950 году защитил кандидатскую диссертацию по функциональному анализу), специалист по информатике, семиотике, методологии науки и теории информации, публицист, впоследствие - философ (доктор философских наук - защитил докторскую диссертацию по философии в 1981 году) и богослов.
Юрий Сергеевич Степанов (20 июля 1930 – 3 января 2012) — российский учёный, филолог, академик АН СССР (с 15 декабря 1990 года; с 1991 — академик РАН), доктор филологических наук, профессор. Труды в области теоретической лингвистики, сравнительно-исторического индоевропейского языкознания, романской филологии и семиотики.
И др.
В настоящее время под семиотикой больше понимают связь знаков с содержащимся в них значением.
Семиотическая теория информации К.Черри исследует информацию на трех качественных уровнях: синтаксическом, семантическом и прагматическом и, соответственно, включает три раздела: синтактику, семантику, прагматику.
О п р е д е л е н и е. Синтактика – раздел семиотической теории информации, в котором исследуются символы, знаки, правила записи слов и предложений, связываются формальные свойства знаков и их комбинаций с количеством содержащейся в них информации. (Аналогичное значение имеет термин «синтаксис» в грамматике русского языка и в искусственных языках, например – языках программирования).
О п р е д е л е н и е. Семантика – раздел семиотической теории информации, в котором исследуется связь знаков с содержащимся в них смыслом, с объектами и их свойствами.
Если отражение многообразия присуще всем информационным системам, то для кибернетической (в большей мере для живой) системы существует еще разнообразие отражения как функция ее тезауруса1. Это отражение - интерпретация «увиденного». Сам тезаурус тоже изменяется при получении информации:
Рис. 1.1. Зависимость прироста тезауруса Т потребителя информации при прочтении текста от размера тезауруса Т
Интерпретация: если раньше потребитель информации не знал ничего, то новая информация не приведет к приросту тезауруса, т.к. потребитель не поймет смысл текста; если он что-то знает, то поймет содержание текста и его тезаурус увеличится, если же знает очень много, то полученное сообщение вряд ли добавит в тезаурус что-то новое.
Ю.А. Шрейдер через приращение тезауруса определяет количество семантической информации, содержащейся в сообщении:
Iсем = Saps – Sapr,
где Sapr и Saps – объемы априорного и апостериорного тезауруса соответственно.
О п р е д е л е н и е. Прагматика – раздел семиотической теории информации, в котором исследуются вопросы ценности информации, связь знаков с их потребительской полезностью для потребителя, вопросы достаточности информации.
Прилагательные «полезная», «бесполезная», «ценная» и т.д., применяемые к информации, предполагают наличие потребителя (полезная для кого?), в отличие от определения «точная», «надежная» и т.д. (надежная с вероятностью 0,98 безотносительно кого-либо). Это уровни прагматический и семантический соответственно.
Основные положения «качественной» теории информации (М.Мазура)
Интересная и своеобразная теория информации была предложена 1972 году польским ученым Марианом Мазуром.
Эта теория позволяет для решения задач управления в кибернетических системах на качественном уровне, но математически строго определить понятия: информация, информирование, дезинформация, дезинформирование, параинформация (параинфорование), псевдоинформация (псевдоинфорование) и т.д.
Математически теория построена на аппарате теории графов.
В теории рассматривается кибернетическая система, включающая источник воздействия, среда передачи воздействия и приемник воздействия (вместе – цепь управления)2. Основным, системообразующим, является понятие – сообщение.
О п р е д е л е н и е Сообщение – физическое состояние, определенным образом отличающееся от других физических состояний в цепи управления.
Различают поперечное и продольное множества сообщений.
О п р е д е л е н и е Поперечное множество – множество сообщений в произвольном месте цепи управления X,Y,Z.
О п р е д е л е н и е Продольное множество – множество сообщений, возникших из других сообщений, либо из которых возникли другие сообщения, причем каждое сообщение принадлежит разным поперечным множествам.
О п р е д е л е н и е Воздействие в цепи управления есть последовательность сообщений в поперечном множестве.
Например, x1, x2, x3 на рис.1.2.
Рис. 1.2. Воздействия в цепи управления
О п р е д е л е н и е Ассоциация сообщений – неупорядоченная пара сообщений, взятая из продольного или поперечного множества сообщений.
О п р е д е л е н и е Преобразование сообщений (трансформация) – процесс, в результате которого одно из сообщений ассоциации превращается в другое сообщение той же ассоциации. Запись: Tab: a b.
О п р е д е л е н и е Кодовые преобразования(коды) и цепи преобразований (последовательности кодовых преобразований) – преобразования сообщений из продольного множества.
О п р е д е л е н и е Информация – преобразование одного сообщения в другое в поперечном множестве.
Пример: изменилась температура на 3 градуса (на множестве X), удлинилась спираль датчика на 3 мм (на множестве Y) и переместилась стрелка прибора на 3 угловые минуты (на множестве Z).
О п р е д е л е н и е Информирование – преобразование информации, содержащейся в цепи оригиналов, в информацию, содержащуюся в цепи образов.
М. Мазур различает следующие виды информирования:
О п р е д е л е н и е Трансинформирование – такое информирование, при котором информация в множестве образов такая же, как и в множестве оригиналов. Это тот вид информирования, к которому следует стремиться.
О п р е д е л е н и е Псевдоинформирование – информирование, при котором некоторые сообщения являются общими для нескольких кодовых цепей.
Рис. 1.3. Псевдоинформирование
Рисунок 1.3. а) иллюстрирует неоднозначность: что делать объекту управления, как реагировать на сигнал управления?
Рисунок 1.3. б) иллюстрирует неоднозначность: на два состояния оригинала предусмотрено одно состояние образа. Какова необходимость различать эти состояния оригинала. С точки зрения управления это излишне.
О п р е д е л е н и е Дезинформирование – информирование, в котором некоторые цепи неполны.
Рис. 1.4. Дезинформирование
Рисунок 1.4. а) иллюстрирует дезинформирование о том, что якобы было управление (изменение состояния управляющего объекта (оригинала).
Рисунок 1.4. б) иллюстрирует дезинформирование –скрытие факта управления.
О п р е д е л е н и е Параинформирование – информирование, в котором участвует параинформация.
О п р е д е л е н и е Параинформация – информация, содержащаяся в ассоциации, в которой одно из сообщений – парасообщение.
О п р е д е л е н и е Парасообщение – сообщение, принадлежащее информационной цепи, но не принадлежащее ни одной кодовой цепи.
Кроме того, в теории рассматриваются иерархические структуры метаинформирования в различных контурах управления.
Основные положения теоретико-множественного представления информации
Эта теория является весьма новой, еще недостаточно разработанной, но имеющей определенные перспективы.
Область ее применения – обеспечение качества информации в технологических процессах ее переработки, особенно при распределенных преобразованиях.
Учитывается семантический и прагматический уровни рассмотрения информации. Основоположником теории является д.т.н., профессор, академик А.В. Чечкин.
Исходя из определения информации, она всегда о чем-то, о каком либо объекте, далее называемом объект информации (ОИ).
Объект информации - первичное, строго не определяемое понятие, на природу которого не накладывается никаких требований, это могут быть реальные или идеальные объекты, в частности математические. Очевидно, ОИ должен обладать некоторыми вариациями (состояниями), иначе бы не было смысла говорить об информации о нем (требование многообразия состояний объекта). Множество возможных вариаций ОИ далее называется опорным множеством значений ОИ.
Итак, пусть дано:
R – опорное множество, множество состояний объекта;
x – элемент множества R, x R, состояние объекта информации;
подмножество R, x .
Если содержит те и только те точки R, которые обладают некоторым свойством, то возможно отождествление этого подмножества с понятием свойство, причем истинное высказывание “точка x из R обладает свойством ” является элементарным сведением о точке x (о состоянии объекта), и записывается в виде одноместного предиката (x).
О п р е д е л е н и е. Любое подмножество (x): x (x), (x) R есть элементарное сведение о точке x.
Пример: 1. Множество шаров в урне. Подмножества – свойства: белые, деревянные, большие и т.д. 2. Самолет: Опорное множество – все самолеты мира, сведения: 4-х моторный, 8 человек экипажа, 1913 г. выпуска.
На основе введенного термина элементарное сведение определен термин элементарная информация.
О п р е д е л е н и е . Элементарная информация о точке x0 - непустое семейство подмножеств J(x0)={ i (x0)} - элементарных сведений о точке x0, удовлетворяющее условию i : (x0 ) i (x0 ). Т.е. все надмножества подмножества (x0 ). Интерпретация – все умозаключения, которые можно сделать на основе данного сведения.
О п р е д е л е н и е. Неэлементарным сведением о точке x0 является предикат <p, (x0 )>, где p – вероятность того, что x0 .
Мера неопределенности вводится следующим образом.
Пусть опорное множество R’ R1 – компакт3 на действительной числовой оси. Например, множество допустимых числовых значений какого-либо параметра технической системы. Тогда точка x R’ – значение этого параметра; подмножество - компакт : x , R’ – элементарное сведение о значении числового параметра.
Если множество R’ измеримо, то введем на нем меру4 (а отрезок на числовой оси есть компакт и поэтому измерим), которая может служить мерой неопределенности Н( (x)) сведения (x) о точке x.
О п р е д е л е н и е. Мера неопределенности Н( (x)) сведения (x) о точке x есть мера множества (x)
Н( (x)) = mes( (x)).
Из введенных терминов следует, что сведение о действительном числе есть некоторый отрезок, содержащий это число, а неопределенность рассматриваемого сведения есть длина этого отрезка.
Введенная мера соответствует общим требованиям к мерам неопределенности:
H( (x)) 0 ( по определению меры);
H( (x)) = 0 (x) x (по определению меры);
M = Hmax > 0: H( (x)) M (следует из определений меры и компакта).
Ограничения применения меры: для ОИ – действительных чисел, допускается вектор чисел. Целесообразно применение при расчетах по обеспечению конфиденциальности и точности при преобразованиях числовой информации.
