
Конспект / 2
.doc2.3. Методы определения прагматических показателей информации
Под прагматическими понимаются такие показатели, которые| характеризуют информацию с точки зрения потребностей тех задач, в процессе решения которых используется оцениваемая информация. Отсюда следует, что содержание прагматических показателей практически однозначно определяется ролью, значимостью, важностью информации в процессе решения задач, также качеством и содержанием информации, имеющейся в момент решения соответствующей задачи. При этом количество информации здесь понимается как объем тех сведений, которые используются в процессе решения задачи. Причем важно не просто количество сведений в абсолютном выражении, а достаточность (полнота) их для информационного обеспечения решаемых задач и адекватность, т. е. соответствие текущему состоянию тех объектов или процессов, к которым относится оцениваемая информация. Кроме того, важное значение имеет чистота информации, т. е. отсутствие среди необходимых данных ненужных или, как принято говорить, шумов. В наукометрии такая характеристика названа релевантностью информации. Наконец, эффективности решения задач немаловажное значение имеет форма представления информации с точки зрения удобства восприятия и удобства использования ее в процессе решения задач. Такую характеристику принято называть толерантностью.
Таким образом, показатели рассматриваемого вида могут быть представлены следующим перечнем:
1) важность, значимость информации с точки зрения тех задач, для решения которых используется оцениваемая информация;
2)полнота информации для информационного обеспечения решаемых задач; 1
3)адекватность, т. е. соответствие текущему состоянию соответствующих объектов или процессов;
4) релевантность информации, поступающей для информационного обеспечения решаемых задач;
5) толерантность поступающей информации.
Рассмотрим подходы к определению значений перечисленных показателей.
1. Важность информации. В соответствии с изложенным выше, важность информации есть обобщенный показатель, характеризующий, с одной стороны, значимость информации с точки зрения тех задач, для решения которых она используется, а с другой — с точки зрения организации ее обработки. Иными словами, важность информации должна оцениваться, по крайней мере, по двум группам критериев: по назначению информации и по условиям ее обработки.
В первой группе, очевидно, следует выделить два таких составных критерия: первый – важность самих задач для обеспечиваемой деятельности и второй – степень важности информации для эффективного решения соответствующей задачи.
Во второй группе выделяются два таких составных критерия: первый – уровень потерь в случае нежелательных изменений информации в процессе обработки под воздействием дестабилизирующих факторов и второй – уровень затрат на восстановление нарушенной информации.
Введем обозначения:
Кви – коэффициент важности информации;
Квз – коэффициент важности тех задач, для обеспечения решения которых используется информация;
Киз – коэффициент важности оцениваемой информации для эффективного решения задач;
Кпи - коэффициент важности оцениваемой информации с точки зрения потерь при нарушении ее качества;
Ксв – коэффициент важности информации с точки зрения стоимости восстановления ее качества.
Тогда, очевидно:
Кви = f (Квз, Киз, Кпи, Ксв)… (2.1)
Иными словами, для оценки важности информации необходимо уметь определять значения перечисленных выше коэффициентов и знать вид функциональной зависимости (2.1). Но на сегодняшний день неизвестно ни то ни другое, и есть веские основания утверждать, что и в ближайшем будущем эта проблема не будет решена.
В качестве выхода из положения используем следующий подход, основанный на неформально-эвристических методах. С этой, целью значения входящих в формулу (2.1) критериев будем выражать лингвистическими переменными. Возможные значения этих переменных приведены на рис. 2.4. Затем сформируем возможные комбинации критериев в пределах каждой группы. Результаты этой работы приведены в табл. 2.1а и 2.16. Сведем теперь воедино полученные результаты, что и даст итоговую классификацию информации по важности. Эта классификация приведена в табл. 2.2. При этом сделано предположение, что диагональные (снизу слева вверх направо) элементы классификационной структуры являются одинаково важными.
Рис. 2.4. Структура и значения критериев оценки важности информации
Таблица 2.1. Первичная классификация важности информации
а) по назначению (н)
-
Значения критериев
Важность информации для задачи
Незначительная
Средняя
Большая
Важность
задачи
Обыкновенная
1н
2н
3н
Важная
4н
5н
6н
Очень важная
7н
8н
9н
б) по параметрам обработки (о)
-
Значения критериев
Стоимость восстановления
Незначительная
Средняя
Большая
Уровень
потерь
Незначительный
1о
2о
3о
Средний
4о
5о
6о
Большой
7о
8о
9о
Таким образом, оказалось, что при выбранных значениях составных критериев вся информация делится на семнадцать классов важности. Однако номер класса сам по себе не характеризует важность информации на содержательном уровне, да и оперировать семнадцатью различными классами затруднительно. Для преодоления указанных трудностей, разделим все элементы итоговой классификационной структуры так, как показано в табл. 2.2 пунктирными линиями. В итоге семнадцать классов разделились на сеть категорий важности, которым присвоим следующие содержательные наименования:
Мл В — маловажная (категория А);
Об В — обыкновенной важности (категория В);
Пс В — полусредней важности (категория В);
Ср В — средней важности (категория Г);
Пв В — повышенной важности (категория Д);
Вл В — большой важности (категория Е);
Чр В — чрезвычайной важности (категория Ж).
2. Полнота информации – показатель, характеризующий меру достаточности оцениваемой информации для решения соответствующих задач. Отсюда следует, что данный показатель является относительным: полнота информации оценивается относительно вполне определенных задачи или группы задач. Поэтому, чтобы иметь возможность определить показатель полноты информации, необходимо для каждой существенно важной задачи или группы задач заблаговременно составить перечень тех сведений, которые необходимы доя их решения.
3. Адекватность информации - степень ее соответствия действительному состоянию тех реалий, которые отображает оцениваемая информация. Адекватность информации определяется двумя параметрами: объективностью генерирования (съема, определения, установления) информации о предмете, процессе или явлении, и продолжительностью интервала времени между моментом генерирования информации и текущим моментом.
Как видно из рисунка, закон старения информации характеризуется четырьмя характерными интервалами:
t1 – продолжительностью времени, в течение которого оцениваемая информация полностью сохраняет свою адекватность;
t2 – продолжительностью времени, в течение которого адекватность информации падает, но не более, чем на одну четверть;
t3 – продолжительностью времени, в течение которого адекватность информации падает наполовину;
t4 – продолжительностью времени, в течение которого адекватность информации падает на три четверти.
Учитывая то обстоятельство, что обе составляющие адекватности информации К (а) и К (а) зависят от большого числа факторов, многие из которых носят случайный характер, есть основания утверждать, что они в основе своей носят случайный характер и поэтому могут интерпретироваться как вероятности того, что информация по соответствующему параметру является адекватной. Поскольку для подавляющего большинства теоретических интересов и практических приложений важно, чтобы информация была адекватной одновременно по обоим параметрам, то в соответствии с теоремой умножения вероятностей общий показатель адекватности информации может быть определен так:
К (а) = К (а) К (а) . (2.4)
Независимость величин а и а представляется вполне естественной.
4. Релевантность информации. Релевантность есть такой показатель информации, который характеризует соответствие ее содержания потребностям решаемой задачи. Для количественного выражения данного показателя обычно используют так называемый коэффициент релевантности К(p) как отношение объёма релевантной информации Np к общему объему анализируемой информации N0, т.е.:
К(p) = Np/ N0 . (2.5)
Сущность коэффициента релевантности очевидна, но трудности практического его использования сопряжены с количественным выражением объема информации, поскольку определение количества информации относится к весьма неопределенной и трудноразрешаемой проблеме. В сфере научно-технической информации под N0 понимается общее количество документов, выданных на запрос, а под Np – количество релевантных среди общего объёма. Некорректность и даже условность такого выражения очевидна. Но самое главное состоит в том, что с такой мерой трудно подойти к оценке фактографической информации.
5. Толерантность информации. Толерантность, как отмечалось выше, есть показатель, характеризующий удобство восприятия и использования информации в процессе решения той задачи, для решения которой она используется. Уже из самого определения видно, что понятие толерантности является очень широким, в значительной мере неопределенным и субъективным. Даже для наиболее определенной – цифровой информации – значение толерантности может быть самым различным. Поэтому вряд ли можно надеяться на разработку строго формальной методики определения толерантности. Даже из эвристических методов наиболее подходящими представляется неформально-эвристические, и особенно – методы экспертно-лингвистических оценок. При этом в качестве значений лингвистической переменной могут быть такие:
весьма удобно, комфортно – когда информация представлена в таком виде, что ее использование в процессе решения задачи происходит естественным образом, не требуя дополнительных усилий;
удобно – когда использование информации, если и требует дополнительных усилий, то лишь незначительных;
средне – когда использование информации требует дополнительных усилий, но, вообще говоря, допустимых;
плохо – когда используемая информация используется с большими трудностями;
очень плохо – когда использование информации или вообще невозможно или требует неоправданно больших усилий.