
Ответы к ГАКу на степень бакалавра / 127
.DOC
127. Ценность информации. Подходы к измерению полной и неполной информации.
Ценность информации изучает прагматика. Исследование и измерение прагматического качества информации невозможно без категории цели или критерия принятия решения.Академик Хаоркевич предложил определять меру ценности информации I как изменение логарифма вероятности достижения цели в результате получения сообщения:
I = log p1 - log p0 = log p1/p0 , где р0 - априорная субъективная вероятность достижения цели;
р1 - субъективная вероятность достижения цели после получения сообщения.
Перспективным является подход к измерению ценности информации в рамках байесовской теории принятия решений . Рассмотрим его особенности на условном примере.
Имеется монета и специально изготовленная игральная кость , четыре стороны которой помечены словом герб и остальные две словом решетка. Наблюдать бросание кости и монеты не разрешается . Один из предметов накрывается чашкой.
Введем обозначения для следующих утверждений : не накрыта монета - То , не накрыта кость - Т1 , выпал герб - а
выпала решка - в. Если принимающий решение правильно угадает , какой именно предметне накрыт , он получит приз 1 рубль. Впротивном случае он не получает ничего . Вероятности событий То и Т1 на начало эксперимента представляются равными р(То)= р(Т1)=1/2 .
Очевидно , что в этом случае ожидаемый выигрыш Со = 1/2 руб. Если же точно известно , какое событие произойдет , то ожидаемый выигрыш при наличии полной и надежной информации С = 1 руб.
Увеличение дохода принимающего решение по сравнению с доходом , который он получил бы на основе решений , принятых с помощью априорной информации , будем незывать ожидаемой ценностью полной информации. В нашем случае Q = С - Со = 1 - 0.5 = 0.5 руб.
Следовательно максимальная сумма , которую имеет смысл заплатить за совершенно надежную информацию в нашем случае = 0.5 руб. Поскольку Q представляет собой прирост дохода от полного исключения неопределенности , эту величину иногда называют стоимостью неопределенности.
Попробуем теперь определить ценность неполной или выборочной информации. Для этого разолвьем описанный выше пример с монетой и костью.
Лицо , производящее эксперимент , сообщает принимающему решение , гербом или решкой помечена верхняя сторона ненакрытого чашкой предмета. Ясно , что такое сообщение существенно повлияет на мнение принимающего решение о том , какой предмет накрыт чашкой. Интуитивно понятно , что при выпадении герба то , что не накрыта кость более вероятно. Для количественной оценки степени устранения неопределенностииспользуется теорема Байеса , утверждающая , что условная вероятность события А , если известно , что событие В наступило , равна
Р(А/В) = ( Р(В/А) * Р(А))/Р(В)
Предположим , что в нашем эксперименте не накрыта монета. Тогда условная вероятность события а Р(а/То)=1/2.
Если же не накрыта кость - событие Т1 , то Р(а/Т1) = 2/3 . Отсюда безусловная вероятность события а равна
Р(а) = Р(а/То) * Р(То) + Р(а/Т1) * Р(Т1) = 7/12 .
В соответствии с теоремой Байеса вероятность того , что не накрыта кость , если известно , что выпал герб , определится из выражения
Р(Т1/а)= ( Р(а/Т1) * Р(Т1)) / Р(а) = 4/7
Аналогично Р(То/а) = 3/7 .
Точно таким же образом найдем условие вероятности событий Т1 и То после сообщения о том , что выпала решка
Р(Т1/в) = 3/5 , Р(То/в) = 2/5 , а Р(в) = 1 - Р(а) = 1 - 7/12 = 5/12
Следовательно , при сообщении герб неилучшей догадкой является кость , а ожидаемый доход равен 4/7 руб. , при сообщении решетка наилучшая догадка - монета , а ожидаемый доход - 3/5 руб. Ожидаемый доход при данной выборочной информации
С в = 7/12 * 4/7 + 5/12 * 3/5 = 7/12 руб.
Ожидаемая ценность выборочной информации в нашем случае
Q в = 7/12 - 1/2 = 1/12 руб.
Ценность информации определяется в денежном выражении , и она учитывает частоту запросов , поступающих в единицу времени на тот или иной вид сведений , в следующем виде : Z v ( t ) = S * V * Mt , где
t - порядковый номер периода времени , начиная с момента возникновения информации
S - стоимость создания единицы информации или ее получения из института информации
V - величина порции анализируемой информации
Mt - частота запросов на эту порцию в период t .
Частоту запросов Mt находят обычно путем статистической обработки данных о фактически наблюдавшихся частотах запросов в предположении , что она распределяется по закону Пуассона .
Стоимостную оценку полезности информации можно , например , использовать для определения экономически оптимальных сроков хранения информации . Так , если Pv - стоимость хранения v - той порции информации , то оптимальный срок хранения ее T opt находится из следующего графика
затраты
Zv(t)
P v
0 T opt T
При T > T opt информацию v -той порции выгодно запрашивать из посторонних источников или воссоздать , так как стоимостная ценность ее Z v ( t) меньше затрат на зранение .
При организеции системы обработки информации в управлении производством часто оказывается удобно оперировать не количеством информации , а ее объемом , измеренным в той или иной ситеме единиц.