- •Глава 9. Стратегия вывода с использованием байесовского подхода
- •9.1. Обработка свидетельств в условий неуверенности и нечеткости
- •9.2. Меры неопределенности в иис
- •Правила остановки
- •9.3. Модель Шортлифа и Бьюкенена
- •9.4. Теория Демпстера—Шейфера Обобщение байесовских выводов
- •Комбинация функций веры
- •Эффективное вычисление функции уверенности
- •Распространение уверенности в качественных марковских деревьях.
- •Применение метода Демпстера—Шейфера для выбора оптимального варианта инвестиционного проекта
- •Результаты расчетов показателей эффективности инвестиционных проектов
9.2. Меры неопределенности в иис
В ИИС обычно имеется механизм сравнения описания ситуации и механизм применения правила. Механизм сравнения определяет, какие правила являются релевантными в данной ситуации, сравнивая информацию в рабочей памяти с условиями применения каждого правила в базе знаний и выписывания правил, условия применимости которых выполняются. Затем аппликатор правила выбирает релевантное правило, которое должно быть применено. В случае, когда оказывается возможным применить несколько правил, аппликатор выбирает и применяет специфическое правило согласно некоторой эвристики, называемой «стратегия разрешения конфликтов».
Существуют две основных точки зрения на оценки вероятности, применяемые в экспертных системах: объективистский и субъективистский подходы. Согласно объективистскому подходу вероятность— это отношение появлений некоторого события к его наблюдениям в терние длительного периода времени. Другими словами, закон больших чисел гарантирует, что при наличии достаточных наблюдений процент появления событий будет приближаться к объективной вероятности.
Персоналистическая, субъективистская или основанная на суждениях оценка вероятности исходит из того, что вероятностные меры уверенности представляют собою уверенность, которую индивидуум имеет относительно истинности некоторого конкретного предложения. Эта точка зрения постулирует, что индивидуум действует некоторым «разумным» образом, что не исключает, однако, возможности того, что два разумно действующих индивидуума, столкнувшись с одними и теми же данными, могут иметь разную степень уверенности в одном и том же высказывании.
Пусть А — событие в мире. Собрание всех возможных элементарных событий Ω. называется пространством событий. Вероятность события А обозначается р(А). Предположим, что В есть другое событие. Вероятность того, что А появится при условии, что В появилось, запишем в виде р(А/В). Р(А/В) называется условной вероятностью А при условии В. Вероятность того, что появятся как А, так и В — р(АВ), называется :овместной вероятностью А и В. По определению условная вероятность р(А/В) равна отношению совместной вероятности р(АВ) к вероятности В, т.е.
Таким образом, рассуждая аналогично относительно В, р(АпВ) = р(В/А) Р(А).
Так как
Если события независимы, мы имеем
Другими словами, если А и В несвязные множества,
Используя то, что В можно записать как
Переходя от обозначений множеств к вероятностям, комбинируя, получим:
Равенство (9.8) закладывает основу для использования вероятности при оценке неопределенности. Оно обеспечивает способ получения условной вероятности В при условии А. Рассмотрим случай, в котором все правила в ИИС выражены в форме «Если <h -истинно>, тогда <х будет наблюдаться с вероятностью р>». Ясно, что если h наблюдается, правило констатирует, что вероятность того, что событие х появится, равно р. Но если статус h неизвестен, и х наблюдается? Равенство (9.8) говорит нам, как вычислить вероятность того, что h истинно и в этом случае. Переход от А и В к h их не случаен. При помощи равенства (9.8) мы оставляем общую теорию вероятности и начинаем анализировать вероятностное исчисление в ИИС. Таким образом мы можем перефразировать уравнение (9.8) в терминах гипотез и свидетельств:
Равенство (9.9) связывает гипотезы с квантами подкрепляющих их свидетельств. Интерпретация равенства (9.9) предполагает определение априорной вероятности гипотезы h, p(h) как вероятности, приписываемой h до наблюдения всяких свидетельств, а также вероятности свидетельств при условии гипотезы.
В ИИС требуемые для решения проблемы вероятности обеспечиваются специалистами-экспертами и хранятся в базе данных. Эти вероятности включают априорные вероятности для всех возможных гипотез р (h) и условные вероятности для наблюдаемых порций свидетельств при условии гипотез p(x/h).
При наличии одного свидетельства и многих взаимно исключающих и исчерпывающих гипотез:
При наличии многих свидетельств, многих взаимно исключающих и исчерпывающих гипотез, вероятность некоторой гипотезы h оценивается следующим образом:
К сожалению, равенство (9.11) требует, чтобы были известны все возможные комбинации свидетельств для всех гипотез. Это делает байесовское правило практически не работающим. Поэтому часто предполагают условную независимость свидетельств при условии данной гипотезы:
Уверенность может накапливаеться в ИИС системе в результате многократного использования правила Байеса для вычисления апостериорных вероятностей гипотез при условии наблюдаемых свидетельств. Полученные апостериорные вероятности обеспечивают ранжирование всех потенциально истинных гипотез.
Пример 9.2. Рассмотрим пример, иллюстрирующий этот процесс. Предположим, что в некоторой системе три взаимоисключающие и исчерпывающие гипотезы h1,h2,h3 имеют априорные вероятности p(h1), p(h2) и p(h3) соответственно. Затем мы наблюдаем два условно независимых фактора х1 и х2, которые поддерживают эти гипотезы в различной степени. Таблица 9.2 (показывает условные и априорные вероятности всех гипотез и свидетельств в данном примере).
По мере того как собираются свидетельства, уверенность в гипотезе будет увеличиваться, если свидетельства поддерживают ее, и уменьшаться, если свидетельства противоречат ей. Предположим, что мы наблюдаем вначале х1, а затем х2. Наблюдая х1, мы вычисляем апостериорную вероятность гипотезы согласно соотношению (9.10):
Таблица 9.2 Априорные и условные вероятности, используемые в примере 9.2
После того как произведено наблюдение х1 уверенность гипотез h1 и h3 уменьшается, в то время как h2 увеличивается. После наблюдения х2 мы вычисляем апостериорную вероятность
Так как x1 и х2 — условно независимы при условии гипотезы
Следовательно,
Хотя первоначальное ранжирование было h1>h2>h3, только hi и h2 остаются для рассмотрения после наблюдения x1 и х2, h2 теперь выглядит более вероятной чем h1.
Большой объем априорной информации, необходимой для применения правила Байеса, привел к поиску альтернативных методов.
В последующем изложении при применении указанных правил к описанию экономических объектов мы будем связывать условно наблюдаемые данные с экономическими показателями, а гипотезы — с некоторыми ситуациями. Например, наблюдаемые данные могут быть экономические показатели х1 и х2 и пусть h — гипотеза о проблемной экономической ситуации, которой соответствуют данные значения этих показателей. Рассмотрим вначале пример конечного множества из п элементов. Элементы множества могут обладать одним или более свойствами. Число элементов, которым соответствует показатель х1 есть n(x1)=n1 и число категорий, которым соответствуют два показателя одновременно, есть n(x1 x2)=n12. Заметим, что имеет место равенство:
Рассмотрим теперь случай, когда два показателя связаны с гипотезой о ситуации h. Сделаем предположение, что оба эти показателя независимы как в совокупности, так и в подмножестве этой совокупности. Тогда
и точно, так же
т.е. принимая относительные частоты за оценки соответствующих вероятностей, получим:
Таким образом в соответствии с теоремой Байеса получим
Чтобы показать, как теория Байеса может быть применена к принятию решений об инвестициях, полезно рассмотреть теорему Байеса, используя следующие обозначения:
h: гипотеза h,
h: гипотеза «не h»,
х: свидетельство х,
x: свидетельство «не х»,
p(h): априорная вероятность гипотезы h,
p(h/x): апостериорная вероятность гипотезы h при наличии свидетельств х,
p(h,x): совместная вероятность появления гипотезы h и свидетельства х. По определению, условная вероятность
Подставляя (9.23) в (9.22) мы получаем
Поскольку
Равенство (9.24) может быть преобразовано к виду:
Используя уравнение (9.25), возможно вычислять апостериорную вероятность удовлетворения гипотезы h при наличии данных свидетельств из допустимых вероятностных данных
По формуле (9.24) можно вычислить апостериорную вероятность удовлетворения гипотезы h при данных свидетельствах из доступных вероятностных данных
Вычисления (9.24) могут быть реализованы использованием понятий шансы и отношением правдоподобия. По определению шансы O(h) и O(h/x) могут быть выражены следующим образом:
Согласно уравнению (9.28) апостериорные шансы могут быть вычислены как произведение O(h) и LR(h/x). Таким образом (9.28) может быть использовано, чтобы дать численную оценку связи экономических показателей с проблемной экономической ситуацией. Рассмотрим пример 9.3, данные по которому представлены в таблице 9.3.
Эта таблица частот отражает данные о доходности 200 ценных бумаг для различных предприятий. В данном случае в качестве гипотезы h принято попадание в группу ценных бумаг с высоким уровнем доходности, гипотеза h — попадание в группу предприятий с низким доходом, свидетельство х — ценные бумаги принадлежат электронной индустрии, свидетельство х — ценные бумаги принадлежат неэлектронной индустрии.
Таблица 9.3
Если нет другой информации о ценных бумагах, априорную вероятность доходности можно оценить следующим образом:
В случае, если отрасль, к которой принадлежит ценная бумага известна, можно применить формулу (9.28) Априорные шансы равны:
Отношение правдоподобия равняется:
Таким образом, при наличии свидетельства о том, что ценные бумаги принадлежат электронной отрасли, вероятность получения дохода более 30% увеличивается с 0,45 до 0,8. Предполагая, что существуют дополнительные свидетельства относительно того, ориентирована ли продукция на экспорт или на внутренний рынок, дополнительная таблица частот для рынка может выглядеть следующим образом:
Таблица 9.4
Таким же образом апостериорная вероятность может быть вычислена как:
Таким образом:
Рис.9.2. График интерполяции значения вероятности в зависимости от свидетельства
Располагая этими двумя элементами свидетельств — отрасль промышленности и экспортная ориентация продукции — мы получаем увеличение вероятности получения более высокого дохода с 0,45 до 0,8907.
До сего времени мы предполагали, что свидетельства известны с полной уверенностью, но это может быть не так во многих случаях. Например, мы полагали, что компании могут быть дихотомизированы по критерию отрасли или рынка, в действительности такие характеристики часто являются вопросами степени. Компания может производить 60% своей продукции для электронной индустрии и продавать 50% полного объема выпуска на внешние рынки. Один способ обработки неопределенных свидетельств состоит в том, чтобы применить метод интерполяции. На рис. 9.2 показано, что вероятность можно отобразить в интервал [—1,0,1]. Если положение свидетельств на шкале [—1,0,1] известно, соответствующую вероятность можно линейно интерпретировать. Рассмотрим пример.
Пример 9.4.
Если компания производит 100% продукции для электронной индустрии, v=1, если компания не продает совсем электронную продукцию, то v= -1-Если компания продает электронную продукцию в средней пропорции ко всем компаниям электронной индустрии (например, 30%), нормализованная величина v=0. Предположим, компания производит 60% продукции для электронной индустрии, свидетельства могут быть формализованы следующим образом: v (Электроника) = (60-30)/(100-30) = 0.43 , следовательно,
Заметьте, что апостериорная вероятность ослаблена с 0,8 до 0,60 вследствие неопределенности свидетельств. Вновь предполагая, что нормализованные свидетельства экспорта v(Экспорт) = 0,5, ослабленная апостериорная вероятность с обоими элементами свидетельств равна:
Рис.9.3. График интерполяции зависимости вероятности от уверенности
В общем случае ценные бумаги могут быть категоризованы и более чем в два класса (например, классы А, В, С и D). Посредством прямого обобщения уравнений (9.22) — (9.25) и уравнения (9.29), в которомобозначает
вероятность удовлетворения гипотезы \ получим:
Самая простая стратегия, включающая многие свидетельства состоит в том, чтобы использовать все свидетельства. Однако эта стратегия неэффективна, поскольку некоторые свидетельства в ретроспективе могут быть настолько слабыми, что их можно вовсе не учитывать. Таким образом, желательно упорядочить насколько можно более эффективно последовательность применения свидетельств.
Последовательность, в которой применяются свидетельства становится, особенно важной, когда ИИС системы используются интерактивно. Этими полезными средствами упорядочения являются случайное упорядочение, упорядочение по важности и упорядочение по правилам.
Случайное упорядочение. Основное преимущество случайного упорядочения — это простота. Однако этот метод может заставить ЛПР иметь дело с тривиальными свидетельствами.
Упорядочение по важности. Упорядочение по важности свидетельств может основываться на опыте инвесторов или экспертов по инвестированию.
Когда времени недостаточно и доступно значительное количество вычислительных ресурсов, будет оправданно применить подход, основанный на правилах, которые упорядочивают свидетельства, используя формулу: .
для свидетельства xj.
Формула (9.30) представляет сумму апостериорных вероятностей изменений, которые могут появиться как результат знания того, являются ли свидетельства Еj истинными или ложными.
Система может найти свидетельства такие, что
В формуле (9.30) можно использовать сумму квадратов вместо абсолютных разностей. Веса также могут быть применены к гипотезам. Главный недостаток подхода, основанного на правилах — это большой объем вычислений.