Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
109
Добавлен:
09.02.2015
Размер:
84.99 Кб
Скачать

5

Лекция 19. Байесовские сети

(Конспект)

Теорема Байеса: Пусть Ai – полная группа несовместных событий, тогда формула Байеса (формула перерасчета гипотез) и B некоторое событие положительной вероятности

Доказательство следует из теоремы умножения и формулы полной вероятности.

Байесовская сеть — ориентированный граф, в котором каждая вершина по­мечена количественной вероятностной информацией. Полная спецификация такой сети описана ниже.

1. Вершинами сети является множество случайных (дискретных или непрерывных) переменных.

2. Вершины соединяются попарно ориентированными ребрами, или ребрами со стрелками; ребра образуют множество ребер. Если стрелка направлена от вершины X к вершине У, то вершина X называется родительской вершиной вершины У.

3. Каждая вершина Xi характеризуется распределением условных вероятностей P(Xi| Parents {Xi}), которое количественно оценивает влияние родитель­ских вершин на эту вершину.

4. Граф не имеет циклов, состоящих из ориентированных ребер (и поэтому яв­ляется ориентированным ациклическим графом.

Рассмотрим пример.

Житель пригорода установил в своем доме новую систему охранной сигнали­зации для обнаружения взлома. Она довольно надежно обнаруживает взлом, но иногда также реагирует на небольшие землетрясения. У этого человека есть два соседа, Иван и Мария, которые обеща­ли звонить ему на работу, услышав тревожный сигнал. Иван всегда звонит, услышав тревожный сигнал, но иногда путает с ним телефонный звонок в доме соседа и в этих случаях также звонит. Мария любит слушать довольно громкую музыку и поэто­му иногда вообще пропускает тревожный сигнал. Получив факты о том, кто из этих соседей звонил или не звонил, необходимо оценить вероятность взлома. Байесов­ская сеть для этой проблемной области приведена на рис. 20.1.

Отвлечемся от распределения условных вероятностей, показанных на рисунке и рассмотрим топологию сети. Топология сети определения взлома показывает, что взлом и землетрясения непосредственно влияют на вероятность появления тревожного сигнала, а звонки Ивана и Марии зависят только от тревожного сигнала. Поэтому сеть подтверждает предположения, что соседи самостоятельно не обнаруживают какие-либо попытки взлома, не заме­чают незначительных землетрясений и не совещаются друг с другом перед звонками.

Важно, что в этой сети нет вершин, соответствующих тем си­туациям, в которых Мария в настоящее время слушала бы громкую музыку или зво­нил бы телефон и сбивал с толку Ивана. Эти факторы подытожены в показателях неопределенности, связанных с ребрами, направленными от вершины Alarm к вершинам JohnCalls и MaryCalls. Структура сети экономит усилия в условиях недостатка знаний. Потребовалось бы слишком много работы, чтобы узнать, по какой причине эти фак­торы могут оказаться более или менее вероятными в каждом конкретном случае. К тому же все равно отсутствует приемлемый способ получения релевантной инфор­мации.

Вероятности, показанные на рисунке, фактически подытоживают потенци­ально бесконечное множество обстоятельств, которые либо могут вызвать наруше­ния при выработке тревожного сигнала (высокая влажность, отказ сети электропи­тания, разрядка аккумулятора, обрыв проводов, дохлая мышь, застрявшая внутри звонка, и т.д.), либо станут причиной того, что Иван или Мария не смогут о нем со­общить (из-за того, что выйдут на обед, отправятся в отпуск, на время оглохнут, не расслышат сигнал в шуме пролетающего вертолета и т.д.). Но именно благодаря ис­пользованию приближенных оценок агент получает возможность хотя бы приблизительно узна­вать, что происходит в мире. Степень приближения к истине может быть повышена по мере введения дополнительной ре­левантной информации.

Рис. 20.1. Типичная байесовская сеть, на которой показаны и топология, и таблицы условных вероятностей (Conditional Probability Table — СРТ). В таблицах СРТ буквами в, Е, A, j и м обозначены следующие события: Burglary (Взлом), Earthquake (Землетрясение), Alarm (Тревожный сигнал), JohnCalls (Звонки Ивана) и MaryCalls (Звонки Марии)

Рассмотрим распределения условных вероятностей на рис. 20.1. Каждое распределение представлено в виде таблицы условных вероятностей, или сокращенно СРТ (Conditional Probability Table). (Такая форма таблицы может использоваться для дискретных переменных; другие пред­ставления, включая те, которые подходят для непрерывных переменных, описаны в разделе 14.2.) Каждая строка в таблице СРТ содержит условную вероятность каж­дого значения вершины для обусловливающего случая (conditioning case), опреде­ляющего условную вероятность.

Обусловливающий случай представляет собой одну из возможных комбинаций значений родительских вершин (в принципе его можно рассматривать как миниатюрное атомарное событие). Каждая строка должна в сум­ме составлять 1, поскольку элементы этой строки представляют собой исчерпываю­щее множество случаев для данной переменной. А если речь идет о булевых пере­менных, то после определения вероятности истинного значения, скажем р, вероят­ность ложного значения должна быть равна 1-р, поэтому в таблицах СРТ второе число часто не указывают, как и на рис. 14.2. Вообще говоря, любая таблица для бу­левой переменной с к булевыми родительскими переменными содержит 2к незави­симо определяемых вероятностей. Таблица для вершины без родительских вершин имеет только одну строку, представляющую априорные вероятности каждого воз­можного значения соответствующей переменной.

Виды байесовских сетей доверия:

Байесовские сети доверия – Bayesian Belief Network – используются в тех областях, которые характеризуются наследованной неопределённостью. Эта неопределённость может возникать вследствие:

  1. неполного понимания предметной области;

  2. неполных знаний;

  3. когда задача характеризуется случайностью.

Таким образом, байесовские сети доверия (БСД) применяют для моделирования ситуаций, содержащих неопределённость в некотором смысле. Для байесовских сетей доверия иногда используется ещё одно название причинно-следственная сеть, в которых случайные события соединены причинно-следственными связями.

Причинно-следственные связи позволяют более просто оценивать вероятности событий. В реальном мире оценивание наиболее часто делается в направлении от “наблюдателя” к “наблюдению”, или от “эффекта” к “следствию”, которое в общем случае более сложно оценить, чем направление “следствие –> эффект”, то есть в направлении от следствии.

Использование байесовских сетей.

Областью использования байесовских сетей являются эксперт­ные системы, которым необходимо работать с вероятностя­ми. Основными областями применения являются:

  • Медицина (PathFinder, MUNIN, Painulim, SWAN)

  • Космос и армия (Vista)

  • Компьютеры и системное программное обеспечение (системе Office (знакомая мно­гим пользователям «скрепка»), диагностика проблем работы принтеров и других справочных и wizard-подсистемах, борьба со спамом)

  • Обработка изображений и видео (восстановлением трехмерных сцен из двумерной динамической инфор­мации, синтез статических изображений высокой четкости из видеосигнала)

  • Финансы и экономика