12.5. Принятие решения активным агентом на основе знаний, полученных обобщением прецедентов

Агент обладает знаниями, т.е совокупностью высказываний, утверждений об объектах и связях внешней среды, причем для знаний выполняются следующие аксиомы знаний.

Состояния объекта внешней среды получают описание в информационной системе агента. Для агента эти состояния (или области) неразличимы, если их описания одинаковы. Таким образом возникают классы (эквивалентности) состояний, которые называются ситуациями. Ситуации упорядочиваются, считается, что SS тогда и только тогда, когда каждая формула, истинная в S, истинна также в S'. Далее вводится понятие возможного мира как множество ситуаций, в которых истинными является то или иное подмножество высказываний. Состояния могут принадлежать разным типам. Постулируется наличие операторов или классов таких, что класс С позволяет перевести ситуацию Si типа ср в ситуацию S2 типа.

Знания и операторы (методы) или каналы определяют какие действия выбираются агентом. Порядок использования методов определяется протоколом. Операция агентапринадлежит множеству допустимых для агента операций.

Действие агента изменяет состояние средыДействия агента

могут изменять как состояние среды, так и ментальные состояния агента. Если действие изменяет информационное состояние агента, его называют операцией тестирования. Действие реализуется посредством операции.

Протокол— тип или класс ситуации.

Протокол ограничен миссией, которая отбрасывает некоторые варианты действия как недопустимые. Есть и другие ограничения, зависящие от действия и ситуации.

Упорядочение действий во времени образует план (прогнозирование действий). Стратегия — история последовательности состояний и решений в прошлом, будущем.

Динамическая проблема решения заключается в терминах поиска агентом оптимального плана. План состоит из описания цели (подмножество состояний с наивысшими значениями полезности) и последовательности решений.

Существуют вероятности и ожидаемые полезности, связанные с каждым решением, и агент выбирает акты действий, которые максимизируют ожидаемую полезность. Агент использует протокол как систему правил для принятия решений. Каждое правило содержит описания ситуаций, класс ситуаций, в которых оно применимо.

Будем обозначать множество состояний системы, в которых справедливо р через S_p. Рассмотрим множество допустимых для агента состоянийи

пишем агент а_i знаетесли

Агент знает р, если

Дня агента выделяются некоторые подмножества, называемые возможными мирами, как подмножества U множества S. Миры из U представляют собою миры, с которыми S находится в отношении R. В силу знания фактов миры из U для агента могут оказаться неразличимыми. Можно сказать, что агент а_iзнает факт р в мире S, если и только если р истинно во всех мирах, достижимых из S по отношению R.

Миры из U называются эпистемическими альтернативами с отношением R — отношением достижимости. Ментальные состояния агента по отношению к среде могут быть следующими:

а_i знает, что р,

a_i знает, что p,

а_i не знает р или p.

Для получения знания агент может осуществить некоторый тест или акт.

Агент сопоставляет описание ситуации, в которой находится система правила, по принципу максимального сходства (сходство ситуации и правил).

Агент генерирует множество возможных структур ранее и выбирает ту, которая дает максимальную ожидаемую полезность при ограниченных ресурсах. Агент использует обучение в случае, когда нет подходящего правила. Он ищет генерацию ситуации, ищет генерацию правила, затем производит идентификацию правил, при этом используется немонотонная логика.

<<< < Предыдущая 1 2 34 / 44

Соседние файлы в папке Романов В.П. Интеллектуальные информационные системы в экономике

#
02.05.2014478.21 Кб251ГЛАВА 1.doc
#
02.05.2014796.16 Кб206ГЛАВА 10.doc
#
02.05.2014270.85 Кб154ГЛАВА 11.doc
#
02.05.2014177.15 Кб154ГЛАВА 12.doc
#
02.05.2014491.01 Кб143ГЛАВА 2.doc
#
02.05.2014836.61 Кб159ГЛАВА 3.doc
#
02.05.20141.06 Mб139ГЛАВА 4.doc
#
02.05.2014908.29 Кб149ГЛАВА 5.doc
#
02.05.2014662.02 Кб126ГЛАВА 6.doc