- •Глава 12. Агентные системы
- •12.1. Структура и функции агента и мультиагентных систем
- •12.2. Архитектура агента
- •12.3. Мультиагентные системы (mac) и виртуальные организации
- •12.4. Элементы теории агентных систем
- •12.5. Принятие решения активным агентом на основе знаний, полученных обобщением прецедентов
12.5. Принятие решения активным агентом на основе знаний, полученных обобщением прецедентов
Агент обладает знаниями, т.е совокупностью высказываний, утверждений об объектах и связях внешней среды, причем для знаний выполняются следующие аксиомы знаний.
Состояния объекта внешней среды получают описание в информационной системе агента. Для агента эти состояния (или области) неразличимы, если их описания одинаковы. Таким образом возникают классы (эквивалентности) состояний, которые называются ситуациями. Ситуации упорядочиваются, считается, что SS тогда и только тогда, когда каждая формула, истинная в S, истинна также в S'. Далее вводится понятие возможного мира как множество ситуаций, в которых истинными является то или иное подмножество высказываний. Состояния могут принадлежать разным типам. Постулируется наличие операторов или классов таких, что класс С позволяет перевести ситуацию Si типа ср в ситуацию S2 типа.
Знания и операторы (методы) или каналы определяют какие действия выбираются агентом. Порядок использования методов определяется протоколом. Операция агентапринадлежит множеству допустимых для агента операций.
Действие агента изменяет состояние средыДействия агента
могут изменять как состояние среды, так и ментальные состояния агента. Если действие изменяет информационное состояние агента, его называют операцией тестирования. Действие реализуется посредством операции.
Протокол— тип или класс ситуации.
Протокол ограничен миссией, которая отбрасывает некоторые варианты действия как недопустимые. Есть и другие ограничения, зависящие от действия и ситуации.
Упорядочение действий во времени образует план (прогнозирование действий). Стратегия — история последовательности состояний и решений в прошлом, будущем.
Динамическая проблема решения заключается в терминах поиска агентом оптимального плана. План состоит из описания цели (подмножество состояний с наивысшими значениями полезности) и последовательности решений.
Существуют вероятности и ожидаемые полезности, связанные с каждым решением, и агент выбирает акты действий, которые максимизируют ожидаемую полезность. Агент использует протокол как систему правил для принятия решений. Каждое правило содержит описания ситуаций, класс ситуаций, в которых оно применимо.
Будем обозначать множество состояний системы, в которых справедливо р через Sp. Рассмотрим множество допустимых для агента состоянийи
пишем агент аi знаетесли
Агент знает р, если
Дня агента выделяются некоторые подмножества, называемые возможными мирами, как подмножества U множества S. Миры из U представляют собою миры, с которыми S находится в отношении R. В силу знания фактов миры из U для агента могут оказаться неразличимыми. Можно сказать, что агент аiзнает факт р в мире S, если и только если р истинно во всех мирах, достижимых из S по отношению R.
Миры из U называются эпистемическими альтернативами с отношением R — отношением достижимости. Ментальные состояния агента по отношению к среде могут быть следующими:
аi знает, что р,
ai знает, что p,
аi не знает р или p.
Для получения знания агент может осуществить некоторый тест или акт.
Агент сопоставляет описание ситуации, в которой находится система правила, по принципу максимального сходства (сходство ситуации и правил).
Агент генерирует множество возможных структур ранее и выбирает ту, которая дает максимальную ожидаемую полезность при ограниченных ресурсах. Агент использует обучение в случае, когда нет подходящего правила. Он ищет генерацию ситуации, ищет генерацию правила, затем производит идентификацию правил, при этом используется немонотонная логика.