- •Глава 12. Агентные системы
- •12.1. Структура и функции агента и мультиагентных систем
- •12.2. Архитектура агента
- •12.3. Мультиагентные системы (mac) и виртуальные организации
- •12.4. Элементы теории агентных систем
- •12.5. Принятие решения активным агентом на основе знаний, полученных обобщением прецедентов
12.4. Элементы теории агентных систем
Одной из важнейших работ начала 1990-х годов стала статья И. Шоэма «Агентно-ориентированное программирование». В ней был описан социальный взгляд на организацию вычислений, связанный с взаимодействием агентов в процессе вычислений. В свою очередь, социальный (коллективный) агент определяется пятеркой:
где ST — множество состояний; L — множество языков; АС — множество действий; SL — множество социальных законов, причем ограничение задается парой (ас,), а социальный законsl есть множество ограничений
обобщенная функция переходов, удовлетворяющая следующим условиям: а) для любых
Тогда виртуальная организация определяется как MAC, состоящая из социальных агентов, подчиняющихся множеству социальных законов и имеющих общие состояния, единый язык для описания состояний, согласованное множество действий и функцию переходов.
Для описания целей, намерений, желаний, возможностей и запретов в поведении агента используются различные варианты модальной логики. Модальные логики, в которых для описания агентов наряду с обычными высказываниями (предикатами) допускаются модальности типа «возможно» и «необходимо» (статическая логика), «известно» и «неизвестно» (эпистемическая логика), «всегда» и «никогда» (временная логика), «верит и не верит» (доксастическая логика), «желает» и «не желает» (опти-тативная логика) и т.д., представляют собой расширение классической логики высказываний. Они могут интерпретироваться в различных возможных мирах, тогда как классическая логика интерпретируется в одном-единственном мире. Тогда в русле модели возможных миров, убеждения агента можно представить как совокупность миров, в которых распределены его предпочтения. Пусть агент работает с множеством возможных миров W. Рассматривая знания и предпочтения агента, из W можно выделить подмножество Wo, на котором агент концентрирует свое внимание. Это подмножество Wo содержит миры, совместимые с тем, что агент знает (в чем он убежден) в мире W. Тогда соотнесение подмножества Wo, агента а и мира w W означает введение некоторого отношения R (отношение достижимости). Здесь миры из W() — это такие миры, с которыми W находится в отношении R.
Семантика возможных миров описывается алгебраически с помощью моделей Крипке (W,R,f), где W— множество возможных миров, R— отношение достижимости, а— соответствие, устанавливаемоемежду миром w e W , пропозициональной константойи значением истинности из двухэлементного множества {0,1}. Здесь различные свойства
отношения R индуцируют различные схемы аксиом модальной логики. Эти свойства могут определяться с помощью специальных встраиваемых предикатов multiWorldSystem и canSeeWorlds, предназначенных для выбора наиболее подходящих систем модальной логики и отношений достижимости между мирами. Иными словами, для определения того, какой из миров достижим (т.е. может рассматриваться агентом) необходимо выбрать наиболее удобную систему аксиом модальной логики в соответствии со свойствами рефлексивности и/или симметричности и/или транзитивности отношения достижимости.
Во временной логике возможные миры представляют состояния некоторого мира в различные моменты его эволюции. Задаются также следующие типы действий — предварительные условия, тело действий и последствия. В свою очередь, ситуативная модальная логика строится на основе четырех модальностей, связанных с убежденностью агента а в своих знаниях: Know (a,p,s), Believes (a,p,s), Kwhether (a,p,s), Doubts (a,p,s), где оператор F(a,p,s) читается как: агент убежден с некоторым уровнем определенности а (знает, уверен, сомневается), что в ситуации s имеет место р. Берутся также три модальности, характеризующие целенаправленное поведение: Want(a, p, s), Indif(a, p, s) и Wantstock(a, p, s).
В немонотонных логиках вводится новый символ М, который означает уверенность в некотором факте при отсутствии противоположного факта. Например,гласит, что «если высказывание р истинно, то Mq означает, что р согласуется с теорией». Высказывание р называется согласованным, если из него не следует отрицания. Предложение Мр выполняется тогда и только тогда, когда нельзя найти —>р. Так цели агентов считаются несовместимыми, если выполнение цели одного из них ведет к невыполнению цели другого. А именно, цель агента а, несовместима с целью агента а1, если цели определяются как достижение состояний р и q соответственно, и
Однако ввиду динамического характера функционирования агента и MAC, обычные модальные логики должны дополняться средствами описания темпоральных аспектов и ментальных состояний, а зачастую, и средствами описания свойств, связанных с реальным временем.
Семантика множества возможных миров хорошо известна. В этой семантике ментальные понятия интерпретируются множеством возможных миров и отношением достижимости (доступности) между ними. С каждым возможным миром ассоциируется некоторая теория (множество формул и атомарных предикатов— фактов, про которые известно, что они истинны). Подход к формализации ментальных состояний и понятий базируется на синтаксисе многомодальной логики ветвящегося времени и на семантике в форме множества возможных миров.
Язык модальной логики включает в себя традиционные компоненты: непустое множество примитивных высказываний Ф; пропозициональные связки и; модальные операторыBel («агент убежден, верит), Des («агент желает») и Intend («агент намерен»); временные операторы X («следующий»), U («до тех пор, пока»), F («когда-нибудь в будущем»), Е («некоторый путь в будущем»). Все остальные связки, например, («всегда в будущем»), В («раньше»), А («неизбежно в будущем») могут быть выражены через уже введенные.
Правильно построенные формулы языка вводятся практически обычным образом с некоторыми особенностями. Аксиоматика модальных операторов строится на операторах убеждения, желания и намерения, включает в себя следующие группы аксиом.
G — аксиомы (аксиомы обобщения — «каждая тождественно истинная формула содержится в убеждениях, желаниях и намерениях агента»):
Следующие три аксиомы выражают непротиворечивость убеждений (D-аксиома), позитивную (аксиома 4) и негативную (аксиома 5) интроспекцию агента (т.е. наличие убеждений о своих убеждениях):
Непротиворечивость желаний и намерений выражается следующей парой так называемых D-аксиом:
Согласно теории речевых актов (Speech Act Theory) переговоры строятся с использованием небольшого числа примитивов, например, ASK, TELL, REJECT, REQUEST, COMMIT, NEGOTIATE. Процесс переговоров начинается тогда, когда агент посылает сообщение, содержащее его точку зрения (позицию, attitude) по некоторому вопросу. Посредством обмена сообщениями ASK, TELL, REJECT, REQUEST агенты могут обсуждать некоторую тему и приходить к общему решению. Во время переговоров агенты обновляют свои базы знаний и, тем самым, повышают свои способности отвечать на новые вопросы.