Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования

.pdf
Скачиваний:
13
Добавлен:
25.10.2023
Размер:
17.04 Mб
Скачать

разветвления и продолжает просмотр новых вариантов. Про­ цесс продолжается до тех пор, пока не будет выбран удов­ летворительный вариант или не окажутся просмотренными все возможные. В последнем случае для выбора лучшего варианта используются запомненные показатели ценности. В качестве окончательного выбирается вариант, имеющий максимальный показатель ценности. Процесс выбора вариан­ та плана схематично показан на рис. 22.

Таким образом, результатом работы блока планирования является построение двухуровневого плана движения. Верх­ ний уровень плана указывает общее направление движения

Выполнить d,

 

 

 

Htm

 

 

 

Счетчик

Рис. 22. Блок-схема процесса

этапов

построения

вариантов

плапа

плана

(ni, га2,

т.2— номера

вспо­

 

могательных ячеек памяти).

7 з—П76

на заданном участке среды; нижний уровень «расшифровы­ вает» эту общую идею движения применительно к конкрет­ ным особенностям среды.

Каждый этап плана нижнего уровня представляет собой переход автомата из одной клетки второго уровня в другую. Для контроля за выполнением плана в автомате предусмот­ рено запоминание последовательности номеров этих клеток. При реальном передвижении автомата в среде специальная следящая система «по результатам» производит определение положения автомата на втором уровне внутренней модели среды и проверку соответствия этого положения запланиро­ ванному. Кроме контроля за результатами действий автомата производится также и контроль «эмоционального» соответ­ ствия реальных и запланированных действий. Это осуществ­ ляется следующим образом. Как говорилось ранее, при по­ строении плана автомат пользуется оценками различных клеток среды, сформированными в его эмоциональной сфе­ ре. Выбрав определенный план, автомат, на основе этих оценок, формирует последовательность ожидаемых «неприят­ ных» эмоциональных воздействий. При выполнении плана специальная система следит за тем, чтобы реальные «не­ приятные» воздействия не превышали ожидаемых. Такой постоянный контроль «по результатам» и «по чувствам» за выполнением намеченного плана позволяет автомату более гибко п адекватно реагировать на случайные отклонения от запланированного пути или несоответствие реальной среды той, которая была воспринята при стратегическом осмотре.

§ 5. Реализация М-автомата РЭМ

Из предыдущего описания автомата РЭМ видно, что его функционирование может быть естественным образом раз­ делено на два этапа. Первый— процесс построения плана двигательного поведения. Этот вид деятельности выполняет­ ся автоматом без непосредственных перемещений в среде и заканчивается формированием двухуровневого плана пе­ редвижения. Второй этап состоит в выполнении плана, т. е. в реальном передвижении в среде, и заканчивается в момент достижения цели или при обнаружении значительных откло­ нений от плана. В последнем случае, а также если достигну­ тая цель была только промежуточной и необходимо продол­ жить движение, автомат опять переходит к выполнению

первого этапа, затем второго и т. д., до момента

достижения

главной цели, заданной экспериментатором.

 

Относительная самостоятельность

функции

М-автомата

на каждом из этапов позволила нам

реализовать автомат

РЭМ в виде двух взаимодействующих

моделей — планирова-

ния и выполнения планов двигательного поведения. Необхо­ димость такой раздельной реализации была обусловлена ма­ лым объемом оперативной памяти той ЦВМ, которой мы могли пользоваться для машинного представления и экспе­ риментального исследования РЭМ а. Ниже мы еще вернемся к обсуждению преимуществ и недостатков, связанных с вы­ бранным способом реализации автомата, а пока остановимся кратко на особенностях конкретного представления основ­ ных функций переработки информации и поведения в обеих моделях.

Модель планирования РЭМ-1. РЭМ-1 — неполный М-ав- томат — реализован в виде двух последовательно работаю­ щих программ для ЦВМ М-220. Первая программа предна­ значена для построения оценочных Р-поверхностей. Исход­ ной информацией для нее служат сведения о расположении объектов в среде, «субъективной» оценке каждого из объек­ тов М-сетью РЭМа-2 и положении главной, заданной экспе­ риментатором цели. Программа выделяет в среде участок для стратегического осмотра, определяет, если это необхо­ димо, положение промежуточной цели и строит Р-поверх- ности, соответствующие различным уровням внутренней мо­ дели среды.

Как уже упоминалось, каждая клетка верхнего уровня внутренней модели среды является представителем упоря­ доченной (пространственно) совокупности клеток предыду­ щего уровня. При реализации автомата РЭМ-1 был зафик­ сирован размер участка среды, осматриваемого автоматом в режиме планирования, и положение автомата внутри этого участка. Принято, что автомат осматривает участок длиной в 27 и шириной в 12 клеток. При этом сам автомат распо­ ложен в средней клетке нижней границы участка. Таким образом, пижний уровень внутренней модели среды пред­ ставлен 324 г-моделями клеток. Общее количество формируе­ мых автоматом уровней внутренней модели среды ограни­ чено тремя. Все клетки одного уровня имеют одинаковые размеры, т. е. состоят из одинакового количества клеток предыдущего уровня. Зафиксировав способ пространствен­ ного объединения клеток каждого уровня, мы выделили 36 клеток второго уровня и 6 клеток третьего уровня внут­ ренней модели среды (см. рис. 20).

В принципе, стратегический осмотр и оценки различных объектов среды, необходимые для построения Р-поверхностей всех уровней, должны производиться автоматом РЭМ-2, а ре­ зультат осмотра должен передаваться программе построения Р-поверхностей вообще без участия экспериментатора. Одна­ ко, поскольку, в силу ряда технических ограничений, мы вынуждены были строить модели РЭМ-1 и РЭМ-2 в виде отдельных программ для ЦВМ, решено было использовать

Опредепение

координат

исходной

ячейки

Осмотр

среды

это обстоятельство для проведения дополнительных самосто­ ятельных экспериментальных исследований каждой из моде­ лей. В связи с этим было предусмотрено осуществление всех «контактов» между РЭМ-1 и РЭМ-2 через человекаэкспериментатора. Это позволило нам, во-первых, произвести отладку и настройку всех программ вне связи друг с дру­ гом (что весьма существенно при работе со сложными мо­ делями) и, во-вторых, достаточно подробно исследовать поведение моделей, делая упор на выявление и иллюстра­ цию специфических особенностей каждой из них в отдель­ ности.

Для обеспечения самостоятельного исследования моделей оказалось необходимым организовать дополнительную подго­ товку исходной для каждой модели информации. Так, на­ пример, для первой программы автомата РЭМ-1 — програм­ мы построения оценочных Р-поверхностей — необходимо за­ давать информацию не только о расположении объектов в среде, но и об оценке каждого типа объекта. Такие оценки могут быть предварительно сформированы автоматом РЭМ-2 пли заданы непосредственно экспериментатором.

Задание среды для программы построения оценочных Р-поверхностей производилось следующим образом. В каж­ дую клетку среды, содержащую определенный объект, зано­ сился не знак этого объекта (номер t-модели М-сети авто­ мата РЭМ-2), а некоторая условная величина, соответствую­ щая оценке данного объекта. Подбором соотношений оценок различных объектов задавался тип М-автомата.

Значительное влияние па вид Р-поверхпостей оказывает также задаваемая экспериментатором оценка клетки «цель» («сила цели»). Чем выше эта оценка, тем больше крутизна начальной Р-поверхности и, следовательно, выше вероят­ ность выбора автоматом таких этапов плана, которые про­ ходят через клетки, расположенные вдоль минимального маршрута — прямой, соединяющей клетки автомата и цели. Задавая различные «силы цели», можно проследить измене-

Определение

Определение

Построение

 

координат

положения

начальной

 

целевой

участка

 

Р-поверхности

 

ячейки

осмотра

 

 

 

Построение

Построение

 

 

конечной

Р-поверхнос­

 

 

Р-поверхности

тей верхних

Рис. 23. Блок-схема про­

нижнего

уровней

граммы

построенвя оце­

уровня

 

ночных

поверхностей.

ние планов поведения автомата. Представляет интерес так­ же сопоставление планов поведения автоматов различных типов при одинаковых «силах цели».

Блок-схема программы построения оценочных Р-поверх- ностей приведена на рис. 23. Программа написана для ЦВМ М-220 и содержит около 1100 команд. Время работы ЦВМ по данной программе составляет примерно полторы минуты.

В другой программе, реализующей РЭМ-1,— построение плана двигательного поведения — используются сформиро­ ванные конечные Р-поверхности и, кроме описанных ранее механизмов планирования, содержится также дополнитель­ ный алгоритм коррекции «К». Алгоритм производит такую коррекцию Р-поверхности второго уровня, которая облегчает автомату определение направления на цель. Как уже было описано выше, в процессе планирования автомат «мыслен­ но» переходит из одной клетки второго уровня внутренней модели среды в другую — соседнюю. Выбор направления «шага» зависит от величины оценки соответствующей клет­ ки. Для того чтобы на каждом этапе плана, т. е. после каж­ дого «мысленного шага», автомат не терял общего направле­ ния на цель, алгоритм «К» увеличивает оценку (на втором уровне внутренней модели) одной или двух соседних клеток из окрестности автомата, ближайших к клетке, содержащей цель. Таким образом, алгоритм «К» играет роль своеоб­ разного компаса. Коррекция при помощи алгоритма «К» представляет собой третий этап уточнения внутренней мо­ дели среды. Измененная в результате последовательных кор­ рекций Р-поверхность отражает уже не только оценки объек­

тов среды и начальное взаимное расположение

автомата

и цели, но и учитывает потенциальное изменение

положения

автомата относительно цели в процессе последующего вы­ полнения плана.

Увеличение на каждом этапе плана оценок определенных клеток окрестности автомата следует понимать как компо­ нент «силы стремления» к цели или «установку» для ее до­ стижения. Изменяя величину корректирующих добавок, мож­ но проследить влияние этого параметра на процесс построе­ ния автоматом планов двигательного поведения.

Блок-схема программы построения планов поведения при­ ведена на рис. 24. Программа содержит около 1200 команд ЦВМ М-220. Время ее работы составляет одну—три мину­ ты и зависит от количества просматриваемых автоматом вариантов плана.

Модель передвижения РЭМ-2. РЭМ-2 представляет собой полный М-автомат, организующий целенаправленное двига­ тельное поведение. Процессы переработки информации, обес­ печивающие автомату адекватность реакций на различные

Выбор

общеео

направле­

ния

движения

по треть­

ему

уровню внутренней _

модели

среды

 

Повышение возбуждения действий, соответствую­ щих общему направлению движения

Осмотр ячеек второго

Приписать действиям воз-

уровня внутренней подели

Суждения, равные оценкам

среды в окрестности авто­

соответствующих ячеек

мата

второго уровня

X

Втор наи­ более воз­ Построение

бужденных варианта действий плана

йсриант

Подсчет

показателя

один ? ценности

Нет

Да

Показатель

Подсчет

 

 

 

 

Коней

выше

 

показателя

 

 

 

 

критерия >

ценности

 

 

 

 

 

\Нет

 

 

 

 

 

 

 

 

Осво­

Выполнить

Возврат

« Н е т

 

 

 

бодить

d из п\

к этапу

 

 

 

 

 

из тг

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Да

 

 

Осво­

Выполнить

Возврат

 

 

 

 

бодить

к этапу

 

 

 

 

 

 

 

 

 

 

п,

d из п,

 

U3

/77,

 

 

 

 

 

 

 

 

 

 

 

 

 

Конец

 

 

 

 

 

 

 

 

 

 

 

 

 

 

UQ

 

 

 

Возбудить

 

Нет

/ Показатель

 

 

 

центр НПр

 

 

ч

 

оыше критерия

 

 

 

Рис. 24. Блок-схема программы построения пла­

 

 

 

нов. Обозначения те же, что и на рис. 22.

 

 

 

ситуации среды,

 

осуществляются М-сетыо, содержащей

 

90 i-моделей и 400

связей.

 

 

 

 

 

Автомат реализован в виде программы для ЦВМ М-220.

 

Программа допускает изменение количества i-моделей и

 

связей

М-сети

автомата,

причем

максимальное

количество

 

i-моделей не должно превышать 300, а максимальное коли­

 

чество

связей — 1200.

Все

i-модели сети могут быть разде­

 

лены не более чем на 30 групп, каждая из которых может

 

иметь

отличные

от

остальных

параметры

характеристик

 

i-моделей. Введенные ограничения на максимальное коли­

 

чество

элементов

М-сети

обусловлены объемом

памяти и

198

степенью быстродействия используемой ЦВМ

М-220.

Как уже отмечалось, в автомате РЭМ не реализованы функции обучения и самоорганизации. Конкретно это выра­ жается в том, что в процессе функционирования автомата проходимости связей и характеристики i-моделей его М-сети не изменяются.

Для удобства предварительной организации и настройки М-сети автомата принято, что каждая связь может быть либо усиливающей, либо тормозной. Величина проходимости связи выбирается в диапазоне от 0 до 1. Задание вида (тор­ мозного или усиливающего), а также конкретной величины проходимости той или иной связи производилось в основном эвристически. Аналогично задавались и параметры харак­ теристик i-моделей. В дальнейшем, при настройке автомата, осуществлялась необходимая коррекция — изменение проходимостей отдельных связей, изменение «знака», т. е. уста­ новление усиливающей связи взамен тормозной или наобо­ рот, а также изменение значений параметров характеристик i-моделей.

Вид характеристик i-моделей был задан в соответствии с представлениями исходной гипотезы. Конкретно для реали­ зации каждой из характеристик i-моделей выбраны следую­ щие функции.

1. Характеристика

торможения:

 

K\ = K a i - K ^ (П]-1

• Ду),

(6.3)

где К.\ — текущее значение коэффициента возбудимости i-й i-модели; KKi — начальное значение коэффициента возбуди­ мости i-й i-модели; т — количество тормозных связей, под­ ходящих к i-й i-модели; П/— 1 — возбужденность i-моделей, имеющих связи, направленные к i-й i-модели; Ru—прохо­ димость тормозных связей, подходящих к i-й i-модели; К — коэффициент пропорциональности.

2. Характеристика затухания:

Ш = 1ГГ1 • а,

 

 

 

(6.4)

где

а — коэффициент

затухания возбужденности

i-й

г-моде-

ли, О =£Г а ^

1.

 

 

 

 

3. Характеристика

возбуждения:

 

 

 

U\ =

KHi-ln

2 ( П ] _ 1 . Л « ) ,

 

 

(6.5)

 

 

5=m+1

 

 

 

 

где

п — общее количество связей, подходящих

к

i-й

i-моде-

лп;

Rij — проходимости усиливающих связей,

подходящих

к i-й i-модели.

Характеристики гипертрофии и адаптации для i-моделей М-сети автомата РЭМ не задавались.

Передача возбуждения в М-сети осуществляется в соот­ ветствии со следующим правилом:

п , = |

х

при

х >

у,

 

 

 

( 6 6 )

\

у

при

х <

у,

 

 

 

 

где

 

 

 

 

 

 

 

 

(\

 

 

 

t-i

 

 

(-1

 

 

ка1 — к 2 (nj

in 2

 

 

 

 

X =

 

 

 

 

при

2

(-1

д « ) > е , ,

 

 

 

 

(ГГ)

 

 

 

 

о

при

i

ОНi—1

 

т' - 1

у= ПГ - • а;

®i — порог возбуждения i-й i-модели.

Таким образом, в каждый момент времени возбужден­ ность i-модели определяется либо внешними активными и тормозными воздействиями (П< = х), либо собственным воз­

 

буждением в предыдущий момент (П$ =

у).

 

 

В каждый момент времени СУТ производит выбор наи­

 

более возбужденных i-моделей сети, для которых выполня­

 

ется условие

 

 

 

 

 

 

 

П4 =

П ш а х - Z,

 

 

 

 

 

(6.7)

 

где П{ — возбужденность

i-й

i-модели;

П т 0 ж — возбужден­

 

ность наиболее возбужденной

i-модели сети; Z — допустимая

 

разность возбуждений для выделяемых СУТ i-моделей.

 

Возбуждения выделенных СУТ i-моделей изменяются

 

следующим образом:

 

 

 

 

 

 

 

 

П.

 

 

 

 

 

(6.8)

 

 

 

 

 

 

 

 

 

где

Uj — возбужденность

/-й

i-модели

после ее

выделения

 

СУТ; П" —начальная возбужденность

/-й i-модели; П 5

 

суммарное для всей группы выделенных i-моделей дополни­

 

тельное возбуждение; К

 

(К ^

М) — количество

выделенных

 

СУТ i-моделей — максимальная величина группы выде­

 

ляемых СУТ i-моделей; М задается экспериментатором и

 

определяет максимальный «объем внимания»).

 

 

Если в момент t /-я

i-модель

выделена СУТ, то в момент

 

t +

1 ее возбужденность

 

 

 

 

 

 

n j + 1

= U] • h,

 

 

 

 

 

(6.9)

 

где

h — коэффициент

затухания возбуждения

выделенных

200

СУТ i-моделей, 0 < h <

1, h <

а.

 

 

Затухание возбуждения г'-й f-модели по зависимости (6.9) происходит до тех пор, пока в какой-то момент времени она не окажется вне выделенной СУТ группы i-моделей. После этого изменение ее возбуждения подчиняется общему пра­ вилу пересчета (6.6), принятому для М-сети автомата РЭМ.

Блок-схема программы, реализующей автомат РЭМ-2, приведена на рис. 25. Программа содержит около 1200 ко­ манд. Время ее работы зависит от количества элементов (г-моделей и связей) М-сети и количества тактов (моментов дискретного времени) функционирования автомата. Для М-сети, содержащей 90 i-моделей и 400 связей, один такт работы, т. е. один пересчет, занимает примерно полторы минуты машинного времени ЦВМ М-220.

При передвижении в среде РЭМ-2 пользуется планом, сформированным для этой же среды автоматом РЭМ-1. Если план оказывается неудачным и РЭМ-2 не в состоянии его выполнить, т. е. при рассогласовании «по чувствам» или «по результатам» плана и реального передвижения автомата, то возникает необходимость в построении нового плана, учи­ тывающего изменившееся «эмоциональное» состояние авто­ мата РЭМ-2. В этом случае РЭМ-2 формирует новые оценки объектов среды и новые критерии оценки плана поведения, которые и служат исходной информацией для работы авто­ мата РЭМ-1. РЭМ-1 формирует новый план, передает его РЭМу-'З и т. д. Таким образом происходит взаимодействие автоматов. Посредником при этом является человек-экспери­ ментатор, функции которого весьма ограничены и состоят в основном в периодической замене определенных перфо-

Блок

осмотра ситуации

 

Блок босприятия

 

Блок переработки

 

информации

 

Блок СУТ

 

'Условия*

Рис. 25. Блок-схема програм­

действия

.выполнены^

мы, реализующей М-автомат

 

РЭМ-2.

карт и вводе соответствующей программы в вычислительную машину. Несмотря на очевидную возможность автоматиза­ ции таких функций, т. е. передачи их самой машине, мы предпочли все же не объединять модели РЭМ-1 и РЭМ-2 в одну комплексную модель. Из сопоставления затрат ма­ шинного времени на просчет каждой из программ, состав­ ляющих автомат РЭМ, видно, что все построение плана за­ нимает примерно столько же времени, сколько один такт работы М-сети автомата РЭМ-2. Если к тому же учесть, что для анализа процессов в М-сети необходимо хотя бы 15— 20 тактов ее работы, становится понятным наше стремление сделать каждую нз моделей как можно более самостоятель­ ной. В противном "случае вряд ли можно было бы надеяться на достаточно полное исследование модели планирования. Что же касается модели выполнения плана, т. е. РЭМа-2, то отсутствие непосредственной связи с РЭМом-1, в прин­ ципе, может отразиться на его работе только при нарушении плана. Поэтому мы выбрали такую схему исследования РЭМа-2, в которой нарушение плана поведения либо вообще не требовало дальнейшего продолжения эксперимента, либо требовало коррекции М-сети РЭМа-2, а не перестройки плана.

Не следует, однако, считать, что мы полностью отказа­ лись от исследования взаимодействия автоматов РЭМ-1 и РЭМ-2. Напротив, такое исследование составляло одну из важных задач нашей работы, поскольку необходимо было проверить целесообразность построения неполных М-автома­ тов. Однако такую проверку решено было сделать заключи­ тельным этапом экспериментального исследования автомата РЭМ.

Тактическая схема наших исследований состояла в сле­ дующем. На первом этапе необходимо было рассмотреть вли­ яние на процесс построения плана таких параметров, как оценка объектов среды, «сила цели» и взаимное расположе­ ние автомата и цели в среде. Кроме того, следовало выяс­ нить влияние различных параметров на количество просмат­ риваемых автоматом вариантов плана поведения.

На втором этапе предполагалось выбрать один из наи­ более характерных планов для данной среды и настроить автомат таким образом, чтобы выполнение этого плана не вызывало резких положительных или отрицательных «эмо­ циональных» реакций автомата. Впоследствии изменением структуры и параметров М-сети автомата мы надеялись про­ демонстрировать влияние предварительной организации на характер генерируемого автоматом поведения. Кроме того, необходимо было исследовать влияние ряда параметров М-сети и СУТ на процесс формирования внешних и внут­ ренних реакций автомата.

Соседние файлы в папке книги из ГПНТБ