![](/user_photo/_userpic.png)
книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования
.pdfразветвления и продолжает просмотр новых вариантов. Про цесс продолжается до тех пор, пока не будет выбран удов летворительный вариант или не окажутся просмотренными все возможные. В последнем случае для выбора лучшего варианта используются запомненные показатели ценности. В качестве окончательного выбирается вариант, имеющий максимальный показатель ценности. Процесс выбора вариан та плана схематично показан на рис. 22.
Таким образом, результатом работы блока планирования является построение двухуровневого плана движения. Верх ний уровень плана указывает общее направление движения
Выполнить d, |
|
|
|
|
Htm |
|
|
|
|
Счетчик |
Рис. 22. Блок-схема процесса |
|||
этапов |
||||
построения |
вариантов |
плапа |
||
плана |
(ni, га2, |
т.2— номера |
вспо |
|
|
могательных ячеек памяти). |
7 з—П76
на заданном участке среды; нижний уровень «расшифровы вает» эту общую идею движения применительно к конкрет ным особенностям среды.
Каждый этап плана нижнего уровня представляет собой переход автомата из одной клетки второго уровня в другую. Для контроля за выполнением плана в автомате предусмот рено запоминание последовательности номеров этих клеток. При реальном передвижении автомата в среде специальная следящая система «по результатам» производит определение положения автомата на втором уровне внутренней модели среды и проверку соответствия этого положения запланиро ванному. Кроме контроля за результатами действий автомата производится также и контроль «эмоционального» соответ ствия реальных и запланированных действий. Это осуществ ляется следующим образом. Как говорилось ранее, при по строении плана автомат пользуется оценками различных клеток среды, сформированными в его эмоциональной сфе ре. Выбрав определенный план, автомат, на основе этих оценок, формирует последовательность ожидаемых «неприят ных» эмоциональных воздействий. При выполнении плана специальная система следит за тем, чтобы реальные «не приятные» воздействия не превышали ожидаемых. Такой постоянный контроль «по результатам» и «по чувствам» за выполнением намеченного плана позволяет автомату более гибко п адекватно реагировать на случайные отклонения от запланированного пути или несоответствие реальной среды той, которая была воспринята при стратегическом осмотре.
§ 5. Реализация М-автомата РЭМ
Из предыдущего описания автомата РЭМ видно, что его функционирование может быть естественным образом раз делено на два этапа. Первый— процесс построения плана двигательного поведения. Этот вид деятельности выполняет ся автоматом без непосредственных перемещений в среде и заканчивается формированием двухуровневого плана пе редвижения. Второй этап состоит в выполнении плана, т. е. в реальном передвижении в среде, и заканчивается в момент достижения цели или при обнаружении значительных откло нений от плана. В последнем случае, а также если достигну тая цель была только промежуточной и необходимо продол жить движение, автомат опять переходит к выполнению
первого этапа, затем второго и т. д., до момента |
достижения |
|
главной цели, заданной экспериментатором. |
|
|
Относительная самостоятельность |
функции |
М-автомата |
на каждом из этапов позволила нам |
реализовать автомат |
|
РЭМ в виде двух взаимодействующих |
моделей — планирова- |
ния и выполнения планов двигательного поведения. Необхо димость такой раздельной реализации была обусловлена ма лым объемом оперативной памяти той ЦВМ, которой мы могли пользоваться для машинного представления и экспе риментального исследования РЭМ а. Ниже мы еще вернемся к обсуждению преимуществ и недостатков, связанных с вы бранным способом реализации автомата, а пока остановимся кратко на особенностях конкретного представления основ ных функций переработки информации и поведения в обеих моделях.
Модель планирования РЭМ-1. РЭМ-1 — неполный М-ав- томат — реализован в виде двух последовательно работаю щих программ для ЦВМ М-220. Первая программа предна значена для построения оценочных Р-поверхностей. Исход ной информацией для нее служат сведения о расположении объектов в среде, «субъективной» оценке каждого из объек тов М-сетью РЭМа-2 и положении главной, заданной экспе риментатором цели. Программа выделяет в среде участок для стратегического осмотра, определяет, если это необхо димо, положение промежуточной цели и строит Р-поверх- ности, соответствующие различным уровням внутренней мо дели среды.
Как уже упоминалось, каждая клетка верхнего уровня внутренней модели среды является представителем упоря доченной (пространственно) совокупности клеток предыду щего уровня. При реализации автомата РЭМ-1 был зафик сирован размер участка среды, осматриваемого автоматом в режиме планирования, и положение автомата внутри этого участка. Принято, что автомат осматривает участок длиной в 27 и шириной в 12 клеток. При этом сам автомат распо ложен в средней клетке нижней границы участка. Таким образом, пижний уровень внутренней модели среды пред ставлен 324 г-моделями клеток. Общее количество формируе мых автоматом уровней внутренней модели среды ограни чено тремя. Все клетки одного уровня имеют одинаковые размеры, т. е. состоят из одинакового количества клеток предыдущего уровня. Зафиксировав способ пространствен ного объединения клеток каждого уровня, мы выделили 36 клеток второго уровня и 6 клеток третьего уровня внут ренней модели среды (см. рис. 20).
В принципе, стратегический осмотр и оценки различных объектов среды, необходимые для построения Р-поверхностей всех уровней, должны производиться автоматом РЭМ-2, а ре зультат осмотра должен передаваться программе построения Р-поверхностей вообще без участия экспериментатора. Одна ко, поскольку, в силу ряда технических ограничений, мы вынуждены были строить модели РЭМ-1 и РЭМ-2 в виде отдельных программ для ЦВМ, решено было использовать
Опредепение
координат
исходной
ячейки
Осмотр
среды
это обстоятельство для проведения дополнительных самосто ятельных экспериментальных исследований каждой из моде лей. В связи с этим было предусмотрено осуществление всех «контактов» между РЭМ-1 и РЭМ-2 через человекаэкспериментатора. Это позволило нам, во-первых, произвести отладку и настройку всех программ вне связи друг с дру гом (что весьма существенно при работе со сложными мо делями) и, во-вторых, достаточно подробно исследовать поведение моделей, делая упор на выявление и иллюстра цию специфических особенностей каждой из них в отдель ности.
Для обеспечения самостоятельного исследования моделей оказалось необходимым организовать дополнительную подго товку исходной для каждой модели информации. Так, на пример, для первой программы автомата РЭМ-1 — програм мы построения оценочных Р-поверхностей — необходимо за давать информацию не только о расположении объектов в среде, но и об оценке каждого типа объекта. Такие оценки могут быть предварительно сформированы автоматом РЭМ-2 пли заданы непосредственно экспериментатором.
Задание среды для программы построения оценочных Р-поверхностей производилось следующим образом. В каж дую клетку среды, содержащую определенный объект, зано сился не знак этого объекта (номер t-модели М-сети авто мата РЭМ-2), а некоторая условная величина, соответствую щая оценке данного объекта. Подбором соотношений оценок различных объектов задавался тип М-автомата.
Значительное влияние па вид Р-поверхпостей оказывает также задаваемая экспериментатором оценка клетки «цель» («сила цели»). Чем выше эта оценка, тем больше крутизна начальной Р-поверхности и, следовательно, выше вероят ность выбора автоматом таких этапов плана, которые про ходят через клетки, расположенные вдоль минимального маршрута — прямой, соединяющей клетки автомата и цели. Задавая различные «силы цели», можно проследить измене-
Определение |
Определение |
Построение |
|
координат |
положения |
начальной |
|
целевой |
участка |
|
|
Р-поверхности |
|
||
ячейки |
осмотра |
|
|
|
|
||
Построение |
Построение |
|
|
конечной |
Р-поверхнос |
|
|
Р-поверхности |
тей верхних |
Рис. 23. Блок-схема про |
|
нижнего |
уровней |
граммы |
построенвя оце |
уровня |
|
ночных |
поверхностей. |
ние планов поведения автомата. Представляет интерес так же сопоставление планов поведения автоматов различных типов при одинаковых «силах цели».
Блок-схема программы построения оценочных Р-поверх- ностей приведена на рис. 23. Программа написана для ЦВМ М-220 и содержит около 1100 команд. Время работы ЦВМ по данной программе составляет примерно полторы минуты.
В другой программе, реализующей РЭМ-1,— построение плана двигательного поведения — используются сформиро ванные конечные Р-поверхности и, кроме описанных ранее механизмов планирования, содержится также дополнитель ный алгоритм коррекции «К». Алгоритм производит такую коррекцию Р-поверхности второго уровня, которая облегчает автомату определение направления на цель. Как уже было описано выше, в процессе планирования автомат «мыслен но» переходит из одной клетки второго уровня внутренней модели среды в другую — соседнюю. Выбор направления «шага» зависит от величины оценки соответствующей клет ки. Для того чтобы на каждом этапе плана, т. е. после каж дого «мысленного шага», автомат не терял общего направле ния на цель, алгоритм «К» увеличивает оценку (на втором уровне внутренней модели) одной или двух соседних клеток из окрестности автомата, ближайших к клетке, содержащей цель. Таким образом, алгоритм «К» играет роль своеоб разного компаса. Коррекция при помощи алгоритма «К» представляет собой третий этап уточнения внутренней мо дели среды. Измененная в результате последовательных кор рекций Р-поверхность отражает уже не только оценки объек
тов среды и начальное взаимное расположение |
автомата |
и цели, но и учитывает потенциальное изменение |
положения |
автомата относительно цели в процессе последующего вы полнения плана.
Увеличение на каждом этапе плана оценок определенных клеток окрестности автомата следует понимать как компо нент «силы стремления» к цели или «установку» для ее до стижения. Изменяя величину корректирующих добавок, мож но проследить влияние этого параметра на процесс построе ния автоматом планов двигательного поведения.
Блок-схема программы построения планов поведения при ведена на рис. 24. Программа содержит около 1200 команд ЦВМ М-220. Время ее работы составляет одну—три мину ты и зависит от количества просматриваемых автоматом вариантов плана.
Модель передвижения РЭМ-2. РЭМ-2 представляет собой полный М-автомат, организующий целенаправленное двига тельное поведение. Процессы переработки информации, обес печивающие автомату адекватность реакций на различные
Выбор |
общеео |
направле |
|
ния |
движения |
по треть |
|
ему |
уровню внутренней _ |
||
модели |
среды |
|
Повышение возбуждения действий, соответствую щих общему направлению движения
Осмотр ячеек второго |
Приписать действиям воз- |
уровня внутренней подели |
Суждения, равные оценкам |
среды в окрестности авто |
соответствующих ячеек |
мата |
второго уровня |
X
Втор наи более воз Построение
бужденных варианта действий плана
йсриант
Подсчет
показателя
один ? ценности
Нет
Да |
Показатель |
Подсчет |
|
|
|
|
||||
Коней |
выше |
|
показателя |
|
|
|
||||
|
критерия > |
ценности |
|
|
|
|
||||
|
\Нет |
|
|
|
|
|
|
|
|
|
Осво |
Выполнить |
Возврат |
« Н е т |
|
|
|
||||
бодить |
d из п\ |
к этапу |
|
|
|
|||||
|
|
из тг |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
Да |
|
|
Осво |
Выполнить |
Возврат |
|
|
|
|
||||
бодить |
к этапу |
|
|
|
|
|||||
|
|
|
|
|
|
|||||
п, |
d из п, |
|
U3 |
/77, |
|
|
|
|
||
|
|
|
|
|
|
|
||||
|
|
Конец |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
UQ |
|
|
|
|
Возбудить |
|
Нет |
/ Показатель |
|
|
|
||||
центр НПр |
|
|
ч |
|
оыше критерия |
|
|
|||
|
Рис. 24. Блок-схема программы построения пла |
|
|
|||||||
|
нов. Обозначения те же, что и на рис. 22. |
|
|
|||||||
|
ситуации среды, |
|
осуществляются М-сетыо, содержащей |
|||||||
|
90 i-моделей и 400 |
связей. |
|
|
|
|
||||
|
Автомат реализован в виде программы для ЦВМ М-220. |
|||||||||
|
Программа допускает изменение количества i-моделей и |
|||||||||
|
связей |
М-сети |
автомата, |
причем |
максимальное |
количество |
||||
|
i-моделей не должно превышать 300, а максимальное коли |
|||||||||
|
чество |
связей — 1200. |
Все |
i-модели сети могут быть разде |
||||||
|
лены не более чем на 30 групп, каждая из которых может |
|||||||||
|
иметь |
отличные |
от |
остальных |
параметры |
характеристик |
||||
|
i-моделей. Введенные ограничения на максимальное коли |
|||||||||
|
чество |
элементов |
М-сети |
обусловлены объемом |
памяти и |
|||||
198 |
степенью быстродействия используемой ЦВМ |
М-220. |
Как уже отмечалось, в автомате РЭМ не реализованы функции обучения и самоорганизации. Конкретно это выра жается в том, что в процессе функционирования автомата проходимости связей и характеристики i-моделей его М-сети не изменяются.
Для удобства предварительной организации и настройки М-сети автомата принято, что каждая связь может быть либо усиливающей, либо тормозной. Величина проходимости связи выбирается в диапазоне от 0 до 1. Задание вида (тор мозного или усиливающего), а также конкретной величины проходимости той или иной связи производилось в основном эвристически. Аналогично задавались и параметры харак теристик i-моделей. В дальнейшем, при настройке автомата, осуществлялась необходимая коррекция — изменение проходимостей отдельных связей, изменение «знака», т. е. уста новление усиливающей связи взамен тормозной или наобо рот, а также изменение значений параметров характеристик i-моделей.
Вид характеристик i-моделей был задан в соответствии с представлениями исходной гипотезы. Конкретно для реали зации каждой из характеристик i-моделей выбраны следую щие функции.
1. Характеристика |
торможения: |
|
K\ = K a i - K ^ (П]-1 |
• Ду), |
(6.3) |
где К.\ — текущее значение коэффициента возбудимости i-й i-модели; KKi — начальное значение коэффициента возбуди мости i-й i-модели; т — количество тормозных связей, под ходящих к i-й i-модели; П/— 1 — возбужденность i-моделей, имеющих связи, направленные к i-й i-модели; Ru—прохо димость тормозных связей, подходящих к i-й i-модели; К — коэффициент пропорциональности.
2. Характеристика затухания:
Ш = 1ГГ1 • а, |
|
|
|
(6.4) |
||
где |
а — коэффициент |
затухания возбужденности |
i-й |
г-моде- |
||
ли, О =£Г а ^ |
1. |
|
|
|
|
|
3. Характеристика |
возбуждения: |
|
|
|
||
U\ = |
KHi-ln |
2 ( П ] _ 1 . Л « ) , |
|
|
(6.5) |
|
|
|
5=m+1 |
|
|
|
|
где |
п — общее количество связей, подходящих |
к |
i-й |
i-моде- |
||
лп; |
Rij — проходимости усиливающих связей, |
подходящих |
к i-й i-модели.
Характеристики гипертрофии и адаптации для i-моделей М-сети автомата РЭМ не задавались.
Передача возбуждения в М-сети осуществляется в соот ветствии со следующим правилом:
п , = | |
х |
при |
х > |
у, |
|
|
|
( 6 6 ) |
\ |
у |
при |
х < |
у, |
|
|
|
|
где |
|
|
|
|
|
|
|
|
(\ |
|
|
|
t-i |
|
|
(-1 |
|
|
ка1 — к 2 (nj |
in 2 |
|
|
||||
|
(Щ |
|
||||||
X = |
|
|
|
|
при |
2 |
(-1 |
д « ) > е , , |
|
|
|
|
(ГГ) |
||||
|
|
|
|
о |
при |
i |
ОНi—1 |
|
т' - 1
у= ПГ - • а;
®i — порог возбуждения i-й i-модели.
Таким образом, в каждый момент времени возбужден ность i-модели определяется либо внешними активными и тормозными воздействиями (П< = х), либо собственным воз
|
буждением в предыдущий момент (П$ = |
у). |
|
|||||
|
В каждый момент времени СУТ производит выбор наи |
|||||||
|
более возбужденных i-моделей сети, для которых выполня |
|||||||
|
ется условие |
|
|
|
|
|
|
|
|
П4 = |
П ш а х - Z, |
|
|
|
|
|
(6.7) |
|
где П{ — возбужденность |
i-й |
i-модели; |
П т 0 ж — возбужден |
||||
|
ность наиболее возбужденной |
i-модели сети; Z — допустимая |
||||||
|
разность возбуждений для выделяемых СУТ i-моделей. |
|||||||
|
Возбуждения выделенных СУТ i-моделей изменяются |
|||||||
|
следующим образом: |
|
|
|
|
|
|
|
|
|
П. |
|
|
|
|
|
(6.8) |
|
|
|
|
|
|
|
|
|
|
где |
Uj — возбужденность |
/-й |
i-модели |
после ее |
выделения |
||
|
СУТ; П" —начальная возбужденность |
/-й i-модели; П 5 — |
||||||
|
суммарное для всей группы выделенных i-моделей дополни |
|||||||
|
тельное возбуждение; К |
|
(К ^ |
М) — количество |
выделенных |
|||
|
СУТ i-моделей (М — максимальная величина группы выде |
|||||||
|
ляемых СУТ i-моделей; М задается экспериментатором и |
|||||||
|
определяет максимальный «объем внимания»). |
|
||||||
|
Если в момент t /-я |
i-модель |
выделена СУТ, то в момент |
|||||
|
t + |
1 ее возбужденность |
|
|
|
|
|
|
|
n j + 1 |
= U] • h, |
|
|
|
|
|
(6.9) |
|
где |
h — коэффициент |
затухания возбуждения |
выделенных |
||||
200 |
СУТ i-моделей, 0 < h < |
1, h < |
а. |
|
|
Затухание возбуждения г'-й f-модели по зависимости (6.9) происходит до тех пор, пока в какой-то момент времени она не окажется вне выделенной СУТ группы i-моделей. После этого изменение ее возбуждения подчиняется общему пра вилу пересчета (6.6), принятому для М-сети автомата РЭМ.
Блок-схема программы, реализующей автомат РЭМ-2, приведена на рис. 25. Программа содержит около 1200 ко манд. Время ее работы зависит от количества элементов (г-моделей и связей) М-сети и количества тактов (моментов дискретного времени) функционирования автомата. Для М-сети, содержащей 90 i-моделей и 400 связей, один такт работы, т. е. один пересчет, занимает примерно полторы минуты машинного времени ЦВМ М-220.
При передвижении в среде РЭМ-2 пользуется планом, сформированным для этой же среды автоматом РЭМ-1. Если план оказывается неудачным и РЭМ-2 не в состоянии его выполнить, т. е. при рассогласовании «по чувствам» или «по результатам» плана и реального передвижения автомата, то возникает необходимость в построении нового плана, учи тывающего изменившееся «эмоциональное» состояние авто мата РЭМ-2. В этом случае РЭМ-2 формирует новые оценки объектов среды и новые критерии оценки плана поведения, которые и служат исходной информацией для работы авто мата РЭМ-1. РЭМ-1 формирует новый план, передает его РЭМу-'З и т. д. Таким образом происходит взаимодействие автоматов. Посредником при этом является человек-экспери ментатор, функции которого весьма ограничены и состоят в основном в периодической замене определенных перфо-
Блок
осмотра ситуации |
|
Блок босприятия |
|
Блок переработки |
|
информации |
|
Блок СУТ |
|
'Условия* |
Рис. 25. Блок-схема програм |
действия |
|
.выполнены^ |
мы, реализующей М-автомат |
|
РЭМ-2. |
карт и вводе соответствующей программы в вычислительную машину. Несмотря на очевидную возможность автоматиза ции таких функций, т. е. передачи их самой машине, мы предпочли все же не объединять модели РЭМ-1 и РЭМ-2 в одну комплексную модель. Из сопоставления затрат ма шинного времени на просчет каждой из программ, состав ляющих автомат РЭМ, видно, что все построение плана за нимает примерно столько же времени, сколько один такт работы М-сети автомата РЭМ-2. Если к тому же учесть, что для анализа процессов в М-сети необходимо хотя бы 15— 20 тактов ее работы, становится понятным наше стремление сделать каждую нз моделей как можно более самостоятель ной. В противном "случае вряд ли можно было бы надеяться на достаточно полное исследование модели планирования. Что же касается модели выполнения плана, т. е. РЭМа-2, то отсутствие непосредственной связи с РЭМом-1, в прин ципе, может отразиться на его работе только при нарушении плана. Поэтому мы выбрали такую схему исследования РЭМа-2, в которой нарушение плана поведения либо вообще не требовало дальнейшего продолжения эксперимента, либо требовало коррекции М-сети РЭМа-2, а не перестройки плана.
Не следует, однако, считать, что мы полностью отказа лись от исследования взаимодействия автоматов РЭМ-1 и РЭМ-2. Напротив, такое исследование составляло одну из важных задач нашей работы, поскольку необходимо было проверить целесообразность построения неполных М-автома тов. Однако такую проверку решено было сделать заключи тельным этапом экспериментального исследования автомата РЭМ.
Тактическая схема наших исследований состояла в сле дующем. На первом этапе необходимо было рассмотреть вли яние на процесс построения плана таких параметров, как оценка объектов среды, «сила цели» и взаимное расположе ние автомата и цели в среде. Кроме того, следовало выяс нить влияние различных параметров на количество просмат риваемых автоматом вариантов плана поведения.
На втором этапе предполагалось выбрать один из наи более характерных планов для данной среды и настроить автомат таким образом, чтобы выполнение этого плана не вызывало резких положительных или отрицательных «эмо циональных» реакций автомата. Впоследствии изменением структуры и параметров М-сети автомата мы надеялись про демонстрировать влияние предварительной организации на характер генерируемого автоматом поведения. Кроме того, необходимо было исследовать влияние ряда параметров М-сети и СУТ на процесс формирования внешних и внут ренних реакций автомата.