![](/user_photo/_userpic.png)
книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования
.pdfИ, наконец, на третьем этапе было решено проверить согласованность работы моделей планирования и выполне ния плана и провести комплексное исследование автомата РЭМ.
Глава 7
ЭКСПЕРИМЕНТЫ С М-АВТОМАТОМ
РЭМ
§ 1 . |
Экспериментальное |
исследование |
|
М-автомата |
РЭМ-1 |
|
|
^ а |
э т о м э т а п е |
исследовалось |
влияние некоторых парамет |
ров, определяющих тин автомата, т. е. его отношение к объ ектам среды, на построение планов двигательного поведе ния. Рассматривалось поведение автоматов T l , Т2 и ТЗ, имеющих различные соотношения оценок объектов среды. Автоматы функционировали в среде, содержащей три типа объектов—«положительные» (Р1), «сильно отрицательные» (Р2) и «слабо отрицательные» (РЗ) (рис. 26). Задание типа автомата производилось подбором соотношений оценок объ ектов среды (табл. 2).
Поскольку планирование поведения осуществлялось ав томатом для достижения цели, представляло интерес иссле довать влияние «силы цели» на выбор плана передвижения в среде. Силы цели задавались в диапазоне от 10 до 100 усл. ед. Исследование проводилось в двух режимах: 1) достиже ние определенной клетки среды, расположенной внутри ос матриваемого автоматом участка; 2) построение плана до стижения клетки, расположенной вне осматриваемого участ ка. Во втором случае выбор клетки «подцель» производился автоматом и, как показали эксперименты, зависел от его типа и «силы» главной цели. На рис. 27 показан пример изменения положения клетки «подцель» и планы, построен
ные автоматом |
ТЗ при силах |
главной цели Ai — 10, Az = |
— 30, А3 = 50 |
(при А = 70 |
и А = 90 положение подцели |
••
• |
X |
о |
• •
аX
• |
• |
• |
X |
|
X |
X |
• |
а |
• |
в в X в в а а |
• |
D • а |
|
|
|||
• |
X а |
|
X "а а а а • а |
в а X а в |
• |
|
|
Рис. |
26. |
Среда |
ав |
|
• |
|
|
томата РЭМ-1 |
( • — |
|||
а • |
• |
|
объект |
PI, |
X — о б ъ |
||
А |
|
• |
ект |
Р2, |
• |
— объект |
|
|
РЗ). |
|
|
|
|
||
|
|
|
|
|
|
|
Т а б л и ц а |
2 |
|
|
|
Оценка объектов среды, усл. ев. |
||
Тип |
|
|
|
автомата |
Р1 |
Р2 |
РЗ |
|
|||
Т1 |
35 |
—50 |
—15 |
Т2 |
35 |
—35 |
—10 |
ТЗ |
35 |
—20 |
— 5 |
совпадало с выбранным прп А = 50, поскольку эта клетка расположена на прямой, соединяющей исходную клетку ав томата и цель).
Влияние типа автомата на выбор плана. Примеры планов, построенных автоматами с различными соотношениями оце нок объектов среды при одинаковой силе цели А = 90, по казаны на рис. 28 (планы построены для случая, когда глав ная цель находится вне осматриваемого участка). Как вид
но из рпсунка, автоматы T l , Т2 и ТЗ выбрали |
в качестве |
подцели различные клетки. Подцель, выбранная |
автоматом |
ТЗ, расположена на прямой, соединяющей исходную клетку автомата я главную цель. Подцелп автоматов Т2 и Т1 не сколько удалены от нее. Выбранные автоматами планы так же значительно отличаются друг от друга. Если планы ав томатов ТЗ и Т2 проходят через участки среды, содержащие объекты Р2 и РЗ, то автомат Т1 «избегает» отрицательных раздражителей и учитывает только расположение объектов Р1 . Участки среды, содержащие объекты РЗ и, тем более, Р2, автомат Т1 «старается обходить». Соответственно план его передвижения значительно длиннее планов, построенных автоматами Т2 и ТЗ. В этой связи необходимо еще раз под черкнуть, что единственным различием между автоматами было «индивидуальное» задание исходной информации о сре де, выраженное в различных оценках объектов среды (см. табл. 2). Поскольку объекты Р1 для всех трех типов авто матов оценивались одинаково, можно предположить, что по ведение последних определялось в основном наличием в сре де объекта Р2 («сильно отрицательного»). Можно говорить, что в этом отношении автомат ТЗ проявил наиболее «реши тельный» характер, а автомат Т1 — наиболее «осторожный».
|
|
9 |
\ |
|
|
|
|
ч |
V |
|
|
|
|
||
ч |
• |
Рис. 27. |
Планы |
поведения, |
|||
|
|||||||
|
\ |
|
\ V |
построенные автоматом ТЗ |
|||
|
|
|
(режим |
2) при |
различных |
||
|
|
|
|
«силах |
цели». |
|
Представляет также интерес сопоставление планов пове дения автоматов T l , Т2 и ТЗ, построенных ими в режиме 1 (цель находится внутри осматриваемого участка). Пример планов для силы цели А = 30 приведен на рис. 29. Видно, что автомат ТЗ и в этом случае строит наиболее короткий план достижения цели.
Влияние «силы цели». Эксперименты показали, что выби раемые автоматами планы передвижения в среде существен но зависят от «силы цели». С увеличением последней авто маты всех типов «стремятся» сократить путь. Пример изме
нения |
плана (в режиме 1) |
автоматом Т1 показан на рис. |
30 |
|||
для At |
= |
10, А2 = 30, Аз = |
70 и Ак = 90. Если при А |
= |
10 |
|
план автомата |
состоял из 11 этапов и предусматривал обход |
|||||
участка |
среды |
с объектами |
Р2 и РЗ, то при А = 90 он |
ока |
||
зался |
сокращенным до четырех этапов и проходит |
через |
/ к
\
77/ •
—
\
/
А,
* |
|
Ч |
\ |
I |
|
|
|
* |
|
|
/ |
1 |
Т2 / |
|
п |
\ |
|
\
А
ТЗ // 77
\\ j
•Л /
*\' А2
TI1
OZ '\\
\^
Т
О :
Рис. 28. Планы поведения, построенные автоматами с различными «характерами» (режим 2).
Рис. 29. Планы поведения, построенные автоматами с различными «характерами» (режим 1).
Рис. 30. Планы поведения, построенные автоматом Т1 при различных «силах цели».
Рис. 31. Планы поведения, построенные автоматом Т1 при различных установках на достижение цели.
: = t : = t
- / |
/ |
7 |
|
|
|
|
tin г |
|
|
o- |
|
a |
5 |
|
Рис. 32. Варианты шгапа поведения, построенные автома тами с различными «характерами»:
а — автоматом Т1; б — автоматом ТЗ.
У
4 Ч |
2 |
4< \ |
«неприятные» для' автомата участки. Увеличение «силы це ли» вынуждает даже автомат с «осторожным» характером предпринимать (планировать) все более «решительные» дей ствия. При этом оказываются весьма близкими планы, по строенные «решительным» автоматом при малых «силах це ли» и «осторожным» — при больших.
При описании М-автомата были выделены два компонен та «стремления» автомата достичь цель. Действие одпого из них — «силы цели» — рассмотрено нами выше. Второй ком понент— «установка» на достижение цели (В) — также ока
зывает значительное |
влияние па |
выбор плана передвижения |
||||
(см. описание работы |
алгоритма |
«К»). На рис. 31 показано |
||||
изменение |
планов, |
выбираемых |
автоматом |
Т1 в режиме 1 |
||
при А = |
90 для Bi = |
150 и В2 |
= 200 усл. |
ед. С увеличе |
||
нием В повышается |
«целеустремленность» |
поведения |
авто |
|||
мата. (Все предыдущие рисунки планов даны для В = |
150.) |
|||||
В л и я н ие типа автомата и «силы цели» на количество ва |
||||||
риантов плана. При |
выборе того илп иного плана поведения |
автомат, как правило, предварительно просматривает несколь ко возможных вариантов. В проведенных экспериментах количество вариантов плана не превышало трех. Для всех автоматов замечена определенная корреляция между «силой цели» и количеством просматриваемых вариантов: чем
Рис. 33. Планы поведения, построенные автоматом Т1 при различных установках В на достижение цели в ре жимах 1 и 2:
а - В - 150; б — В = 200.
|
\ |
/ |
\1 |
|
тт |
ч |
|
|
ч |
||
Oz ^ / |
• * |
\ |
/ |
|
- О - |
выше «сила цели», тем меньшее количество вариантов пла на строит автомат. Аналогичный эффект характерен и для планов поведения человека. Эксперименты показали, что наибольшее количество вариантов строит автомат Т1. На рис. 32 показаны варианты плана передвижения, просмо тренные автоматами Т1 и ТЗ для А — 10 и В = 150. Вари анты строились в порядке, указанном цифрами на рисунке. После построения каждого из вариантов автомат подсчиты вал и запоминал его показатель ценности. Так, для планов, построенных автоматом Т1, показатели ценности были рав ны соответственно 899, 995 и 983 усл. ед. В качестве окон чательного выбран второй вариант. Для автомата ТЗ по казатели ценности построенных им планов были равны соответственно 1396 и 1286 усл. ед. Выбран первый ва риант. Критерий ценности планов для автоматов всех типов и при всех «силах цели» задавался одинаковым и равным 5000 усл. ед. Выбор критерия ценности, заведомо превосхо дящего показатель ценности любого из просматриваемых автоматами планов, позволил сравнить «способность» раз личных автоматов к построению вариантов плана.
Как показали эксперименты, на количество и выбор по строенных автоматом вариантов плана оказывает существен ное влияние параметр В. На рис. 33 приведены планы авто
мата Т1 в режимах 1 (правые |
части рисунков) и 2 |
(левые |
|
части рисунков) при А = 90 й В = 150; А = |
90 и В = 200. |
||
При В = 150 в обоих релшмах |
просмотрено |
по два |
вариан |
та. Порядок просмотра вариантов соответствует их нумера ции на рисунке. Выбранными оказались второй вариант в режиме 1 и первый вариант в режиме 2. В то же время при В = 200 были выбраны планы, соответствующие отвергну
тым вариантам при В = |
150. Более длинные планы, выбран |
|||
ные автоматом при В = |
150, в этом случае вообще не про |
|||
сматривались. |
|
|
||
Интересно изменение вариантов плана, построенных ав |
||||
томатом |
Т1 |
в режиме |
1, |
при увеличении параметра В и |
Л — 10 |
(на |
рис. 32, а В = |
150, на рис. 34 В = 200). В обо |
их случаях просмотрено по три варианта, но конфигурация планов, как видно из сравнения рисунков, различна. Поря док просмотра вариантов соответствует их нумерации на рисунке. В обоих случаях выбраны вторые варианты.
Рис. |
34. |
Варианты плана |
||
поведения, построенные |
ав |
|||
томатом |
Т1 в |
режиме |
1 |
|
{A = |
i0,B |
= |
200). |
|
/ |
л |
It |
|
|
|
1 |
-\ |
1 |
|
|
|
f4 |
||
V |
|
t |
H |
|
HI |
х< |
>> |
||
1\ V |
||||
|
|
9 |
|
|
|
d |
\ |
•If |
|
/ |
г - * t o - JJ |
|
||
|
|
Рис. 35. Плапы поведения, построенные испытуемыми (сплошные линии) и авто матами (пунктирные ли нии) .
(Напомним, что для автомата среда имеет вид цилиндра с винтовым расположением клеток. Этим обстоятельством объясняется переход плана на рисунках из правой части среды в левую.)
С о п о с т а в л е н ие планов поведения человека и автомата. Со
поставление планов, построенных автоматами, с планами, выбранными людьми в аналогичной условной среде, пока зало хорошее совпадение. На рис. 35 представлены планы, выбранные различными испытуемыми (сплошные линии) и автоматами (штриховые линии) при планировании пове дения в одинаковых средах.
Мы полагаем, что оценка адекватности планов на осно ве сравнения психологических и машинных экспериментов может рассматриваться как модификация выдвинутого Тью рингом критерия оценки «разумности» поведения машин (моделей). Процедура, предложенная Тьюрингом, нредусмат-
Pnc. 36. Планы, построенные испытуемыми (режим 1).
4f - г
• |
Ч |
ч |
|
ч |
|
|
Т |
1 |
ч |
|
|
||
Т |
|
\ |
X |
Рис. 37. |
Планы поведения, |
|
к |
|
|
|
|||
|
|
-.-1 |
|
[о |
построенные автоматом Т4 |
|
|
|
|
|
|
(режим |
1). |
ривает распознавание человеком-наблюдателем поведения модели и моделируемого объекта (человека) по ряду внеш них признаков этого поведения [57]. Из рис. 35 видно, что в условиях проведенного нами эксперимента поведения мо дели и человека-испытуемого практически неразличимы.
В психологическом эксперименте для некоторых испытуе мых были получены планы поведения, не соответствующие планам, построенным автоматами при оценках, указанных в табл. 2. Примеры таких планов показаны на рис. 36. При анализе отчетов испытуемых, показавших эти результаты, было сделано предположение, что имеется существенное от личие в оценках, субъективно даваемых испытуемым раз лично окрашенным клеткам, и оценках объектов среды, за данных автомату по табл. 2. Введение четвертого типа авто мата — Т4 со следующими оценками (объект Р4 обозначает пустую клетку среды)
Р1 |
Р2 |
РЗ |
Р4 |
35 |
—100 |
—50 |
20 |
позволило получить в модельном эксперименте планы (рис. 37), близкие к показанным на рис. 36.
Итак, на основании анализа планов поведения, постро енных М-автоматом, и сравнения их с планами, выбираемы ми испытуемыми в психологическом эксперименте, может быть сделан вывод о правомерности исходных предположе ний относительно процесса построения человеком планов двигательного поведения. Однако ряд введенных в М-автомат ограничений (например, объединение на высших уровнях внутренней модели среды ячеек нижних уровней не по их «содержанию», а только по пространственному признаку) свидетельствует о том, что автомат еще не достаточно полно отражает специфику построения планов двигательного по ведения человеком и не учитывает некоторых (возможно, важных) механизмов этого рода деятельности. На устране ние указанных недостатков было направлено дальнейшее совершенствование автомата.
§ 2. Семантика М-сети |
автомата |
Для того чтобы иметь возможность оценивать адекватность внешних и внутренних реакций автомата в процессе пере движения в среде, принята определенная содержательная интерпретация объектов среды. Соответственно этой интер претации выбрана и семантика элементов М-сети автомата, что позволило определенным образом задать ее организацию.
Три типа объектов среды — «положительный» Р1, «силь но отрицательный» Р2 и «слабо отрицательный» РЗ содержа тельно интерпретировались как «пища», «зверь» и «лес».
Структура М-сети автомата схематически изображена на рпс. 38. В соответствии с семантической интерпретацией г-моделей в сети выделены четыре взаимосвязанные сфе ры — логическая, эмоциональная, двигательная и сфера «желаний».
*Первый уровень логической сферы составляют три груп
|
пы по девять i-моделей |
(с |
1-й по |
27-ю г-модель на |
схеме |
||||||||
|
рис. |
38), |
соответствующие |
пространственным |
положениям |
||||||||
|
объектов |
среды («пища |
слева», «лес |
сверху», «зверь |
снизу» |
||||||||
|
и т. д.). Обобщение воспрппимаемой извне информации про |
||||||||||||
|
исходит на втором и третьем уровнях логической сферы. |
||||||||||||
|
Каждая группа г-моделей первого уровня |
(пространственные |
|||||||||||
|
положения одного объекта) |
|
представлена одной г'-моделыо на |
||||||||||
|
втором |
уровне — понятия |
|
«пища» |
(г-модель |
30), |
«зверь» |
||||||
|
(г-модель 28) и «лес» (г-модель 29). (В дальнейшем вместо |
||||||||||||
|
выражения «г-модель...» будем в скобках писать только со |
||||||||||||
|
ответствующий этой г-модели номер на схеме структуры |
||||||||||||
|
автомата.) Семантика остальных г-моделей логической |
сфе |
|||||||||||
|
ры |
выбрана следующей: «лес вокруг» (37), «опасность |
сни |
||||||||||
|
зу» (31), «опасность слева» (32), «опасность сверху» |
(33), |
|||||||||||
|
«опасность |
справа» |
(34), |
общее понятие |
«опасность» |
(38), |
|||||||
|
«любопытство» (39), «отсутствие объектов» (46), «зверь |
||||||||||||
|
встречается часто» |
(35). |
|
|
|
|
|
|
|
|
|||
|
Эмоциональная |
сфера |
М-автомата представлена г"-моде- |
||||||||||
210 |
лями «гнев» (40), «страх» |
(41), «удовольствие» |
(42) |
и |
инте- |
тральными |
центрами |
эмоциональной |
оценки |
«приятно» — |
||||
Пр (43) и «неприятно» — НПр (44). |
|
|
|
|
||||
Двигательная сфера М-автомата представлена тремя уров |
||||||||
нями |
i-моделей — простые |
действия |
(51—58), |
сложные |
дей |
|||
ствия (59—66) и составное действие (77). |
|
|
||||||
В _сферу |
«желаний» |
включены |
i-модели |
«действовать» |
||||
(49), |
«ие действовать» (50), «действовать |
быстро» |
(67), |
|||||
«двигаться по плану» |
(76) и «нападать» |
(45). |
|
|
||||
Возбуждение i-моделей |
«действовать» и «не действовать» |
оказывает существенное влияние на двигательное поведение автомата. В начальном состоянии возбуждена i-модель «не действовать», что приводит к торможению i-моделей простых действий. При восприятии из среды информации об окру жающих объектах повышается возбуждение i-модели «дей ствовать», «затормаживается» i-модель «не действовать» и возбуждение i-моделей простых действий повышается. Если при этом одно пз действий выбирается СУТ или превышает некоторый установленный экспериментатором уровень, оно выполняется и автомат перемещается в среде. В процессе функционирования автомата i-модель «не действовать» мо жет быть опять возбуждена при наличии достаточно силь ного возбуждения связанной с ней i-модели «удовольствие».
Связи от первого уровня логической сферы к первому уровню двигательной сферы устанавливались, исходя из сле дующих соображений: автомат стремится попасть в клетку с объектом «пища»; избегает проходить через клетку с объ ектом «зверь», может проходить через клетку с объектом «лес», но «знает», что это связано с определенной опасностью (i-модель «лес» связана с i-моделыо «опасность»).
Связи между первыми уровнями логической п двигатель ной сфер дают возможность получения «безусловнорефлекторного» ответа автомата на воспринимаемый объект. Кор рекция этого ответа происходит благодаря наличию соответ ствующего распределения возбуждений на более высоких уровнях М-сети автомата. В результате «скорректированный» ответ может не совпадать и даже противоречить «безусловнорефлекторному». Так, например, при отсутствии плана движения автомат, как правило, не входит в клетку с объек том «лес», однако в том случае, когда задан план и для его выполнения необходимы действия, связанные с прохожде нием через клетки, содержащие объект «лес», автомат вы полняет такие действия. При определенных условиях авто мат может не заходить в клетки с объектом «пища» и за ходить в клетки с объектом «зверь». Последнее считается допустимым только в том случае, если в М-сети автомата возбуждены i-модели «гнев» и «нападать». В противном слу чае действие рассматривается как «нелогичное» и произво дится коррекция проходимостей соответствующих связей.
§ 3. Экспериментальное |
исследование |
|
М-автомата |
РЭМ-2 |
|
В автомате РЭМ-2 отражены основные положения исходной гипотезы о программах и механизмах переработки инфор мации мозгом человека. Теоретически такой автомат должен быть способен к организации целесообразной и целенаправ ленной деятельности в любой среде, содержащей объекты, представленные в его сфере восприятий. Однако было неяс но, удастся ли практически подобрать такие значения пара метров i-моделей, связей и СУТ, которые обеспечат адекват ность реакций автомата. Сложность модели и использование в ней множества неформализованных пока данных исклю чали возможность строгого анализа и основанного на этом анализе задания «рабочего режима» автомата, т. е. такого набора параметров, который должен обеспечить как адекват ность его реакций на различные ситуации среды, так и це лесообразность поведения в целом. Единственным доступным способом исследования практической возможности исполь зования М-автоматов, в частности разработанного автомата РЭМ, для решения поставленной ранее задачи организации разумного поведения было проведение серии экспериментов, направленных на выявление особенностей функционирова ния автоматов такого типа.
Как уже упоминалось, РЭМ был первым из разработан ных нами М-автоматов. Поэтому заранее не было известно, удастся ли вообще нужным образом организовать М-сеть автомата, насколько сложной окажется эта задача и даст ли нужный эффект работа СУТ. Все эти вопросы должны были быть решены в ходе экспериментального исследования РЭМа. Кроме того, в случае положительного их решения необхо димо было выяснить, насколько устойчив рабочий режим автомата, т. е. допустимы ли изменения параметров i-моде лей и связей и, если допустимы, то к каким изменениям в поведении автомата они приводят.
При описании общей задачи формирования двигатель ного поведения были выдвинуты два критерия оценки пове дения М-автоматов: целесообразность внешних проявлений поведения, т. е. передвижения в среде, и целесообразность «внутренних» проявлений, т. е. хода мышления. Соответст венно, рабочий режим автомата должен быть выбран таким образом, чтобы удовлетворять обоим критериям. Это озна чает, что при подборе значений параметров i-моделей, связей и СУТ мы должны добиваться адекватности не только дви гательных актов, но и предшествующих им «осознанных мыслей» автомата. Именно с этих позиций мы и будем в дальнейшем оценивать поведение РЭМа в различных экспе риментальных ситуациях.