Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования

.pdf
Скачиваний:
13
Добавлен:
25.10.2023
Размер:
17.04 Mб
Скачать

И, наконец, на третьем этапе было решено проверить согласованность работы моделей планирования и выполне­ ния плана и провести комплексное исследование автомата РЭМ.

Глава 7

ЭКСПЕРИМЕНТЫ С М-АВТОМАТОМ

РЭМ

§ 1 .

Экспериментальное

исследование

М-автомата

РЭМ-1

 

^ а

э т о м э т а п е

исследовалось

влияние некоторых парамет­

ров, определяющих тин автомата, т. е. его отношение к объ­ ектам среды, на построение планов двигательного поведе­ ния. Рассматривалось поведение автоматов T l , Т2 и ТЗ, имеющих различные соотношения оценок объектов среды. Автоматы функционировали в среде, содержащей три типа объектов—«положительные» (Р1), «сильно отрицательные» (Р2) и «слабо отрицательные» (РЗ) (рис. 26). Задание типа автомата производилось подбором соотношений оценок объ­ ектов среды (табл. 2).

Поскольку планирование поведения осуществлялось ав­ томатом для достижения цели, представляло интерес иссле­ довать влияние «силы цели» на выбор плана передвижения в среде. Силы цели задавались в диапазоне от 10 до 100 усл. ед. Исследование проводилось в двух режимах: 1) достиже­ ние определенной клетки среды, расположенной внутри ос­ матриваемого автоматом участка; 2) построение плана до­ стижения клетки, расположенной вне осматриваемого участ­ ка. Во втором случае выбор клетки «подцель» производился автоматом и, как показали эксперименты, зависел от его типа и «силы» главной цели. На рис. 27 показан пример изменения положения клетки «подцель» и планы, построен­

ные автоматом

ТЗ при силах

главной цели Ai — 10, Az =

— 30, А3 = 50

(при А = 70

и А = 90 положение подцели

X

о

аX

X

 

X

X

а

в в X в в а а

D а

 

 

X а

 

X "а а а а а

в а X а в

 

 

Рис.

26.

Среда

ав­

 

 

томата РЭМ-1

( • —

а

 

объект

PI,

X — о б ъ ­

А

 

ект

Р2,

— объект

 

РЗ).

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а

2

 

 

 

Оценка объектов среды, усл. ев.

Тип

 

 

 

автомата

Р1

Р2

РЗ

 

Т1

35

—50

—15

Т2

35

—35

—10

ТЗ

35

—20

— 5

совпадало с выбранным прп А = 50, поскольку эта клетка расположена на прямой, соединяющей исходную клетку ав­ томата и цель).

Влияние типа автомата на выбор плана. Примеры планов, построенных автоматами с различными соотношениями оце­ нок объектов среды при одинаковой силе цели А = 90, по­ казаны на рис. 28 (планы построены для случая, когда глав­ ная цель находится вне осматриваемого участка). Как вид­

но из рпсунка, автоматы T l , Т2 и ТЗ выбрали

в качестве

подцели различные клетки. Подцель, выбранная

автоматом

ТЗ, расположена на прямой, соединяющей исходную клетку автомата я главную цель. Подцелп автоматов Т2 и Т1 не­ сколько удалены от нее. Выбранные автоматами планы так­ же значительно отличаются друг от друга. Если планы ав­ томатов ТЗ и Т2 проходят через участки среды, содержащие объекты Р2 и РЗ, то автомат Т1 «избегает» отрицательных раздражителей и учитывает только расположение объектов Р1 . Участки среды, содержащие объекты РЗ и, тем более, Р2, автомат Т1 «старается обходить». Соответственно план его передвижения значительно длиннее планов, построенных автоматами Т2 и ТЗ. В этой связи необходимо еще раз под­ черкнуть, что единственным различием между автоматами было «индивидуальное» задание исходной информации о сре­ де, выраженное в различных оценках объектов среды (см. табл. 2). Поскольку объекты Р1 для всех трех типов авто­ матов оценивались одинаково, можно предположить, что по­ ведение последних определялось в основном наличием в сре­ де объекта Р2 («сильно отрицательного»). Можно говорить, что в этом отношении автомат ТЗ проявил наиболее «реши­ тельный» характер, а автомат Т1 — наиболее «осторожный».

 

 

9

\

 

 

 

ч

V

 

 

 

 

ч

Рис. 27.

Планы

поведения,

 

 

\

 

\ V

построенные автоматом ТЗ

 

 

 

(режим

2) при

различных

 

 

 

 

«силах

цели».

 

Представляет также интерес сопоставление планов пове­ дения автоматов T l , Т2 и ТЗ, построенных ими в режиме 1 (цель находится внутри осматриваемого участка). Пример планов для силы цели А = 30 приведен на рис. 29. Видно, что автомат ТЗ и в этом случае строит наиболее короткий план достижения цели.

Влияние «силы цели». Эксперименты показали, что выби­ раемые автоматами планы передвижения в среде существен­ но зависят от «силы цели». С увеличением последней авто­ маты всех типов «стремятся» сократить путь. Пример изме­

нения

плана (в режиме 1)

автоматом Т1 показан на рис.

30

для At

=

10, А2 = 30, Аз =

70 и Ак = 90. Если при А

=

10

план автомата

состоял из 11 этапов и предусматривал обход

участка

среды

с объектами

Р2 и РЗ, то при А = 90 он

ока­

зался

сокращенным до четырех этапов и проходит

через

/ к

\

77/

\

/

А,

*

 

Ч

\

I

 

 

*

 

 

/

1

Т2 /

 

п

\

 

\

А

ТЗ // 77

\\ j

•Л /

*\' А2

TI1

OZ '\\

\^

Т

О :

Рис. 28. Планы поведения, построенные автоматами с различными «характерами» (режим 2).

Рис. 29. Планы поведения, построенные автоматами с различными «характерами» (режим 1).

Рис. 30. Планы поведения, построенные автоматом Т1 при различных «силах цели».

Рис. 31. Планы поведения, построенные автоматом Т1 при различных установках на достижение цели.

: = t : = t

- /

/

7

 

 

 

tin г

 

 

o-

 

a

5

 

Рис. 32. Варианты шгапа поведения, построенные автома­ тами с различными «характерами»:

а — автоматом Т1; б — автоматом ТЗ.

У

4 Ч

2

4< \

«неприятные» для' автомата участки. Увеличение «силы це­ ли» вынуждает даже автомат с «осторожным» характером предпринимать (планировать) все более «решительные» дей­ ствия. При этом оказываются весьма близкими планы, по­ строенные «решительным» автоматом при малых «силах це­ ли» и «осторожным» — при больших.

При описании М-автомата были выделены два компонен­ та «стремления» автомата достичь цель. Действие одпого из них — «силы цели» — рассмотрено нами выше. Второй ком­ понент— «установка» на достижение цели (В) — также ока­

зывает значительное

влияние па

выбор плана передвижения

(см. описание работы

алгоритма

«К»). На рис. 31 показано

изменение

планов,

выбираемых

автоматом

Т1 в режиме 1

при А =

90 для Bi =

150 и В2

= 200 усл.

ед. С увеличе­

нием В повышается

«целеустремленность»

поведения

авто­

мата. (Все предыдущие рисунки планов даны для В =

150.)

В л и я н ие типа автомата и «силы цели» на количество ва­

риантов плана. При

выборе того илп иного плана поведения

автомат, как правило, предварительно просматривает несколь­ ко возможных вариантов. В проведенных экспериментах количество вариантов плана не превышало трех. Для всех автоматов замечена определенная корреляция между «силой цели» и количеством просматриваемых вариантов: чем

Рис. 33. Планы поведения, построенные автоматом Т1 при различных установках В на достижение цели в ре­ жимах 1 и 2:

а - В - 150; б — В = 200.

 

\

/

\1

 

тт

ч

 

ч

Oz ^ /

• *

\

/

 

- О -

выше «сила цели», тем меньшее количество вариантов пла­ на строит автомат. Аналогичный эффект характерен и для планов поведения человека. Эксперименты показали, что наибольшее количество вариантов строит автомат Т1. На рис. 32 показаны варианты плана передвижения, просмо­ тренные автоматами Т1 и ТЗ для А — 10 и В = 150. Вари­ анты строились в порядке, указанном цифрами на рисунке. После построения каждого из вариантов автомат подсчиты­ вал и запоминал его показатель ценности. Так, для планов, построенных автоматом Т1, показатели ценности были рав­ ны соответственно 899, 995 и 983 усл. ед. В качестве окон­ чательного выбран второй вариант. Для автомата ТЗ по­ казатели ценности построенных им планов были равны соответственно 1396 и 1286 усл. ед. Выбран первый ва­ риант. Критерий ценности планов для автоматов всех типов и при всех «силах цели» задавался одинаковым и равным 5000 усл. ед. Выбор критерия ценности, заведомо превосхо­ дящего показатель ценности любого из просматриваемых автоматами планов, позволил сравнить «способность» раз­ личных автоматов к построению вариантов плана.

Как показали эксперименты, на количество и выбор по­ строенных автоматом вариантов плана оказывает существен­ ное влияние параметр В. На рис. 33 приведены планы авто­

мата Т1 в режимах 1 (правые

части рисунков) и 2

(левые

части рисунков) при А = 90 й В = 150; А =

90 и В = 200.

При В = 150 в обоих релшмах

просмотрено

по два

вариан­

та. Порядок просмотра вариантов соответствует их нумера­ ции на рисунке. Выбранными оказались второй вариант в режиме 1 и первый вариант в режиме 2. В то же время при В = 200 были выбраны планы, соответствующие отвергну­

тым вариантам при В =

150. Более длинные планы, выбран­

ные автоматом при В =

150, в этом случае вообще не про­

сматривались.

 

 

Интересно изменение вариантов плана, построенных ав­

томатом

Т1

в режиме

1,

при увеличении параметра В и

Л — 10

(на

рис. 32, а В =

150, на рис. 34 В = 200). В обо­

их случаях просмотрено по три варианта, но конфигурация планов, как видно из сравнения рисунков, различна. Поря­ док просмотра вариантов соответствует их нумерации на рисунке. В обоих случаях выбраны вторые варианты.

Рис.

34.

Варианты плана

поведения, построенные

ав­

томатом

Т1 в

режиме

1

{A =

i0,B

=

200).

 

/

л

It

 

 

 

1

-\

1

 

 

f4

V

 

t

H

 

HI

х<

>>

1\ V

 

 

9

 

 

 

d

\

•If

 

/

г - * t o - JJ

 

 

 

Рис. 35. Плапы поведения, построенные испытуемыми (сплошные линии) и авто­ матами (пунктирные ли­ нии) .

(Напомним, что для автомата среда имеет вид цилиндра с винтовым расположением клеток. Этим обстоятельством объясняется переход плана на рисунках из правой части среды в левую.)

С о п о с т а в л е н ие планов поведения человека и автомата. Со­

поставление планов, построенных автоматами, с планами, выбранными людьми в аналогичной условной среде, пока­ зало хорошее совпадение. На рис. 35 представлены планы, выбранные различными испытуемыми (сплошные линии) и автоматами (штриховые линии) при планировании пове­ дения в одинаковых средах.

Мы полагаем, что оценка адекватности планов на осно­ ве сравнения психологических и машинных экспериментов может рассматриваться как модификация выдвинутого Тью­ рингом критерия оценки «разумности» поведения машин (моделей). Процедура, предложенная Тьюрингом, нредусмат-

Pnc. 36. Планы, построенные испытуемыми (режим 1).

4f - г

Ч

ч

 

ч

 

 

Т

1

ч

 

 

Т

 

\

X

Рис. 37.

Планы поведения,

к

 

 

 

 

 

-.-1

 

построенные автоматом Т4

 

 

 

 

 

(режим

1).

ривает распознавание человеком-наблюдателем поведения модели и моделируемого объекта (человека) по ряду внеш­ них признаков этого поведения [57]. Из рис. 35 видно, что в условиях проведенного нами эксперимента поведения мо­ дели и человека-испытуемого практически неразличимы.

В психологическом эксперименте для некоторых испытуе­ мых были получены планы поведения, не соответствующие планам, построенным автоматами при оценках, указанных в табл. 2. Примеры таких планов показаны на рис. 36. При анализе отчетов испытуемых, показавших эти результаты, было сделано предположение, что имеется существенное от­ личие в оценках, субъективно даваемых испытуемым раз­ лично окрашенным клеткам, и оценках объектов среды, за­ данных автомату по табл. 2. Введение четвертого типа авто­ мата — Т4 со следующими оценками (объект Р4 обозначает пустую клетку среды)

Р1

Р2

РЗ

Р4

35

—100

—50

20

позволило получить в модельном эксперименте планы (рис. 37), близкие к показанным на рис. 36.

Итак, на основании анализа планов поведения, постро­ енных М-автоматом, и сравнения их с планами, выбираемы­ ми испытуемыми в психологическом эксперименте, может быть сделан вывод о правомерности исходных предположе­ ний относительно процесса построения человеком планов двигательного поведения. Однако ряд введенных в М-автомат ограничений (например, объединение на высших уровнях внутренней модели среды ячеек нижних уровней не по их «содержанию», а только по пространственному признаку) свидетельствует о том, что автомат еще не достаточно полно отражает специфику построения планов двигательного по­ ведения человеком и не учитывает некоторых (возможно, важных) механизмов этого рода деятельности. На устране­ ние указанных недостатков было направлено дальнейшее совершенствование автомата.

§ 2. Семантика М-сети

автомата

Для того чтобы иметь возможность оценивать адекватность внешних и внутренних реакций автомата в процессе пере­ движения в среде, принята определенная содержательная интерпретация объектов среды. Соответственно этой интер­ претации выбрана и семантика элементов М-сети автомата, что позволило определенным образом задать ее организацию.

Три типа объектов среды — «положительный» Р1, «силь­ но отрицательный» Р2 и «слабо отрицательный» РЗ содержа­ тельно интерпретировались как «пища», «зверь» и «лес».

Структура М-сети автомата схематически изображена на рпс. 38. В соответствии с семантической интерпретацией г-моделей в сети выделены четыре взаимосвязанные сфе­ ры — логическая, эмоциональная, двигательная и сфера «желаний».

*Первый уровень логической сферы составляют три груп­

 

пы по девять i-моделей

1-й по

27-ю г-модель на

схеме

 

рис.

38),

соответствующие

пространственным

положениям

 

объектов

среды («пища

слева», «лес

сверху», «зверь

снизу»

 

и т. д.). Обобщение воспрппимаемой извне информации про­

 

исходит на втором и третьем уровнях логической сферы.

 

Каждая группа г-моделей первого уровня

(пространственные

 

положения одного объекта)

 

представлена одной г'-моделыо на

 

втором

уровне — понятия

 

«пища»

(г-модель

30),

«зверь»

 

(г-модель 28) и «лес» (г-модель 29). (В дальнейшем вместо

 

выражения «г-модель...» будем в скобках писать только со­

 

ответствующий этой г-модели номер на схеме структуры

 

автомата.) Семантика остальных г-моделей логической

сфе­

 

ры

выбрана следующей: «лес вокруг» (37), «опасность

сни­

 

зу» (31), «опасность слева» (32), «опасность сверху»

(33),

 

«опасность

справа»

(34),

общее понятие

«опасность»

(38),

 

«любопытство» (39), «отсутствие объектов» (46), «зверь

 

встречается часто»

(35).

 

 

 

 

 

 

 

 

 

Эмоциональная

сфера

М-автомата представлена г"-моде-

210

лями «гнев» (40), «страх»

(41), «удовольствие»

(42)

и

инте-

тральными

центрами

эмоциональной

оценки

«приятно» —

Пр (43) и «неприятно» — НПр (44).

 

 

 

 

Двигательная сфера М-автомата представлена тремя уров­

нями

i-моделей — простые

действия

(51—58),

сложные

дей­

ствия (59—66) и составное действие (77).

 

 

В _сферу

«желаний»

включены

i-модели

«действовать»

(49),

«ие действовать» (50), «действовать

быстро»

(67),

«двигаться по плану»

(76) и «нападать»

(45).

 

 

Возбуждение i-моделей

«действовать» и «не действовать»

оказывает существенное влияние на двигательное поведение автомата. В начальном состоянии возбуждена i-модель «не действовать», что приводит к торможению i-моделей простых действий. При восприятии из среды информации об окру­ жающих объектах повышается возбуждение i-модели «дей­ ствовать», «затормаживается» i-модель «не действовать» и возбуждение i-моделей простых действий повышается. Если при этом одно пз действий выбирается СУТ или превышает некоторый установленный экспериментатором уровень, оно выполняется и автомат перемещается в среде. В процессе функционирования автомата i-модель «не действовать» мо­ жет быть опять возбуждена при наличии достаточно силь­ ного возбуждения связанной с ней i-модели «удовольствие».

Связи от первого уровня логической сферы к первому уровню двигательной сферы устанавливались, исходя из сле­ дующих соображений: автомат стремится попасть в клетку с объектом «пища»; избегает проходить через клетку с объ­ ектом «зверь», может проходить через клетку с объектом «лес», но «знает», что это связано с определенной опасностью (i-модель «лес» связана с i-моделыо «опасность»).

Связи между первыми уровнями логической п двигатель­ ной сфер дают возможность получения «безусловнорефлекторного» ответа автомата на воспринимаемый объект. Кор­ рекция этого ответа происходит благодаря наличию соответ­ ствующего распределения возбуждений на более высоких уровнях М-сети автомата. В результате «скорректированный» ответ может не совпадать и даже противоречить «безусловнорефлекторному». Так, например, при отсутствии плана движения автомат, как правило, не входит в клетку с объек­ том «лес», однако в том случае, когда задан план и для его выполнения необходимы действия, связанные с прохожде­ нием через клетки, содержащие объект «лес», автомат вы­ полняет такие действия. При определенных условиях авто­ мат может не заходить в клетки с объектом «пища» и за­ ходить в клетки с объектом «зверь». Последнее считается допустимым только в том случае, если в М-сети автомата возбуждены i-модели «гнев» и «нападать». В противном слу­ чае действие рассматривается как «нелогичное» и произво­ дится коррекция проходимостей соответствующих связей.

§ 3. Экспериментальное

исследование

М-автомата

РЭМ-2

 

В автомате РЭМ-2 отражены основные положения исходной гипотезы о программах и механизмах переработки инфор­ мации мозгом человека. Теоретически такой автомат должен быть способен к организации целесообразной и целенаправ­ ленной деятельности в любой среде, содержащей объекты, представленные в его сфере восприятий. Однако было неяс­ но, удастся ли практически подобрать такие значения пара­ метров i-моделей, связей и СУТ, которые обеспечат адекват­ ность реакций автомата. Сложность модели и использование в ней множества неформализованных пока данных исклю­ чали возможность строгого анализа и основанного на этом анализе задания «рабочего режима» автомата, т. е. такого набора параметров, который должен обеспечить как адекват­ ность его реакций на различные ситуации среды, так и це­ лесообразность поведения в целом. Единственным доступным способом исследования практической возможности исполь­ зования М-автоматов, в частности разработанного автомата РЭМ, для решения поставленной ранее задачи организации разумного поведения было проведение серии экспериментов, направленных на выявление особенностей функционирова­ ния автоматов такого типа.

Как уже упоминалось, РЭМ был первым из разработан­ ных нами М-автоматов. Поэтому заранее не было известно, удастся ли вообще нужным образом организовать М-сеть автомата, насколько сложной окажется эта задача и даст ли нужный эффект работа СУТ. Все эти вопросы должны были быть решены в ходе экспериментального исследования РЭМа. Кроме того, в случае положительного их решения необхо­ димо было выяснить, насколько устойчив рабочий режим автомата, т. е. допустимы ли изменения параметров i-моде­ лей и связей и, если допустимы, то к каким изменениям в поведении автомата они приводят.

При описании общей задачи формирования двигатель­ ного поведения были выдвинуты два критерия оценки пове­ дения М-автоматов: целесообразность внешних проявлений поведения, т. е. передвижения в среде, и целесообразность «внутренних» проявлений, т. е. хода мышления. Соответст­ венно, рабочий режим автомата должен быть выбран таким образом, чтобы удовлетворять обоим критериям. Это озна­ чает, что при подборе значений параметров i-моделей, связей и СУТ мы должны добиваться адекватности не только дви­ гательных актов, но и предшествующих им «осознанных мыслей» автомата. Именно с этих позиций мы и будем в дальнейшем оценивать поведение РЭМа в различных экспе­ риментальных ситуациях.

Соседние файлы в папке книги из ГПНТБ