Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования

.pdf
Скачиваний:
18
Добавлен:
25.10.2023
Размер:
17.04 Mб
Скачать

Рис. 45. Внутренние реакции М-автомата «норма» при увели­ чении «зоны внима­ ния».

/ — — / X У У / — | >ч v .

томате действие механизма внимания. С целью проверки эффективности деятельности СУТ как системы, упорядочи­ вающей и организующей процесс переработки информации, было проведено экспериментальное исследование влияния изменения различных параметров СУТ на ход процессов в сети.

На рис. 45 показаны внутренние реакции автомата «норма», выполняющего описанный выше план передвиже­ ния в среде (см. рис. 41) при увеличении «зоны внимания» (параметр 2, в формуле (6.7) равен 10 уел, ед.: в предыду­ щем случае автомат «норма» работал с Z = 1 усл. ед.).

 

 

Автомат с увеличенной «зоной внимания» выполнил план

 

за

18 тактов, т. е. на два такта быстрее, чем при «зоне вни­

 

мания»,

равной

1 усл.

ед. Как видно из сопоставления

 

рис. 42 и 45, изменились и внутренние реакцип автомата.

 

Если при малой «зоне внимания» СУТ в каждый момент

 

времени выделяла не более одной i-модели, то при увеличе­

 

нии зоны максимальный объем СУТ составил четыре г-моде­

 

ли. Разность суммарных возбуждений центров Пр и НПр

 

увеличилась с —240 до 230 усл.

ед.,

т. е. с —12 до 13 усл. ед.

 

на

один

такт. Это обстоятельство позволяет сделать вывод

 

о том, что с увеличением объема внимания не только повы­

 

шается интенсивность,

но и качественно изменяется ход пе­

 

реработки информации

(в М-сети это выражается в вовлече­

 

нии

в процесс переработки «осознаваемой» информации но­

 

вых

г'-моделей).

 

 

 

 

 

 

Исследование изменения реакций автомата при измене­

 

нии «глубины» внимания проводилось с автоматом «норма»,

 

выполняющим тот же, что и в предыдущем случае, план

 

передвижения при «зоне внимания», равной 1 усл. ед. Изме­

 

нялось дополнительное

возбуждение от СУТ (параметр П„

 

в

формуле (6.8)), добавляемое в каждый момент времени

223

к

возбуждению

выделенных

СУТ

i-моделей. Внутренние

п

Рис.

46.

Внутренние реак­

 

ции М-автомата «норма»

 

при

различных дополни­

 

тельных

возбуждениях

 

i-модели от СУТ:

a — ns - 0; б f f s - l O O .

30h

 

 

 

 

 

 

 

 

 

ОI

i

i

i

i

i

i

i

i

 

8

9

10

11

12

13

/4

15

16

t

 

 

/

 

/

/

/

/

 

 

a

реакции автоматов с 9-го по 15-й такт при ITS = 0 и Us =

=100 усл. ед. показаны на рис. 46,а и б соответственно.

Автомат, у которого В = 0, за выбранный промежуток времени выполнил 5 шагов. При этом общее «эмоциональ­ ное» состояние автомата характеризовалось устойчивым воз­ буждением центра НПр и отсутствием возбуждения г-моде- лей Пр и «удовольствие», несмотря на то что автомат видел «пищу» и проходил через клетку, содержащую этот объект. Автомат, у которого П8 — 100 усл. ед., за этот же отрезок времени выполнил 4 шага; суммарное возбуждение центра Пр составило для него почти 200 усл. ед.

Проведенные эксперименты показали, что изменение раз­ личных параметров СУТ («свойств внимания») существенно влияет на ход процесса переработки информации в М-сети. При увеличении объема и «глубины» внимания повышается общая активность сети, что в результате приводит к изме­ нениям внешних реакций автомата и его «отношения» к объ­ ектам среды.

Имитация «настроения». При экспериментальном исследо­ вании М-автомата было замечено, что, несмотря на отсутст­ вие самообучения, процессы в М-сетп существенно зависят от «предыстории» автомата, причем особое влияние оказы­ вают начальные ситуации. Было предположено, что посколь­ ку в исходном состоянии возбуждения всех i-моделей сети равны нулю, «память» (затухание возбуждения) первых воз­ бужденных i-моделей оказывает существенное влпянпе на последующий процесс переработки информации.

Пользуясь некоторыми психологическими аналогиями (влияние первого впечатления, зависимость настроения че­ ловека в течение дня от первых утренних впечатлений и на­ строения и т. п.), можно интерпретировать такую зависи­ мость в М-автомате, как выработку определенного «настрое­ ния». Тогда можно говорить, что поведение и процесс пере­ работки информации зависят не только от .«характера», но и от «настроения» автомата.

Для проверки этого предположения был проведен экспе­ римент следующего содержания. Автомат «норма» помещал­ ся в клетку si среды, участок которой показан на рис. 47. Задавалось направление движения — «вверх». В процессе движения автомат должен был достичь одной из клеток верх­ ней границы среды. После окончания эксперимента по пере­ движению из клетки si тот же автомат (с нулевыми началь­ ными возбуждениями i-моделей) помещался в клетку «2 и эксперимент повторялся.

Находясь в клетке si, автомат воспринимал ситуацию, содержащую объекты PI, Р2 и РЗ. Наличие большого коли­ чества объектов РЗ («лес») и объекта Р2 («зверь») обусло­ вило достаточно сильное возбуждение i-моделей «страх» и

 

о

 

 

Рис.

47. Зависимость

 

*

 

внешних реакций М-ав­

X

• •

томата

«норма» от «на­

строения».

• •

 

 

 

• •

 

 

•1

• •

 

 

X

< •,

• •

 

 

 

• •

 

 

И

X

 

 

• •

г

 

 

 

Ч

 

 

о

о

 

«опасность», которые, в свою очередь, значительно

повлияли

 

на дальнейшее состояние М-сети автомата.

 

 

 

Клетка расположена в окрестности si,

однако,

находясь

 

в ней, автомат воспринимает гораздо более

«положительную»

 

ситуацию — два объекта «пища» и объекты

РЗ. Этим обстоя­

 

тельством объясняется преимущественное возбуждение «по­

 

ложительных» эмоций и, соответственно, более положитель­

 

ная оценка не только начальной ситуации, но и пути в целом.

 

При движении из клетки автомат достиг цели за 14 тактов;

 

разность суммарного возбуждения центров Пр и НПр со­

 

ставила — 38 усл. ед. на такт. При движении из клетки S2

 

путь был пройден за 20 тактов; разность суммарного воз­

 

буждения центров Пр и НПр составила 9 усл. ед. на такт.

 

Таким образом, в описанном эксперименте выявилось суще­

 

ственное влияние начального «настроения» на ход дальней­

 

шей переработки информации.

 

 

 

Влияние «прошлого опыта». В обучающемся М-автомате

 

накопление опыта происходит благодаря изменению прохо­

 

димостей связей и характеристик i-моделей. При отсутствии

 

этого типа обучения память в М-сети проявляется в виде

 

затухания возбуждения i-моделей, так или

иначе связанных

 

с ситуациями, воспринятыми автоматом в предыдущие мо­

 

менты времени. Можно полагать, что при функционировании

 

автомата в среде общий характер последней, т. е. преимуще­

 

ственное содержание объектов определенного качества, фор­

 

мирует и характер «прошлого опыта» автомата. Подобные

 

соображения высказывались при построении «искусственной

226

личности Олдос» [36, 78, 79] и были подтверждены

в экспе-

риментах с этой моделью. Аналогичный эксперимент был проведен и пами с автоматом «норма».

Исследовалось изменение поведения автомата в среде, со­ держащей участки сосредоточения определенных (положи­ тельных или отрицательных) объектов. Эксперимент прово­ дился следующим образом.

Были заданы две среды — SA И S B , каждая из которых состояла из участков Si и S2 (рис. 48). В клетках участка Si расположены объекты Р1 («пища») п РЗ («лес»); в S2 —Р2 («зверь») и РЗ. Расположение объектов Р1 и Р2 на соответ­ ствующих участках среды задавалось одинаковым. Среда SA формировалась из последовательности участков Si и S2; SB — из последовательности S2 и Si. В первом эксперименте авто­ мат «норма» помещался в клетку А среды SA И задавался план передвижения, заключающийся в переходе пз Si в S2 (направление движения— «вверх»). Проводился машинный эксперимент. Затем автомат помещался в клетку В среды

SB

и проводился

аналогичный эксперимент по передвиже­

нию из S2 в 1S1. Внутренние реакции автомата прп передви­

жении в среде SA

показаны на рис. 49, при передвижении

в SB

— на рис. 50.

Траектории движения автоматов показа­

ны на рис. 48 стрелками. В обоих случаях время движения составило 14 тактов.

Сопоставление внутренних реакций автомата показало, что при «положительном» прошлом опыте автомат оказыва­ ется гораздо более «оптимистичным», чем при «отрицатель­ ном». При движении в SA п SB разность суммарного возбуж­ дения центров Пр и НПр составила соответственно 64 и —6 усл. ед. на такт.

Обсуждение результатов. Поведение человека в естествен­ ной среде является результатом переработки ие только зри­ тельной информации, но и той, которая поступает в мозг по другпм каналам. Очевидно, что чем большее число каналов

X

 

 

 

 

 

X

X

 

V

 

 

 

 

 

 

/

 

 

 

 

 

 

X

X

т

о

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

\

X

 

 

 

 

0

(Т

X

X/

/

Рис.

48.

Внешние

реакции

0

о

X

X

М-автомата

«норма»

в средах

 

 

 

 

 

 

Sa

И SB.

 

 

 

участвует

в

восприятии

пнформацпи,

тем

выше

вероят­

 

ность адекватной реакции индивида. В этой связи представ­

 

ляется интересным исследовать поведеипе М-автомата, имею­

 

щего более одного канала восприятия информации, в среде,

 

содержащей раздражители различного типа. Будем назы­

 

вать,

раздражители,

соответствующие зрительным

образам,

 

т. е. конкретным объектам

среды,' локальными, а

раздражи­

 

тели, соответствующие слуховым, осязательным и т. п. вос­

 

приятиям,— нелокальными

признаками

среды.

Описанные

 

выше

эксперименты

являются

исследованием

поведения

 

М-автомата в среде, содержащей только локальиые раздра­

 

жители. При этом в каждую клетку среды записывается но­

 

мер

соответствующей

i-модели

М-сети

автомата,

причем

 

в каждой клетке может быть расположен не более чем один

 

объект.

 

 

 

 

 

 

 

 

 

 

 

 

 

При наличии в среде нелокальных признаков каждая

 

клетка может содержать любое их количество; она характе­

 

ризуется не только наличием или отсутствием определенно­

 

го признака, но и интенсивностью последнего. В связи с этим

 

удобно представлять распределение в среде каждого нело­

 

кального

признака

путем

задания

отдельной

к-среды

(ка­

 

нал-среды),

содержание

клеток

которой

соответствует

.

интенсивности данного

признака. Обращение

автомата к

та­

 

кого типа среде можно рассматривать как включение соот­

 

ветствующего канала информации. Естественно, что таким

 

образом количество каналов информации в М-автомате мо-

228

жет быть

сделано сколь угодно

большим; оно

ограничивает-

 

ся

в основном возможностями

семантической

интерпретации

 

и

объемом памяти используемой вычислительной

машины.

 

 

Рассмотренные эксперименты с автоматом РЭМ-2, есте­

 

ственно, не являются полным

и исчерпывающим исследова­

 

нием необучающихся М-автоматов. Тем не менее, некоторые

 

важные и принципиальные вопросы в ходе этого исследова­

 

ния были решены. Прежде всего, оказалось, что задание

 

рабочего режима автомата практически осуществимо. При­

 

ступая к экспериментам по передвижению автомата в среде,

 

мы ие были уверены в том, что настройка в тестовых ситуа­

 

циях будет достаточной для обеспечения адекватности реак­

 

ций автомата в процессе движения. Действительно, при про­

 

ведении первых экспериментов с автоматом «норма» при­

 

шлось дополнительно корректировать некоторые параметры

 

М-сети, однако эти коррекции были вызваны в основном

 

стремлением минимизировать

«удельную

оценку» пути.

 

В целом же настройка М-автомата в отдельных типичных

 

ситуациях среды оказалась весьма эффективным способом

 

задания «хорошей» организации М-сетн.

 

 

 

 

Проведенные эксперименты еще не дают возможности

 

сделать сколько-нибудь определенные выводы относительно

 

величины диапазона возможных изменений различных пара­

 

метров М-сети, не приводящих к нарушению целесообразно­

 

сти поведения. Пока можно сказать только то, что, по всей

 

вероятности, этот диапазон достаточно велик. В противном

 

случае нам вообще вряд ли удалось бы настроить

автомат.

229

Разумеется, этот эмпирический вывод нуждается в более кор-

рентном рассмотрении, однако в ближайшее время строгое ре­ шение вопроса о величине диапазона допустимых изменений различных параметров в такой взаимосвязанной и многопа­ раметрической системе, как М-сеть, вряд ли будет получено. В то же время описанные результаты могут быть уже ис­ пользованы в дальнейших работах по созданию более слож­ ных М-автоматов, поскольку показывают принципиальную возможность и основные пути гибкой настройки М-автоматов на нужный тип поведения. Незначительными изменениями структуры или значений параметров отдельных элементов М-сети можно получить автоматы, существенно отличающие­ ся типом поведения,— «осторожные» или «решительные», «агрессивные» пли «доверчивые» и т. п.

Одним из наиболее важных результатов эксперименталь­ ного исследования автомата РЭМ-2 можно считать демонст­ рацию эффективности применения СУТ как системы, упоря­ дочивающей процесс переработки информации. Именно СУТ обеспечивает автомату дифференциацию внутренних и внеш­ них реакций. Содержательность этих реакций, т. е. наличие зафиксированной семантики всех, в том числе и выделяемых СУТ, i-моделей сети, позволяет оценивать целесообразность поведения автомата пе только по его двигательным реак­ циям, но и по адекватности предшествующего им «хода мы­ шления». Эксперименты с автоматом РЭМ-2 показали суще­ ственную зависимость поведения автомата от величины раз­ личных параметров его СУТ. Оказалось, что изменение типа поведения автомата может быть получено путем изменения как его структуры, так и значений отдельных параметров СУТ. Этот вывод представляется нам весьма важным, так как, во-первых, является косвенным подтверждением уста­ новленной нами аналогии между СУТ и вниманием и, вовторых, дает дополнительные возможности коррекции пове­ дения автомата.

Исследование автомата РЭМ-2 показало перспективность дальнейшего совершенствования и развития М-автоматов как одного из направлений создания систем ПР. Прежде всего, такое совершенствование должно быть связано с усложне­ нием среды и введением функций самообучения и самоорга­ низации. Уже при проведении экспериментов с необучающимся М-автоматом (исследование влияния «прошлого опы­ та» и «настроения») оказалось, что некоторый эффект обучения может быть получен при использовании только ме­ ханизма изменения кратковременной памяти (возбужденнос­ ти i-моделей). Естественно, что в автомате такого типа «про­ шлый опыт» и «настроение» сильно взаимосвязаны и их влияние распространяется лишь на незначительный проме­ жуток времени, зависящий от характеристик затухания со­ ответствующих i-моделей сети. Однако можно полагать, что

введение в автомат алгоритмов самообучения, связанных с изменением проходимостей связей и характеристик г-моде­ лей сети, позволит автомату более эффективно и адекватно использовать обучающее воздействие среды для повышения степени «разумности» своего поведения.

Заканчивая рассмотрение автомата РЭМ-2, отметим важ­ ность введения в структуру его М-сети элементов, содержа­ тельно интерпретируемых как «эмоциональные» состояния. Благодаря наличию «эмоциональной» сферы автомат спосо­ бен самостоятельно оценивать воспринимаемую извне ин­ формацию и согласовывать задачу, поставленную экспери­ ментатором, т. е. движение в среде и достижение определен­ ной цели, с задачей «самосохранения». Это обстоятельство кажется нам чрезвычайно важным при использовании физи­ ческих аналогов М-автоматов для решения практических

задач в реальной среде.

 

§

4. Влияние

выработанного

плана

на

поведение

автомата

 

Выбранный автоматом план передвижения в среде представ­ ляет собой последовательность сложных действий, выполне­ ние которых должно привести к достижению поставленной цели. Этапы плана представлены в структуре М-сети РЭМа-2 следующим образом. В сети автомата имеется некоторое ко­ личество г-моделей, каждая из которых содержательно интер­ претируется как номер этапа плана. Соответствующее каж­ дому этапу плана конкретное направление движения фикси­ руется связью, устанавливаемой от г-модели «этап плана номер...» к г-модели определенного действия двигательной сферы; г'-модель элемента плана высшего уровня связывает­ ся с i-моделью соответствующего ему действия третьего уровня двигательной сферы; г-модели элементов плана низ­ шего уровня — с t-моделями действий второго уровня.

При выполнении каждого этапа плана соответствующей г-модели приписывается определенное начальное возбужде­ ние. При движении автомата в среде величина этого возбуж­ дения может корректироваться в зависимости от состояния М-сети. Величина возбуждения г-моделей элементов плана может быть интерпретирована как «желание» автомата точ­ но следовать выработанному плану. Коррекция возбуждения осуществляется следующим образом. В структуру «сферы

желаний» М-сети автомата

введена г'-модель «выполнять

план» (76), получающая

возбуждение от г-моделей Пр

(43)

и «отсутствие объектов»

(46)

и торможение от i-модели

НПр

(44). Возбуждение i-модели

«выполнять план» суммируется

с начальным возбуждением i-модели выполняемого в данный

момент этапа плана (i-моделп остальных этапов плана в это время тормозятся). Таким образом, возбуждение i-модели выполняемого этапа плана в каждый момент времени отра­

жает состояние

автомата и его «субъективное»

отношение

к

плану.

 

 

 

Высшпй уровень плана соответствует общему направле­

нию к цели, и

i-модель этого элемента плана

возбуждена

в

течение всего

процесса передвижения автомата

в среде —

до момента достижения цели. i-Модели этапов низшего уров­ ня плана возбуждаются при помощи специального алгоритма только на время выполнения соответствующего этапа плана. По связям от i-моделей этапов плана возбуждение передает­ ся к i-моделям действий. Поскольку между i-моделями дей­ ствий различных уровней двигательной сферы имеются свя­ зи, направленные от высших уровней к низшим, дальнейшее распространение возбуждения в сети приводит к тому, что в распределении возбуждений па первом уровне двигатель­ ной сферы оказывается отраженным влияние различных уровней плана. Такое влпянпе п обусловливает целенаправ­ ленность конкретных действий автомата.

В психологическом эксперименте по построению плапов двигательного поведения было замечено, что испытуемые в процессе построения плана запоминают расположение от­ дельных «объектов» среды п в дальнейшем используют их в качестве ориентиров при воспропзведенпп плана. В реаль­ ных условиях человек, как правило (сознательно пли бессознательно), производит контроль результатов предпри­ нимаемых действий и сравнение их (результатов) с пред­ полагавшимися ранее. При этом оцениваются не только объ­ ективные результаты действия, но и изменения субъектив­ ного состояния индивида. Так, например, возможна ситуа­ ция, при которой объективный результат действия совпадает с намеченным ранее, но на выполнение этого действия за­ трачивается гораздо больше усилий, чем предполагалось пер­ воначально. Общая эмоциональная оценка такого действия может оказаться отрицательной.

Поскольку контроль выполнения действий является не­ обходимым элементом двигательного поведения человека, сделана попытка упрощенно воспроизвести этот аспект по­ ведения в М-автомате РЭМ.

В процессе планирования, т. е. при выборе этапов плана, автомат использует только обобщенное представление о сре­ де, отраженное в конечной Р-поверхности второго уровня. При реализации плана — передвижения в среде — и восприя­ тии конкретных ситуаций выполняемые автоматом действия могут отличаться от действий, предусмотренных планом.

Контроль выполнения плана, т. е. обратная связь

от среды

к автомату и плану, осуществляется при помощи

специаль-

Соседние файлы в папке книги из ГПНТБ