книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования
.pdfРис. 45. Внутренние реакции М-автомата «норма» при увели чении «зоны внима ния».
/ — — / X У У / — | >ч v .
томате действие механизма внимания. С целью проверки эффективности деятельности СУТ как системы, упорядочи вающей и организующей процесс переработки информации, было проведено экспериментальное исследование влияния изменения различных параметров СУТ на ход процессов в сети.
На рис. 45 показаны внутренние реакции автомата «норма», выполняющего описанный выше план передвиже ния в среде (см. рис. 41) при увеличении «зоны внимания» (параметр 2, в формуле (6.7) равен 10 уел, ед.: в предыду щем случае автомат «норма» работал с Z = 1 усл. ед.).
|
|
Автомат с увеличенной «зоной внимания» выполнил план |
||||||
|
за |
18 тактов, т. е. на два такта быстрее, чем при «зоне вни |
||||||
|
мания», |
равной |
1 усл. |
ед. Как видно из сопоставления |
||||
|
рис. 42 и 45, изменились и внутренние реакцип автомата. |
|||||||
|
Если при малой «зоне внимания» СУТ в каждый момент |
|||||||
|
времени выделяла не более одной i-модели, то при увеличе |
|||||||
|
нии зоны максимальный объем СУТ составил четыре г-моде |
|||||||
|
ли. Разность суммарных возбуждений центров Пр и НПр |
|||||||
|
увеличилась с —240 до 230 усл. |
ед., |
т. е. с —12 до 13 усл. ед. |
|||||
|
на |
один |
такт. Это обстоятельство позволяет сделать вывод |
|||||
|
о том, что с увеличением объема внимания не только повы |
|||||||
|
шается интенсивность, |
но и качественно изменяется ход пе |
||||||
|
реработки информации |
(в М-сети это выражается в вовлече |
||||||
|
нии |
в процесс переработки «осознаваемой» информации но |
||||||
|
вых |
г'-моделей). |
|
|
|
|
||
|
|
Исследование изменения реакций автомата при измене |
||||||
|
нии «глубины» внимания проводилось с автоматом «норма», |
|||||||
|
выполняющим тот же, что и в предыдущем случае, план |
|||||||
|
передвижения при «зоне внимания», равной 1 усл. ед. Изме |
|||||||
|
нялось дополнительное |
возбуждение от СУТ (параметр П„ |
||||||
|
в |
формуле (6.8)), добавляемое в каждый момент времени |
||||||
223 |
к |
возбуждению |
выделенных |
СУТ |
i-моделей. Внутренние |
п |
Рис. |
46. |
Внутренние реак |
|
ции М-автомата «норма» |
||
|
при |
различных дополни |
|
|
тельных |
возбуждениях |
|
|
i-модели от СУТ: |
a — ns - 0; б — f f s - l O O .
30h |
|
|
|
|
|
|
|
|
|
ОI |
i |
i |
i |
i |
i |
i |
i |
i |
|
8 |
9 |
10 |
11 |
12 |
13 |
/4 |
15 |
16 |
t |
|
|
/ |
|
/ |
/ |
/ |
/ |
|
|
a
реакции автоматов с 9-го по 15-й такт при ITS = 0 и Us =
=100 усл. ед. показаны на рис. 46,а и б соответственно.
Автомат, у которого В = 0, за выбранный промежуток времени выполнил 5 шагов. При этом общее «эмоциональ ное» состояние автомата характеризовалось устойчивым воз буждением центра НПр и отсутствием возбуждения г-моде- лей Пр и «удовольствие», несмотря на то что автомат видел «пищу» и проходил через клетку, содержащую этот объект. Автомат, у которого П8 — 100 усл. ед., за этот же отрезок времени выполнил 4 шага; суммарное возбуждение центра Пр составило для него почти 200 усл. ед.
Проведенные эксперименты показали, что изменение раз личных параметров СУТ («свойств внимания») существенно влияет на ход процесса переработки информации в М-сети. При увеличении объема и «глубины» внимания повышается общая активность сети, что в результате приводит к изме нениям внешних реакций автомата и его «отношения» к объ ектам среды.
Имитация «настроения». При экспериментальном исследо вании М-автомата было замечено, что, несмотря на отсутст вие самообучения, процессы в М-сетп существенно зависят от «предыстории» автомата, причем особое влияние оказы вают начальные ситуации. Было предположено, что посколь ку в исходном состоянии возбуждения всех i-моделей сети равны нулю, «память» (затухание возбуждения) первых воз бужденных i-моделей оказывает существенное влпянпе на последующий процесс переработки информации.
Пользуясь некоторыми психологическими аналогиями (влияние первого впечатления, зависимость настроения че ловека в течение дня от первых утренних впечатлений и на строения и т. п.), можно интерпретировать такую зависи мость в М-автомате, как выработку определенного «настрое ния». Тогда можно говорить, что поведение и процесс пере работки информации зависят не только от .«характера», но и от «настроения» автомата.
Для проверки этого предположения был проведен экспе римент следующего содержания. Автомат «норма» помещал ся в клетку si среды, участок которой показан на рис. 47. Задавалось направление движения — «вверх». В процессе движения автомат должен был достичь одной из клеток верх ней границы среды. После окончания эксперимента по пере движению из клетки si тот же автомат (с нулевыми началь ными возбуждениями i-моделей) помещался в клетку «2 и эксперимент повторялся.
Находясь в клетке si, автомат воспринимал ситуацию, содержащую объекты PI, Р2 и РЗ. Наличие большого коли чества объектов РЗ («лес») и объекта Р2 («зверь») обусло вило достаточно сильное возбуждение i-моделей «страх» и
|
о |
|
|
Рис. |
47. Зависимость |
|
* |
|
внешних реакций М-ав |
||
• |
X |
• |
• • |
томата |
«норма» от «на |
строения». |
|||||
• |
• • |
• • |
|
|
|
• |
• |
|
• • |
|
|
• |
• |
•1 |
• • |
|
|
X |
< •, |
• • |
|
|
|
• |
• |
|
• • |
|
|
• |
• И |
X |
|
|
|
• • |
г |
|
|
|
|
Ч• • |
|
|
о
о
|
«опасность», которые, в свою очередь, значительно |
повлияли |
|
|
на дальнейшее состояние М-сети автомата. |
|
|
|
Клетка 5г расположена в окрестности si, |
однако, |
находясь |
|
в ней, автомат воспринимает гораздо более |
«положительную» |
|
|
ситуацию — два объекта «пища» и объекты |
РЗ. Этим обстоя |
|
|
тельством объясняется преимущественное возбуждение «по |
||
|
ложительных» эмоций и, соответственно, более положитель |
||
|
ная оценка не только начальной ситуации, но и пути в целом. |
||
|
При движении из клетки автомат достиг цели за 14 тактов; |
||
|
разность суммарного возбуждения центров Пр и НПр со |
||
|
ставила — 38 усл. ед. на такт. При движении из клетки S2 |
||
|
путь был пройден за 20 тактов; разность суммарного воз |
||
|
буждения центров Пр и НПр составила 9 усл. ед. на такт. |
||
|
Таким образом, в описанном эксперименте выявилось суще |
||
|
ственное влияние начального «настроения» на ход дальней |
||
|
шей переработки информации. |
|
|
|
Влияние «прошлого опыта». В обучающемся М-автомате |
||
|
накопление опыта происходит благодаря изменению прохо |
||
|
димостей связей и характеристик i-моделей. При отсутствии |
||
|
этого типа обучения память в М-сети проявляется в виде |
||
|
затухания возбуждения i-моделей, так или |
иначе связанных |
|
|
с ситуациями, воспринятыми автоматом в предыдущие мо |
||
|
менты времени. Можно полагать, что при функционировании |
||
|
автомата в среде общий характер последней, т. е. преимуще |
||
|
ственное содержание объектов определенного качества, фор |
||
|
мирует и характер «прошлого опыта» автомата. Подобные |
||
|
соображения высказывались при построении «искусственной |
||
226 |
личности Олдос» [36, 78, 79] и были подтверждены |
в экспе- |
риментах с этой моделью. Аналогичный эксперимент был проведен и пами с автоматом «норма».
Исследовалось изменение поведения автомата в среде, со держащей участки сосредоточения определенных (положи тельных или отрицательных) объектов. Эксперимент прово дился следующим образом.
Были заданы две среды — SA И S B , каждая из которых состояла из участков Si и S2 (рис. 48). В клетках участка Si расположены объекты Р1 («пища») п РЗ («лес»); в S2 —Р2 («зверь») и РЗ. Расположение объектов Р1 и Р2 на соответ ствующих участках среды задавалось одинаковым. Среда SA формировалась из последовательности участков Si и S2; SB — из последовательности S2 и Si. В первом эксперименте авто мат «норма» помещался в клетку А среды SA И задавался план передвижения, заключающийся в переходе пз Si в S2 (направление движения— «вверх»). Проводился машинный эксперимент. Затем автомат помещался в клетку В среды
SB |
и проводился |
аналогичный эксперимент по передвиже |
нию из S2 в 1S1. Внутренние реакции автомата прп передви |
||
жении в среде SA |
показаны на рис. 49, при передвижении |
|
в SB |
— на рис. 50. |
Траектории движения автоматов показа |
ны на рис. 48 стрелками. В обоих случаях время движения составило 14 тактов.
Сопоставление внутренних реакций автомата показало, что при «положительном» прошлом опыте автомат оказыва ется гораздо более «оптимистичным», чем при «отрицатель ном». При движении в SA п SB разность суммарного возбуж дения центров Пр и НПр составила соответственно 64 и —6 усл. ед. на такт.
Обсуждение результатов. Поведение человека в естествен ной среде является результатом переработки ие только зри тельной информации, но и той, которая поступает в мозг по другпм каналам. Очевидно, что чем большее число каналов
• |
• |
X |
• |
• |
|
|
|
|
|
X |
X |
|
V |
|
• |
|
|
|
|
|
/ |
|
• |
|
|
|
|
|
|
X |
X |
т |
о |
|
|
|
|
||
|
о |
|
|
|
|
||||
|
|
|
|
|
|
||||
• |
• |
\ |
• |
• |
X |
|
|
|
|
0 |
(Т |
• |
X |
X/ |
/ |
Рис. |
48. |
Внешние |
реакции |
0 |
• |
о |
X |
• |
X |
М-автомата |
«норма» |
в средах |
|
|
|
|
|
|
|
Sa |
И SB. |
|
|
|
участвует |
в |
восприятии |
пнформацпи, |
тем |
выше |
вероят |
|||||||
|
ность адекватной реакции индивида. В этой связи представ |
|||||||||||||
|
ляется интересным исследовать поведеипе М-автомата, имею |
|||||||||||||
|
щего более одного канала восприятия информации, в среде, |
|||||||||||||
|
содержащей раздражители различного типа. Будем назы |
|||||||||||||
|
вать, |
раздражители, |
соответствующие зрительным |
образам, |
||||||||||
|
т. е. конкретным объектам |
среды,' локальными, а |
раздражи |
|||||||||||
|
тели, соответствующие слуховым, осязательным и т. п. вос |
|||||||||||||
|
приятиям,— нелокальными |
признаками |
среды. |
Описанные |
||||||||||
|
выше |
эксперименты |
являются |
исследованием |
поведения |
|||||||||
|
М-автомата в среде, содержащей только локальиые раздра |
|||||||||||||
|
жители. При этом в каждую клетку среды записывается но |
|||||||||||||
|
мер |
соответствующей |
i-модели |
М-сети |
автомата, |
причем |
||||||||
|
в каждой клетке может быть расположен не более чем один |
|||||||||||||
|
объект. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
При наличии в среде нелокальных признаков каждая |
|||||||||||||
|
клетка может содержать любое их количество; она характе |
|||||||||||||
|
ризуется не только наличием или отсутствием определенно |
|||||||||||||
|
го признака, но и интенсивностью последнего. В связи с этим |
|||||||||||||
|
удобно представлять распределение в среде каждого нело |
|||||||||||||
|
кального |
признака |
путем |
задания |
отдельной |
к-среды |
(ка |
|||||||
|
нал-среды), |
содержание |
клеток |
которой |
соответствует |
|||||||||
. |
интенсивности данного |
признака. Обращение |
автомата к |
та |
||||||||||
|
кого типа среде можно рассматривать как включение соот |
|||||||||||||
|
ветствующего канала информации. Естественно, что таким |
|||||||||||||
|
образом количество каналов информации в М-автомате мо- |
|||||||||||||
228 |
жет быть |
сделано сколь угодно |
большим; оно |
ограничивает- |
|
ся |
в основном возможностями |
семантической |
интерпретации |
|
|
и |
объемом памяти используемой вычислительной |
машины. |
||
|
|
Рассмотренные эксперименты с автоматом РЭМ-2, есте |
|||
|
ственно, не являются полным |
и исчерпывающим исследова |
|||
|
нием необучающихся М-автоматов. Тем не менее, некоторые |
||||
|
важные и принципиальные вопросы в ходе этого исследова |
||||
|
ния были решены. Прежде всего, оказалось, что задание |
||||
|
рабочего режима автомата практически осуществимо. При |
||||
|
ступая к экспериментам по передвижению автомата в среде, |
||||
|
мы ие были уверены в том, что настройка в тестовых ситуа |
||||
|
циях будет достаточной для обеспечения адекватности реак |
||||
|
ций автомата в процессе движения. Действительно, при про |
||||
|
ведении первых экспериментов с автоматом «норма» при |
||||
|
шлось дополнительно корректировать некоторые параметры |
||||
|
М-сети, однако эти коррекции были вызваны в основном |
||||
|
стремлением минимизировать |
«удельную |
оценку» пути. |
||
|
В целом же настройка М-автомата в отдельных типичных |
||||
|
ситуациях среды оказалась весьма эффективным способом |
||||
|
задания «хорошей» организации М-сетн. |
|
|
||
|
|
Проведенные эксперименты еще не дают возможности |
|||
|
сделать сколько-нибудь определенные выводы относительно |
||||
|
величины диапазона возможных изменений различных пара |
||||
|
метров М-сети, не приводящих к нарушению целесообразно |
||||
|
сти поведения. Пока можно сказать только то, что, по всей |
||||
|
вероятности, этот диапазон достаточно велик. В противном |
||||
|
случае нам вообще вряд ли удалось бы настроить |
автомат. |
|||
229 |
Разумеется, этот эмпирический вывод нуждается в более кор- |
рентном рассмотрении, однако в ближайшее время строгое ре шение вопроса о величине диапазона допустимых изменений различных параметров в такой взаимосвязанной и многопа раметрической системе, как М-сеть, вряд ли будет получено. В то же время описанные результаты могут быть уже ис пользованы в дальнейших работах по созданию более слож ных М-автоматов, поскольку показывают принципиальную возможность и основные пути гибкой настройки М-автоматов на нужный тип поведения. Незначительными изменениями структуры или значений параметров отдельных элементов М-сети можно получить автоматы, существенно отличающие ся типом поведения,— «осторожные» или «решительные», «агрессивные» пли «доверчивые» и т. п.
Одним из наиболее важных результатов эксперименталь ного исследования автомата РЭМ-2 можно считать демонст рацию эффективности применения СУТ как системы, упоря дочивающей процесс переработки информации. Именно СУТ обеспечивает автомату дифференциацию внутренних и внеш них реакций. Содержательность этих реакций, т. е. наличие зафиксированной семантики всех, в том числе и выделяемых СУТ, i-моделей сети, позволяет оценивать целесообразность поведения автомата пе только по его двигательным реак циям, но и по адекватности предшествующего им «хода мы шления». Эксперименты с автоматом РЭМ-2 показали суще ственную зависимость поведения автомата от величины раз личных параметров его СУТ. Оказалось, что изменение типа поведения автомата может быть получено путем изменения как его структуры, так и значений отдельных параметров СУТ. Этот вывод представляется нам весьма важным, так как, во-первых, является косвенным подтверждением уста новленной нами аналогии между СУТ и вниманием и, вовторых, дает дополнительные возможности коррекции пове дения автомата.
Исследование автомата РЭМ-2 показало перспективность дальнейшего совершенствования и развития М-автоматов как одного из направлений создания систем ПР. Прежде всего, такое совершенствование должно быть связано с усложне нием среды и введением функций самообучения и самоорга низации. Уже при проведении экспериментов с необучающимся М-автоматом (исследование влияния «прошлого опы та» и «настроения») оказалось, что некоторый эффект обучения может быть получен при использовании только ме ханизма изменения кратковременной памяти (возбужденнос ти i-моделей). Естественно, что в автомате такого типа «про шлый опыт» и «настроение» сильно взаимосвязаны и их влияние распространяется лишь на незначительный проме жуток времени, зависящий от характеристик затухания со ответствующих i-моделей сети. Однако можно полагать, что
введение в автомат алгоритмов самообучения, связанных с изменением проходимостей связей и характеристик г-моде лей сети, позволит автомату более эффективно и адекватно использовать обучающее воздействие среды для повышения степени «разумности» своего поведения.
Заканчивая рассмотрение автомата РЭМ-2, отметим важ ность введения в структуру его М-сети элементов, содержа тельно интерпретируемых как «эмоциональные» состояния. Благодаря наличию «эмоциональной» сферы автомат спосо бен самостоятельно оценивать воспринимаемую извне ин формацию и согласовывать задачу, поставленную экспери ментатором, т. е. движение в среде и достижение определен ной цели, с задачей «самосохранения». Это обстоятельство кажется нам чрезвычайно важным при использовании физи ческих аналогов М-автоматов для решения практических
задач в реальной среде. |
|
||
§ |
4. Влияние |
выработанного |
плана |
на |
поведение |
автомата |
|
Выбранный автоматом план передвижения в среде представ ляет собой последовательность сложных действий, выполне ние которых должно привести к достижению поставленной цели. Этапы плана представлены в структуре М-сети РЭМа-2 следующим образом. В сети автомата имеется некоторое ко личество г-моделей, каждая из которых содержательно интер претируется как номер этапа плана. Соответствующее каж дому этапу плана конкретное направление движения фикси руется связью, устанавливаемой от г-модели «этап плана номер...» к г-модели определенного действия двигательной сферы; г'-модель элемента плана высшего уровня связывает ся с i-моделью соответствующего ему действия третьего уровня двигательной сферы; г-модели элементов плана низ шего уровня — с t-моделями действий второго уровня.
При выполнении каждого этапа плана соответствующей г-модели приписывается определенное начальное возбужде ние. При движении автомата в среде величина этого возбуж дения может корректироваться в зависимости от состояния М-сети. Величина возбуждения г-моделей элементов плана может быть интерпретирована как «желание» автомата точ но следовать выработанному плану. Коррекция возбуждения осуществляется следующим образом. В структуру «сферы
желаний» М-сети автомата |
введена г'-модель «выполнять |
||
план» (76), получающая |
возбуждение от г-моделей Пр |
(43) |
|
и «отсутствие объектов» |
(46) |
и торможение от i-модели |
НПр |
(44). Возбуждение i-модели |
«выполнять план» суммируется |
с начальным возбуждением i-модели выполняемого в данный
момент этапа плана (i-моделп остальных этапов плана в это время тормозятся). Таким образом, возбуждение i-модели выполняемого этапа плана в каждый момент времени отра
жает состояние |
автомата и его «субъективное» |
отношение |
|
к |
плану. |
|
|
|
Высшпй уровень плана соответствует общему направле |
||
нию к цели, и |
i-модель этого элемента плана |
возбуждена |
|
в |
течение всего |
процесса передвижения автомата |
в среде — |
до момента достижения цели. i-Модели этапов низшего уров ня плана возбуждаются при помощи специального алгоритма только на время выполнения соответствующего этапа плана. По связям от i-моделей этапов плана возбуждение передает ся к i-моделям действий. Поскольку между i-моделями дей ствий различных уровней двигательной сферы имеются свя зи, направленные от высших уровней к низшим, дальнейшее распространение возбуждения в сети приводит к тому, что в распределении возбуждений па первом уровне двигатель ной сферы оказывается отраженным влияние различных уровней плана. Такое влпянпе п обусловливает целенаправ ленность конкретных действий автомата.
В психологическом эксперименте по построению плапов двигательного поведения было замечено, что испытуемые в процессе построения плана запоминают расположение от дельных «объектов» среды п в дальнейшем используют их в качестве ориентиров при воспропзведенпп плана. В реаль ных условиях человек, как правило (сознательно пли бессознательно), производит контроль результатов предпри нимаемых действий и сравнение их (результатов) с пред полагавшимися ранее. При этом оцениваются не только объ ективные результаты действия, но и изменения субъектив ного состояния индивида. Так, например, возможна ситуа ция, при которой объективный результат действия совпадает с намеченным ранее, но на выполнение этого действия за трачивается гораздо больше усилий, чем предполагалось пер воначально. Общая эмоциональная оценка такого действия может оказаться отрицательной.
Поскольку контроль выполнения действий является не обходимым элементом двигательного поведения человека, сделана попытка упрощенно воспроизвести этот аспект по ведения в М-автомате РЭМ.
В процессе планирования, т. е. при выборе этапов плана, автомат использует только обобщенное представление о сре де, отраженное в конечной Р-поверхности второго уровня. При реализации плана — передвижения в среде — и восприя тии конкретных ситуаций выполняемые автоматом действия могут отличаться от действий, предусмотренных планом.
Контроль выполнения плана, т. е. обратная связь |
от среды |
к автомату и плану, осуществляется при помощи |
специаль- |