Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования

.pdf
Скачиваний:
13
Добавлен:
25.10.2023
Размер:
17.04 Mб
Скачать

уровня оказывается возбужденной, между ней и i-моделями блока Р устанавливаются связи. В дальнейшем повторное восприятие той же или сходной ситуации всегда будет при­ водить к возбуждению этой i-моделп, т. е. она становится представителем, моделью ситуации. Аналогичным образом та же i-модель связывается с i-моделыо действия, выполнен­ ного автоматом в воспринятой ситуации. Так происходит запоминание реакции на ситуацию. В дальнейшем между i-моделямп различных ситуаций могут устанавливаться ас­ социативные связи по сходству или временной близости, так что восприятие одной ситуации может вызвать возбуждение целого ряда i-моделей других ситуаций.

Возбуждение

i-моделей второго уровня происходит в к

раз реже, чем

первого. Поэтому спонтанно возбужденная

i-модель второго уровня может связаться с к i-моделями пер­ вого и стать их представителем. Между i-моделями обобщен­ ных ситуаций могут устанавливаться ассоциативные связи. Кроме того, они связываются и с элементами блока действия.

Впредлагаемом варианте автомата блок содержит 150 i-моделей первого уровня и 50 второго. i-Моделп блока могут связываться также с элементами блока ПО. Таким образом, совокупность связей, направленных от i-моделей какпх-либо ситуаций к i-моделям блоков Р и ПО, определяет «содержа­ ние» ситуаций, а их связи с блоком эмоций — «значение» ситуаций для автомата.

Блок эмоций содержит 14 i-моделей различных эмоциопальных состояний и чувств (недовольство, гнев, беспокой­ ство, страх, удовлетворение, неудовлетворение, любопытство, неуверенность, уверенность, безопасность, радость, близость цели, голод, усталость). Кроме того, в блок входят i-модели интегральных оценок «приятно» (Пр) и «неприятно» (НПр). Между некоторыми i-моделями блока заданы связи, отра­ жающие наблюдающиеся у животных и человека взаимодей­ ствия между эмоциональными состояниями [32]. Например, возбуждение i-модели «гнев» тормозит возбуждение i-моде­ ли «усталость». Заданы также некоторые «врожденные» свя­ зи с i-моделями блока Р. Таким образом, восприятие ситуа­ ции изменяет состояние эмоциональной сферы автомата.

Связи, устанавливающиеся в процессе функционирова­ ния автомата между элементами блока эмоций и блоков ПС и ПО, обеспечивают влияние эмоционального состояния на весь ход переработки информации и, следовательно, выбор автоматом действий. В свою очередь, остальные блоки вли­ яют на состояние блока эмоций.

Возбуждение i-моделей «голод» и «усталость» отражает состояние «тела» автомата. Возбуждение i-модели «голод» дискретно увеличивается в каждый момент времени, но сни­ жается до нуля, если автомат находится в клетке, содержа-

щей раздражитель группы «пища», и выполняет действие «есть». Возбуждение i-модели «усталость» дискретно увели­ чивается при каждом шаге автомата, но снижается до нуля прп выполнении им действия «спать». Элементы блока эмо­ ций связаны с г-моделями блока желаний.

Блоки желаний и действий. «Желание» мы рассматри­ ваем как обобщенное, недифференцированное действие. В со­ ответствии с этим в автомат включены г-модели желании «действовать» и «не действовать», а также их уточнения — i-модели желаний «действовать быстро», «действовать спо­ койно», «стоять на месте» и «отдыхать». Возбуждение г'-мо­ делей желанпй обусловливается состоянием элементов блока эмоций и передается непосредственно на г-модели действий.

Блок действий включает в себя г'-моделп 22 действий, доступных автомату. Среди них имеется 9 г-моделей шагов, переводящих автомат в одну пз клеток окрестности. Кроме того, имеется 8 i-моделей действий-шагов «нападать». Дей­ ствие «нападать» связано с переходом автомата в новую ячейку. Прп этом, если, например, раздражитель «зверь Л» по условиям «опасен» для системы, то при обычном шаге автомат не должен входить в ячейку, занятую этим раздра­ жителем, и такой шаг рассматривается как ошпбка, свиде­ тельствующая о неверном выборе структуры пли алгоритмов обучения. Если же этот шаг выполняется как действие «на­ падать», то указанное ограничение снимается. «Нападение» связано с увеличением возбуждения i-моделей «усталость» и «больно». В блоке имеются также i-моделп следующих действий: 1) рыть; прп выполнении этого действия в неко­ торой ячейке в последнюю вносится раздражитель «убежи­ ще», i-модель которого связана с i-моделямп «удобно», «не действовать» и т. п.; 2) спать; прп выполнении этого дей­ ствия возбуждение i-модели «усталость» снижается до нуля

п возбуждается

«удовлетворение»; 3) есть; снижается до

нуля возбуждение

«голода» и повышается «удовлетворение»;

4) нести; после выполнения этого действия в какой-либо непустой ячейке дальнейшее перемещение автомата в среде сопровождается соответствующим перемещенпем находивше­ гося в исходной ячейке раздражителя, а также повышением возбуждения i-модели «усталость»; 5) бросить; прекращает действие «нести».

Кроме указанных, блок содержит также восемь г'-моделей «обобщенных» действий, каждая из которых связана с г-мо­ делями шагов, при помощи которых соответствующее «обоб­ щенное» действие может быть реализовано, и с i-моделями обобщенных ситуаций в блоке ПС (связи с блоком ПС уста­ навливаются в ходе функционирования автомата). Состоя­ ние блока действий является результатом переработки ин­ формации во всей сети. Выбор одного из возможных дейст-

вий осуществляется по определенным правилам, которые будут описаны ниже.

Система усиления — торможения. В предлагаемом авто­ мате СУТ реализована в виде двухуровневой системы. Ее первый уровень составляют «частные» подсистемы, каждая из которых действует на г-моделях одного из блоков автома­ та. Будем обозначать их, приписывая к слову СУТ назва­ ние соответствующего блока (СУТж, СУТпо и т. п.). Второй уровень СУТ (СУТ-2) представлен в виде подсистемы, в каждый момент времени выбирающей наиболее возбужден­ ный блок автомата. i-Модели всех остальных блоков равно­ мерно притормаживаются (в том числе и i-модели, выбран­ ные «частными» СУТ этих блоков). Возбужденность всех i-моделей выбранного СУТ-2 блока увеличивается.

§ 2. Диналшка М-автомата

Пусть в некоторый момент времени в М-сети возбуждено определенное количество i-моделей, и пусть шаг был выпол­ нен автоматом в предыдущий момент. Работа автомата на­ чинается с восприятия сптуации, что приводит к возбужде­ нию ряда i-моделей блока Р. Затем происходит очередной пересчет М-сети, при котором определяются новые значения проходимостей связей п возбужденностей i-моделей. При этом спонтанно возбужденная i-модель в блоке ПС связы­ вается с возбужденными i-моделями блока Р. После опреде­ ления возбужденностей i-моделей начинает работать СУТ, в результате чего картина возбуждений изменяется. По из­ мененным возбуждениостям проверяется, будут лп выполня­ ться условия действия и, если они не выполняются, по­ вторяется восприятие сптуации и цикл выполняется вновь.

В ходе пересчетов возбуждение, возникающее в блоке Р, распространяется по всей сети. При этом одновременно с формированием i-моделей ситуаций в блоке ПС идет «узна­ вание» воспринятых раздражителей в блоке ПО и формиру­ ется эмоциональная оценка в блоке Э. Затем возбуждение достигает блока Д, причем отдельные его i-модели возбуж­ даются неодинаково. Это обстоятельство используется для выбора действия. Определенное действие осуществляется при выполнении одного пз следующих условий: 1) СУТ-2 выби­ рает блок Д; при этом выполняется действие, i-модель ко­ торого выбрана СУТд; 2) СУТ-2 выбпрает не блок Д, но возбужденность i-модели, выбранной СУТд, превышает не­ который заранее выбранный уровень. Если выполняется од­ но из этих условий и СУТж выделяет i-модель «действовать быстро», то в результате шага автомат перемещается не в

одну из соседних клеток, а дальше — в клетку следующего слоя. За выполнением действия следует восприятие новой ситуации и описанные выше циклы повторяются. Блок дейст­ вий включает в себя также системы, следящие за выполне­ нием плана, которые позволяют автомату корректировать план или отказываться от его выполнения.

Уточним понятие «ход мышления» автомата. В каждый момент времени СУТ выделяет г'-модели в различных сфе­ рах М-сети. То обстоятельство, что М-сеть является сетью с семантикой, позволяет каждой из выбранных СУТ г-моде- лей поставить в соответствие определенное слово естествен­ ного языка. В ходе работы М-автомата СУТ последовательно выделит некоторый ряд г-моделей. Последовательность слов,

соответствующих выделяемым

СУТ i-моделям, мы и бу­

дем называть «ходом мышления»

автомата.

МОД рассчитан на совместную работу с системой, моде­ лирующей переработку информации в процессе построения плана двигательного поведения. Для этого М-автомат допол­ няется блоком, обеспечивающим влияние выработанного пла­ на на выбор действий. Последний включает в себя системы, следящие за выполнением плана и позволяющие автомату корректировать план или отказаться от его выполнения.

Необходимо еще раз отметить, что содержательные обо­ значения элементов среды и i-моделей автомата выбраны, вообще говоря, произвольно для того, чтобы сделать возмож­ ной содержательную интерпретацию процессов, происходя­ щих в автомате, и облегчить оценку адекватности его пове­ дения. Будем по возможности и в дальнейшем придержива­ ться этих обозначений.

§ 3. Реализация М-автомата

М-автомат МОД реализован в виде комплекса программ для ЦВМ БЭСМ-6. В настоящем параграфе описываются наибо­ лее важные участки программы, а также блок-схемы, необ­ ходимые для понимания ее структуры.

При реализации М-автомата на его структуру и алгорит­ мы наложен ряд ограничений. Некоторые из них связаны с выбором конкретного вида характеристик i-моделей и свя­ зей. Эти ограничения зафиксированы в виде совокупности условий й неравенств, приведенных ниже. Часть ограниче­ ний вводится путем включения в алгоритм функционирова­ ния М-сети ряда вспомогательных процедур, краткое описа­ ние которых также дано в настоящем параграфе. Сущест­ венное ограничение, далее, состоит в том, что мы будем считать пренебрежимо малыми значения остаточных со­ ставляющих усиливающей и тормозной компонент связей,

Рис: 53. Связи между i-мо­ делями.

т. е. всегда Г[оу} Г ^ Ц ~ 0 (см. гл. 4). Введение этого огра­ ничения обусловлено тем обстоятельством, что объем затрат машинного времени при экспериментальном исследовании модели двигательного поведения не позволяет исследовать работу М-сети в течение столь больших промежутков време­ ни, чтобы изменения этих составляющих можно было считать существенными. С тем же обстоятельством связан и отказ от реализации в программе характеристик гипертрофии и адап­ тации возбудимости г-моделей. Таким образом, в рамках на­ стоящей работы мы не будем исследовать упомянутые меха­ низмы долговременной памяти М-сети.

Характеристики элементов М-сетп. Основные характери­ стики г-моделей и связей между ними реализованы следую­ щим образом.

Характеристика передачи связей принята линейной, т. е. для случая, показанного на рис. 53,

гг

п

 

Ei = 2 11} • Гу,

ЕК = 2 П, • ГЦ.

(8.1)

3=1 3=1

Характеристика затухания г-моделей имеет вид

2 П| =

1ГГ1 • сц,

 

 

 

 

 

 

(8.2)

где

a.i — коэффициент

затухания

г'-й

г-модели,

0 <

а,- <

1;

П/ —

возбужденность

г-й

г-модели

при

условии

Е\

=

= Е\ = 0.

 

 

 

 

 

 

 

 

 

Характеристика возбуждения г-моделей

принята

лога­

рифмической и для i-й г-модели

 

 

 

 

 

 

Л • =

К\ • In {Е%

 

 

 

 

 

 

(8.3)

где

К\ — коэффициент

пропорциональности;

L,nJ — возбуж­

денность г-й i-модели

при

условии

И\ = 0, Е\ =

0.

 

 

Характеристика торможения i-моделей принята линей­ ной, так что

К{ = Kui

-

тпЁ\,

 

 

 

 

 

 

(8.4)

где i£H i — «начальное»

значение К{, Кщ =

const;

m — коэф­

фициент пропорцнональностп.

 

 

 

 

Каждая

i-модель

характеризуется порогом

возбужде­

ния в,-.

 

 

 

 

 

 

 

 

 

 

При

определении

величин

возбуждений i-моделей сети

в момент t

+

1 величины

и П'

и 2 П'

нелинейно суммируют­

ся, так что в общем виде

 

 

 

 

 

П{ = Р

=

а1

-

шЁЬ In

K a i

+Е\-

в,).

 

(8.5)

Основываясь

на нейрофизиологической

аналогии (суще­

ствование «верхнего порога» возбуждения пейроиа), примем, что величина возбуждения i-моделей ограничена сверху не­ которым постоянным, задаваемым заранее значением П т а х . С целью экономии затрат машинного времени будем считать

пренебрежимо

малыми те возбуждения, величина которых

не превосходит

некоторого постоянного задаваемого заранее

значения П т т -

Таким образом,

 

 

I П т а х

при

Р >

П т а х ,

 

П!"4"1

=

Р

"рп

П т

1 П < Р < П т а х ,

(8.6)

 

I

0

При

Р<Пгшп.

 

Процесс определеппя возбужденности

всех i-моделей се­

ти с

помощью

формулы (8.5) будем называть пересчетом

сети,

а соответствующий алгоритм — алгоритмом пересчета.

Как упоминалось выше, характеристика проторения свя­

зей

(4.2)

может иметь

различный вид для связей проторен­

ных и непроторенных

(точнее, проторяемых впервые). В ис­

ходном состоянии М-сети между отдельными i-моделями су­ ществуют заранее заданные связи, имеющие некоторую про­ ходимость. Будем полагать, что между всеми остальными i-моделями также имеются связи, начальная проходимость которых равна нулю. При выполнении определенных усло­ вий эти связи могут проторяться. Процесс пх проторения естественно называть установлением связей, а соответствую­ щий алгоритм — алгоритмом установления.

Алгоритм установления связей между i-й и /-й i-моделя­ ми работает в том случае, если выполняется условие уста­ новления, т. е. является истинным выражение

( П { > П „ ) Л (П}>П„),

(8.7)

где П и — задаваемый заранее

порог.

Введем обозначение: Аг = Пп р — П'нпрПусть в момент t для i-моделей i н / выполнено условие (8.7), а также Гц =

=

0 и Гц — 0. Алгоритм

установления

реализует функцию

(4.2), заданную в виде

 

 

г\}

=

к0

(П{ +

П)) +

^А',

 

(8.8а)

Я

=

£0

(П{ +

П|) -

кгА\

 

(8.86)

где ко, к[,

ко, ki — масштабные коэффициенты.

 

Если значение

r-j ( r Q

оказывается

меньше нуля, то оно

принимается

равным нулю, т. е. всегда

г?'; > 0 и г'3- > 0.

 

Характеристика затухания связи задается следующими

соотношениями:

 

 

 

Д н = р Я

 

0 < В < 1 ,

(8.9а;

Д

Н

=

р Д .

0 < р < 1 ,

(8.96)

г л е

 

гп/ 1

и

jr'j"1 —

«затухшие» значения компонент r ,; j

Если в момент £ некоторая связь fyj =?^= 0, то характери­ стика проторения этой связи задается в виде

=

Д + кЛ

(П{ +

nj) Аг,

(8.10а)

~г\р =

Я - -

(П{ +

П]) Аг,

(8.106)

где кг, кг — коэффициенты пропорциональности.

Алгоритмы функционирования М-автомата. Для удобства дальнейшего изложения введем обозначения п дадим крат­

кое описание основных подблоков алгоритма

А.

 

Ас

алгоритм пересчета, реализующий

функции

(8.5).

Ав

алгоритм установления

связей,

реализующий

функ­

ции (8.8) при выполнении условия (8.7).

 

 

Ар алгоритм проторения связей,

реализующий

функ­

ции (8.10).

 

 

 

 

А сут—алгоритм, реализующий функции

системы

усиле­

ния — торможения.

 

 

 

 

Ag

— алгоритм, вычисляющий

функцию цели. Пусть в мо­

мент t М-автомат находится в вершине gi среды и задана «целевая» вершина #ц . Входной информацией для Ag явля­ ются сведения о gi и #ц . В результате работы Ag дополни­ тельное возбуждение получает i-модель того сложного дей­ ствия, выполнение которого необходимо для передвижения

автомата

из gi в #ц . Таким образом, алгоритм As

отображает

в сферу

действий автомата его положение

относительно

цели, реализуя «функцию цели» g(gi, gn)-

А9

 

 

t

 

М- с е т ь

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ay

 

 

 

 

 

 

 

 

 

 

 

-

и

 

 

 

 

 

 

 

 

 

 

 

 

А,

Асут

 

 

 

 

 

 

 

 

 

Нет

/ДействиКйа

J

 

&

ф

 

 

 

 

 

 

~

 

\

 

[_

Алгоритм А

 

 

 

 

 

 

 

 

 

 

 

М-абтомат

 

 

 

 

 

 

 

 

 

 

Рис.

54. Обобщенная блок-схема алгоритма

 

 

 

 

 

 

функционирования

М-автомата.

 

 

 

 

 

 

 

 

Ау — алгоритм

восприятия.

Входной

информацией

для

 

Л у являются

сведения о среде Р

и местоположении

автома­

 

та в данный момент. В результате работы А у

оказываются

 

возбужденными до величины D~v i-модели раздражителей,

 

находящихся в окрестности автомата. Совокупность возбуж­

 

денных i-моделей соотнесем воспринятой ситуации St. Таким

 

образом, алгоритм восприятия осуществляет отображение в

 

сферу восприятия М-автомата ситуации, в которой послед­

 

ний находится.

 

 

 

 

 

AD

 

 

 

AD

алгоритм

выбора действия. На

вход

подается

информация о распределении возбуждений в сфере действий М-сети и зафиксированные правила выбора действия. Ис­ пользуя эти правила, AD либо выбирает некоторую i-модель действия, либо не выбирает никакой i-модели. Таким обра­ зом, действия могут осуществляться автоматом не на каж­ дом такте его работы.

A T множество «эффекторных» алгоритмов. Каждому действию d, £ D соответствует единственный «эффекторпый» алгоритм Ае, £ А Е . После выбора алгоритмом AD i-модели некоторого действия начинает работать соответствующий

этому действию алгоритм А«;, который

в зависимости

от

вида действия может

или изменить

положение

автомата

в среде, или изменить

расположение объектов, или

сделать

и то и другое.

 

А

 

 

 

Обобщенная блок-схема алгоритма

представлена

на

рис. 54, где двойные стрелки указывают

направления обмена

информацией между блоками системы.

 

 

 

 

Уточним понятие такта работы М-автомата. Будем по­ лагать, что один такт составляют все операции, выполняе­ мые между двумя последовательными вхождениями в блок AD. ИЗ рис. 70 видно, что в зависимости от результатов ра­ боты 4 D В такт может не включаться выполнение алгорит­ мов Ае, Av, Ag.

Кроме указанных на рис. 54, в программу введен ряд вспомогательных алгоритмов, выполняющих некоторые функ­ ции, выражение которых в языке М-сети оказывается не­ удобным с точки зрения машинной реализации. Опишем наиболее важные из этих функций.

Асимметрия связей и Иц вводится для того, чтобы обеспечить М-автомату возможность воспроизведения после­

довательностей. Пусть в момент t i-модели i и /

возбуждены

до

П; и Uj соответственно

и П3- > П( . Для операций уста­

новления (8.8) и проторения (8.10)

связей принято:

 

если П,- < П'-, то

 

 

 

 

 

 

 

 

!•{,•:= ;•{,• + а , ( П ] - П ! )

 

 

 

 

 

 

(8.11а)

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

>-ц +

М П } - П 1 ) ,

 

 

 

 

 

 

(8.116)

здесь as — коэффициент асимметрии.

 

 

 

 

 

 

Очевидно,

что при установлении

или проторении связи

Rji

справедливо

nj > П*, и операции ^8.11)

над Rji

не

выполняются. Получаем, таким образом, Яц > Rji .

 

 

 

Пусть

в момент t

М-автоматом

воспринят

некоторый

образ

и соответствующая

ему i-модель

к возбуждена

до

определенного

значения

Пу:

= Uv.

Пусть

в

момент

t + 1 воспринят

другой образ и

П ' + 1 — Пу.В

соответствии

с (8.5) в

момент t +

1

получим

Ii{ <

П 1 + 1 ,

и

устано­

вившиеся между к и I связи окажутся

асимметричными:

.tiki >

tiik .

 

 

t, t + 1,

t +

2,...,

t + n М-автомат

 

Пусть

в моменты

воспринимает

последовательность из п + 1 неповторяющих­

ся

образов. При этом

соответствии с

(8.8)

и (8.11)) в

М-сети

сформируется

структура,

показанная на рис. 55, а,

где толщина линий пропорциональна проходимости изобра­ жаемых ими связей. Если через некоторое время после мо­ мента t -f- п окажется возбужденной i-модель I так, что она будет выделена СУТ, то в результате пересчета будут воз­ буждены i-модели кит, причем П т > П ь , и i-модель т ока­ жется выделенной СУТ. Далее процесс повторится и будет продолжаться до тех пор, пока СУТ не выделит все следую­ щие за I i-модели последовательности в том порядке, в кото­ ром предъявлялись соответствующие образы («воспроизведет» последовательность). Правильный порядок воспроизведения

t t+t

i+2

1*3

t+n-1 t*n

<ОСЮХ"-У€Р

к

L

/77

 

 

 

a

 

 

 

Рис. 55.

Отображение временных последователь­

ностей в структуре связей.

может быть нарушен, еслп некоторые i-модели последова­ тельности получают возбуждение от других i-моделей сети (например, от i-моделей сферы оценок — если предъявля­ лись «эмоционально значимые» образы). Этот феномен ле­ жит в основе формирования «редуцированных» последова­ тельностей, включающих в себя лишь наиболее важные, «ключевые» образы и понятия [7].

Описанный механизм обеспечивает также правильное вос­ произведение «пересекающихся», т. е. имеющих общие эле­ менты, последовательностей. Такая возможность обусловле­ на тем, что характеристика затухания (8.2) i-моделей в об­ щем случае обеспечивает отличную от пуля возбужденность i-модели в течение п(п > 1) тактов с момента ее первона­ чального возбуждения, так что при предъявлении некоторой последовательности первая из возбужденных i-моделей свя­ зывается не только со второй, но и с рядом последующих i-моделей, причем Ri,г > Ri,з > . . . > Run. Очевидно, п = = /(а) и Ri j = г(а, Пу), что в неявном виде задается ха­ рактеристиками (8.8), (8.9) и (8.10), (8.11).

 

Поясним сказанное простым примером. Пусть в моменты

 

t, t +

"1, t +

2 М-автомату

предъявляется

последовательность

 

образов

(а,

Ъ, с),

а

в моменты

т -f-1,

т +

2, т + 3

(т ^> t) —

 

последовательность

(d, Ъ, е). После предъявления

обеих

по­

 

следовательностей в М-сети сформируется структура, изобра­

 

женная на рис. 55, б, где, как и раньше, толщина линий про­

 

порциональна

проходимости соответствующих связей. Пусть

 

в момент Т(Т

Э> т)

получила

некоторое возбуждение i-мо­

 

дель а. В результате пересчета

возбудятся

i-модели

б и с ,

но,

 

поскольку Rab

>

Rac,

то

П ^ + 1

> П с + 1

и СУТ выделит г-мо-

 

дель

Ъ. В момент

 

Т + 2

окажутся

возбужденными

i-модели

 

с и е ,

но, поскольку с еще сохраняет

возбуждение,

получен-

252

ное

в

предыдущем

такте,

т.

е.

«предвозбуяедена»,

то

Соседние файлы в папке книги из ГПНТБ