Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Башкирский Государственный Аграрный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования

.pdf

Скачиваний:

Добавлен:

25.10.2023

Размер:

17.04 Mб

Скачать

☆

<<< < Предыдущая 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 3334 / 3834 35 36 37 38 > Следующая >>>

©	\ О		©	а	Рис. 102. Тестовые ситуации.
©	\ О		©	а
о Q1©Q		Т1		—»- о Т2
Q	Q Q			о
О		тз	d © ©
О	О		d © ©

в дальнейших исследованиях. Так, ситуация Т1 содержит только отрицательные раздражители: всех представителей класса «зверь» и «несъедобное дерево В». Ситуация Т2 по ложительна, так как содержит «съедобные» объекты и «убе жище». Ситуация ТЗ отрицательна, но менее, чем Т1. Проме жуточное положение занимает и Т4, содржащая как «съедоб ные», так и «опасные» объекты.

Реакции автомата в ситуации Т4 представлены на рис. 95—99 (их содержательное описание см. в § 2), в ос тальных ситуациях — СУТ-таблицами (табл. 21). Содержа тельные интерпретации реакций здесь и в дальнейшем не приводятся. Значения оценочных коэффициентов для всех случаев тестовых ситуаций приведены в табл. 22. Видно, что наиболее отрицательная оценка е выработана автоматом для ситуации Т1, наиболее положительная — для Т2. Оценки ТЗ и Т4 занимают промежуточное положение: В целом это правильно отражает характер ситуаций. Близость оценок Т1 н ТЗ указывает на то, что раздражитель «дерево В» оцени вается автоматом примерно так же, как и раздражитель клас са «зверь». Но это касается только общей, интегральной оценки: конкретные «чувства», вызываемые этими раздра жителями, различны. Значения индексов адекватности ре акций В во всех случаях принадлежат допустимой области. Видно, что «логический» канал обеспечивает адекватную пе реработку информации (7П = 1). Степень соответствия меж ду «логикой» и «эмоциями» изменяется в зависимости от типа ситуации. Характерно, что значения 1Э максимальны для отрицательно оцениваемых ситуаций. Это, однако, спра ведливо лишь для уровня «внимания»: в «подсознательной» сфере формируются адекватные оценки, о чем косвенно сви детельствует удовлетворительное соотношение вырабатывае мых значений е. В ситуации Т4, содержащей раздражители, имеющие противоположные значения для автомата, значе ние е близко к нейтральному (нулю). Здесь же, в условиях «сшибки мотивов», минимальным оказывается 13. Указанные

Т а б л и ц а 21

				©	О
					Q
Тестовая си				О о ©					ДИ:	/
туация T i									ДИ:	/
	1	2	3	4	5	6	7	8	9	10
СУТ-2	ПО	ПО	ПО	э	э	ПО	Э	э	Э	Э
ПО	зА	зв	8В	пи	пп	пп	зв	зв	пп	пп
Э		сх	ИТ	НТ	нт	сх	нт	ИТ	нт	ну
Ж	Дт	бс	ДТ	ДТ	дт	ДТ	ид	нд	нд	нд

Тестовая си туация Т2

Ш•

ДП :

	1	2	3	4	5	6	7	8	9	10
СУТ-2	ПО	ПО	ПО	ПО	Э	Э	ПО	Э	Э	Э
ПО	ДА	шц	шц	ил	пл	пп	пп	пл	пл	пп
Э		нв	УД	УД	УД	УД	УВ	РД	УД	УД
Ж	бс	ДТ	ДТ	ДТ	дт	нд	ДТ	дт	ДТ	дт
				Q О О
				О	о
Тестовая си				О	о				ДП:
туация тз									ДП:
	1	2	3	4	5	6	7	8	9	10
СУТ-2	ПО	ПО	ПО	э	э	ПО	ПО	ПО	Э	Э
ПО	дв	д в	шз	пи	ГШ	ДР	пн	пп	пп	пп
Э		сх	НТ	нт	нт	нт	нв	нт	нт	нт
Ж	дт	бс	ДТ	дт	дт	Дт	нд	ид	ДТ	ДТ

	выше особенности соответствуют интуитивным представле
	ниям	об удовлетворительном	поведении; с формальной сто
	роны реакции оцениваются как адекватные.
	Описанные тесты проводились с автоматом, блок дейст
	вия	которого был заторможен. При его растормаживании
	автомат выполнил в тестовых ситуациях			шаги, указанные
	на рис. 102 стрелками. Шаги выполнялись			в моменты (5 —
334	U. План, заданный автомату,		требовал его	передвижения

Т а б л и ц а	22
Ситуа			Коэффициенты
Ситуа
ции	е	'л	'э	Л
	е	'л	'э	Л
				Р
Т1	—70,8	1	1	1
Т2	26,4	1	0,57	0,57
ТЗ	—67,1	1	0,89	0,89
Т4	8,2	1	0,24	0,24

в направлении, указанном стрелкой для ДП в СУТ-таб- лицах. Видно, что в ситуациях Т1 и ТЗ автомат выполняет шаги, соответствующие плану и обеспечивающие обход пре пятствий. В ситуациях Т2 и Т4 он переходит в ячейки, со держащие «абсолютно положительный» раздражитель. Уве личивая возбуждение i-модели первого этапа плана (т. е. си лу цели), удается заставить автомат выполнить нужный шаг и в этих ситуациях.

а	©			©	о			©
а	о	© ©	©		о	© ©	©		a
		© ©	О о			© ©			•
ш © ©			О о		©			a
	©			©				©
	©			©				©
©		о	©		a		a	a	a
о	Q	Q © ©			•	© © о			о
о	Q	7		a			a	©	о
	©	Г/		©				©
©	© ifч			©	a		a	©
©			Q Q		a	© ©	a	о
		© © О			о	© ©	•	© ©
	©	i	Q	©	о		•	© ©
	©	1		©				©
о	О	t1		©				©
о	О Q f1		a	о		© ©	©		о
о		© ©	•			© ©	о		a
Q	©	О	•	© ©			о	a	©
	©			©				©

Рис. 104. Внешние ре

©акции Л0 в среде St.

a a a

a о

aо

©© • © ©

i ©

1 © о

©i© a о a ©

i©

©	a
© ©	•
	a
	©

Для проверки взаимодействия всех механизмов модели (плана, выбора активных действий, эффекторных алгоритмов и др.) было рассмотрено поведение автомата в условной сре де. Эта среда изображена на рис. 103 и состоит из регулярно расположенных тестовых ситуаций T l — Т4. Автомат стар товал из ячейки А. Ориентиры последовательных этапов плана отмечены римскими цифрами. Видно, что все этапы плана выполнены полностью. Выполнялись также все актив ные действия.


		Характерны реакции автомата в области 1. Автомат «съе
	дает пищу», переходит в «убежище», где «спит». Во время
	«сна» возрастает «голод» и, после выполнения следующего
	шага, автомат опять «ест». Аналогичные ситуации сущест
	вуют в области 2. Здесь автомат также «ест» и затем пере
	ходит		в	«убежище». В этом случае, однако, он не «спит»
	(так		как	недавно выполнял это действие и «усталость» еще
	не накопилась); соответственно не накапливается и «голод»
	и,	восприняв следующую «пищу», автомат «не съедает» ее,
336	а	«несет		с собой». В течение дальнейших шести шагов «пи*

			Т а б л и ц а			23
СУТ-		О							О о о
СУТ-		о	О						о
таблица		о	О						о	о
А0 в S,			CD						о	о
реакции
Блоки								7 \| 8	9	10	11
СУТ-2	ПО	ПО	Э	ПО	по э		ш	ПО	Э	Э	Ш
ПО	зВ	зв	зв	пи	пп	пп	зв	зв	пп	пп	пп
Э	—	сх	нт	цт	нт	ну	пт	нт	нт	нт	сх
Ж	бс	дт	дт	дт	лт	нд	нд	нд	дт	дт	дт

оО

О©

12	13	14	15	16	17	18
ЭЭ	Э	ПО	Э	Э	Ш	РЦ
др	пп	пп	пп	зв	зв	пп
нт	нт	нт	ну	нт	нт	нт
нд	нд	дт	дт	дт	дт	НД

• о

• ф

о о

«Спит»

ПО ПО

ПО

АД

ПО

пп

зв

пп

ДР

пп

пл

пп

пл

пп

ну

НТ

нт

пт

ну

ИТ

нт

НУ

нт

сх

ну

нт

"Д ДТ

ДТ

нд

ид

ДТ

дт

нд

дт

нд

дт

о о ©

•

«Ест»

4.4

',9

АД ПО ПО ПО Ш

ПО га

РЦ

пп

пп пп

зв

пп

ЦП зв

пп

зв

пп

УД

у д

уд

нт

у д

УД

УД сх

сх

нт

сх

нт

ДТ

нд

пд

дт

пд

нд

дт

д т

дт

нд

ДТ

дт

нд

ща» остается не съеденной («голод» не накопился). Затем автомат «видит зверя», возникает «страх» и автомат «бро сает пищу», продолжает путь и через некоторое время «съе дает» другой объект «пища».

	Из рисунка видно	также,	что действие	«создать	убежи
	ще» автомат выполняет, как правило, в тех случаях,				когда
337-	в течение некоторого	времени	воспринимает	раздражитель

класса «зверь». Это действие является, таким образом, свое образной реакцией на восприятие «плохих» ситуаций и име ет компенсирующее значение, так как восприятие «убежи ща» вызывает возбуждение i-моделей «положительных чувств». Видно, кроме того, что действие «спать» выполня ется всегда в тех ячейках, где имеется «убежище». Обе эти реакции в явном виде автомату не задавались.

На основании описанных экспериментов можно сделать вывод, что принятый вариант предорганизации обеспечивает адекватное поведение автомата и может быть признан удов летворительным. Отметпм, что получение этого результата потребовало проведения значительной работы по настройке модели, связанной с целым рядом коррекций исходного ва рианта предорганизации М-сети. Необучающийся М-автомат, предорганизацию которого мы исследовали, будем в дальней шем считать «опорным» вариантом и обозначать симво лом Ао.

Среда, изображенная на рис. 103, характеризуется малой плотностью раздражителей. В дальнейшем для уменьшения затрат машинного времени мы будем исследовать поведение автомата в средах меньшего размера, но с большей плот

ностью	раздражителей. Первую	из	таких	сред — Si
(рис. 104) — получпм из варианта		рпс. 103 путем		некоторо
го его	усложнения. Буквой F обозначен		ориентир первого

этапа плана — цель движения. Точкой старта автомата явля ется ячейка А.

Рассматривалось поведение автомата А0 в среде S\. Внеш

ние реакции автомата	представлены на рис. 104, внутрен
ние— СУТ-таблицей	(табл. 23). 'Начиная с момента tea

траектория автомата зацикливается. Оказывается, таким образом, что автомат Ао в среде Si план выполнить не в со стоянии. Этот результат используется при дальнейшем рас смотрении. Ниже приводятся и оценочные коэффициенты реакций автомата.

Итак, зафиксировав предорганизацию модели, можно приступать к исследованию процессов обучения в ней.

§ 4. Варианты обучения

Процессы обучения в модели реализуются путем проторения и забывания связей в М-сеги, установлением новых связей и формированием новых i-моделей. Последняя возможность обеспечивается функционированием алгоритма Bsu (возбуж дающего новую, ранее не связанную с другими, «резервную» i-модель всякий раз, когда автомат воспринимает новую си туацию). Различные режимы использования Bsu позволяют

реализовать существенно отличающиеся друг от друга ре
жимы обучения.			Bsit
Предположим	вначале,	что		вообще	не работает.
В этом случае все изменения в сети сводятся только к уста
новлению, проторению и затуханию связей. Автомат, следо
вательно, способен к обучению. Процессы обучения в таком
режиме — режиме	изменения		весов	связей — рассматрива
лись в работах [10, 66]. Ряд особенностей предложенной мо
дели (применение СУТ и пр.) не позволяет непосредственно
использовать полученные в этих работах результаты и дела
ет целесообразным специальное изучение адаптационных
возможностей М-автомата		с изменяющимися			весами связей


	в различных средах. Автомат, реализующий описанный ва
	риант обучения, будем обозначать символом					А\.
	Пусть теперь	Bsit	функционирует		так,	как	описано в
	гл. 8. Каждой новой ситуации ставится в соответствие спе
	циальная i-модель. Между такими i-моделями ситуаций уста
	навливаются связи, фиксирующие порядок восприятия си
	туаций автоматом	(Bas).	Алгоритм задержанного				обучения
	Во обеспечивает	установление		адекватных		связей между
	i-моделыо каждой из ситуаций и выполненными в них дейст
	виями. Автомат, таким образом, оказывается способным
	«узнавать» ситуации, «вспоминать» их и выбирать в них
	нужные действия. Кроме того, в таком автомате протекают
	все те процессы, которые имеют место в варианте At. Авто
	мат, реализующий описанный режим обучения (режим «па
	мяти ситуаций»), обозначим символом				As.
	Следующий режим обучения также связан с использо
	ванием BSit. В ходе переработки информации автоматом At
	структура его М-сети постоянно изменяется. Устанавлива
	ющиеся и меняющиеся связи создают в					различные мо
	менты времени новые конфигурации каналов передачи воз-
339	буждения между	блоками сети		и внутрп них. Со			временем

0	\	©
в О	\	©
г	© Р
© щ		О Q
Ф© V		©

©©

©	о	п
о О	Q © © щ
©	к +1	©
©	9	ф
©	9	Q Q
	Щ © © О
©	т	Q
©	а	©
©	t	©
Q О Q		Ш о
О	© ©	• ©
Q	О	• ©

©©

©о

оQ

0 (

оQ О

оГ ^ /

Q а* О

* о Q

к* © ©

•

У©

оо

©© о

i	о
т	©
1	©
т	©
т
/А	а о

О © • ©

		©			©	©
		О	© ©		©
			© ©			Q
¥*		© ©			о	Q
		©				©
	©	©			©	Ф
т			о
1			о
t			о © ©
к		О	о © ©
т о		О	©
>\| ч			\			©
		© а				©
	©		S© © QО			Q
		©	А	т Q		©
	о	Q Q /		i		о
	о	Q Q /		•т		о
		©				©
	о		^ / © ©		•	©
	Q А		О		•	©
		©				©

Аг

Рпс.	106. Внешние реакции М-автоматов А ь Л,, Л2 в
среде	Sj.

эти конфигурации распадаются и на их месте возникают другие. Каждая такая конфигурация соответствует опреде ленному состоянию автомата и фиксирует в себе некоторую информацию о его внутренних реакциях. В варианте At эта «память состояний» является неустойчивой, временной. В М-сети, однако, существует возможность долговременного запоминания собственных состояний. Эта возможность свя зана с возникновением новых i-моделей. Проиллюстрируем ее на условном примере.

Пусть в некоторый момент t возбуждены определенные i-модели at,. .., ап и между ними установлены связи с высо кой проходимостью — создана некоторая их конфигурация р (рис. 105, а). Пусть в этот же момент оказалась возбужден ной «резервная» i-модель г. Между нею и i-моделями ai,...

..., ап установятся связи (рис. 105, б). Потребуем, чтобы эти

	связи	затухали медленно (В, В для них велики). Через неко
	торое	время возбуждения i-моделей могут затухнуть и	кон
340	фигурация р начнет распадаться из-за затухания части		свя-

Т а б л и ц а 24

СУТ-

•

таблица

реакций

О о •

•

А1 в St

«Роет» «Спит»

«Роет»

Клоки

'г 6

СУТ-2

ДР

РЦ

РЦ п о

РД

АД АД АД

РЦ РЦ

АД

НП

ПО

др

зв

пп

пн

пл

зв

пп

уб

пщ

пл

пп

ап

др

гл

ИТ

гл

нт

рд

уд

гл

нт

гл

бп

уд

бп

нт

нв

ПВ

ГН

ДТ

ст

НД

от

бс

—•

дт

ст

ПД

НД

ДТ

НД

—

ДТ

Т а б л и ц а

СУТ-

О О О

таблица

• ©

реакций

Л2 в 5,

«Роет»

15л они

. 43

СУТ-2	Ш	РЦ	Ш	ПО	ш	Э	Ш	Э	Э
ПО	уб	пл	др	пп	зв	уб	уб	уб	пл
Э	ГН	бп	уд	ус	уд	ус	уд	ус	нт
Ж	ст	бс	СП	пд	НД	нд	ст	нд	НД

		Т а б л и ц а	26
СУТ-	О О		©
СУТ-	•	О		©
таблица	•	О	О	©
таблица	©	1	О
реакций	\	1	А	t
А3 в 5,	\	f	t	t

«Есм

Э	АД Ш АД РЦ Ш					РЦ	ш	РЦ
уб	пл	уб	пн	уб	зв	ПП	пп	зв
гл	нт	ус	нт	бп	рд	лб	сх	УД
ст	НД	СП	НД	ДТ	нд	бс	бс	бс

		•
в	•	• ©
о	•	©
1		/
•		/
«Роет»

Блоки

5(1

СУТ-2

ПО

РЦ

III

РЦ

АД

РЦ

РЦ АД

РЦ

РЦ ПО

ПО

пл

дв

зв

пп

пл

зв

Дв

дв

зв

дв

ПЩ

пп

пл

уб

зв

Уб

лб

УС

ГН

ув

УД

гл

УД

УС

уд

гл

СХ

нт

нд

ус

нт

УС

нт

уд

от

нд

ст

ДТ

нд

~ *

СП

ДТ

от

бс

от

ВД

ст

нд

ДТ

/	2 3 4 5 6 7 8 9 Ю				/	1 2 3 4 5 6 7 8 9 Ю					t 2 3 4 5 6 7 8 9 Ю
/	1	1 1	1	1 1	/	11	1	11		/	1 I	1	1 1
2	1	1 1	1	1 1 1	2	1 1 1 1 1		1 1 1		2	1 1 1 1		1 1 1
3	1	1 1	1	1 1 1	3	1 1 1 1 1 1 1 1 1				3	1 1 1 1		1	1 1
4	1	1 1	1	1 1 1	4	1 1 1 1		1 1 1 1		4	1 1 1 1		1 1 1
5	1	1 1	1	1 1 1	5	1 1 1 1		1 1 1		5	1 1 1 1		1 1 1
6					6	1 1 1	1 1 1			6	1		1
7					7	1 1	1 1 1			7
8	1	1 1	1	1 1 1	8	1 1 1 1 1 1 1 1 1			1	8	1 1 1 1		1	1 1
9				1	9				1	9
W					10					10

Рис. 107. Разрешающие матрицы обучения М-автоматов.

зей (рис. 105, в). Если

этом

состоянии вновь

окажется

возбужденной г-модель г

(от других аналогичных

i-моделей

состояний или от возбудившихся

в ходе

работы

сети

неко

торых из i-моделей аи ..., ап),

то возбуждение

передастся

на все г-модели at,..., ап,

связи

между

ними

проторятся

и конфигурация р окажется восстановленной

(рис. 105, г).

Таким образом, формирование i-моделей конфигураций (со

стояний) обеспечивает их долговременное запоминание. Мож

но предположить, что формирование новых

конфигураций

обусловлено поступлением в сеть новой информации. Послед

нее связано с перемещением

автомата из одной

ситуации

в другую. Оказывается, таким

образом, что в качестве

i-мо

делей состояний могут быть использованы «резервные»

i-мо

дели

блока ПС. Такое их использование

обеспечивается ра

ботой

алгоритма Вви при наложении следующих

ограниче

ний: установление связей между i-моделями ситуаций и дей

ствий будем считать запрещенным, а установление связей

между i-моделями ситуаций и всеми остальными

i-моделями

сети — разрешенным. Автомат,

реализующий

такой

режим

обучения (режим «памяти состояний»), обозначим

симво

лом Az-

Исследуем эффективность различных режимов обучения,

помещая автоматы Ai, As

и Az в среду Si. О качестве

обуче

ния будем судить по значениям введенных выше

оценочных

коэффициентов. Внешние реакции автоматов изображены на

рис. 106. Фрагменты внутренних реакций представлены в

табл. 24—26. Видно, что все

автоматы

выполнили

план.

«Трудное место», через которое не смог пройти опорный

вариант Ао, автоматы преодолели

с разной степенью

эффек

тивности. Серию неудачных шагов автомата Ai в области

ячейки F можно пояснить восприятием большого количества

отрицательных раздражителей

(«паника»). Автомат Az в этой

области «вел» себя лучше, поскольку случайно

(выполняя

342

шаг «быстро») попал на «пищу» и «съел» ее. Ai также «на-

<<< < Предыдущая 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 3334 / 3834 35 36 37 38 > Следующая >>>

Соседние файлы в папке книги из ГПНТБ