Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования

.pdf
Скачиваний:
61
Добавлен:
25.10.2023
Размер:
17.04 Mб
Скачать

©

\ О

 

©

а

Рис. 102. Тестовые ситуации.

 

 

о Q1©Q

Т1

 

—»- о Т2

 

Q

Q Q

 

 

о

 

О

 

тз

d © ©

 

О

О

 

 

в дальнейших исследованиях. Так, ситуация Т1 содержит только отрицательные раздражители: всех представителей класса «зверь» и «несъедобное дерево В». Ситуация Т2 по­ ложительна, так как содержит «съедобные» объекты и «убе­ жище». Ситуация ТЗ отрицательна, но менее, чем Т1. Проме­ жуточное положение занимает и Т4, содржащая как «съедоб­ ные», так и «опасные» объекты.

Реакции автомата в ситуации Т4 представлены на рис. 95—99 (их содержательное описание см. в § 2), в ос­ тальных ситуациях — СУТ-таблицами (табл. 21). Содержа­ тельные интерпретации реакций здесь и в дальнейшем не приводятся. Значения оценочных коэффициентов для всех случаев тестовых ситуаций приведены в табл. 22. Видно, что наиболее отрицательная оценка е выработана автоматом для ситуации Т1, наиболее положительная — для Т2. Оценки ТЗ и Т4 занимают промежуточное положение: В целом это правильно отражает характер ситуаций. Близость оценок Т1 н ТЗ указывает на то, что раздражитель «дерево В» оцени­ вается автоматом примерно так же, как и раздражитель клас­ са «зверь». Но это касается только общей, интегральной оценки: конкретные «чувства», вызываемые этими раздра­ жителями, различны. Значения индексов адекватности ре­ акций В во всех случаях принадлежат допустимой области. Видно, что «логический» канал обеспечивает адекватную пе­ реработку информации (7П = 1). Степень соответствия меж­ ду «логикой» и «эмоциями» изменяется в зависимости от типа ситуации. Характерно, что значения 1Э максимальны для отрицательно оцениваемых ситуаций. Это, однако, спра­ ведливо лишь для уровня «внимания»: в «подсознательной» сфере формируются адекватные оценки, о чем косвенно сви­ детельствует удовлетворительное соотношение вырабатывае­ мых значений е. В ситуации Т4, содержащей раздражители, имеющие противоположные значения для автомата, значе­ ние е близко к нейтральному (нулю). Здесь же, в условиях «сшибки мотивов», минимальным оказывается 13. Указанные

Т а б л и ц а 21

 

 

 

 

©

О

 

 

 

 

 

 

 

 

 

 

Q

 

 

 

 

 

Тестовая си­

 

 

 

О о ©

 

 

 

ДИ:

/

туация T i

 

 

 

 

 

 

 

 

 

1

2

3

4

5

6

7

8

9

10

СУТ-2

ПО

ПО

ПО

э

э

ПО

Э

э

Э

Э

ПО

зА

зв

пи

пп

пп

зв

зв

пп

пп

Э

 

сх

ИТ

НТ

нт

сх

нт

ИТ

нт

ну

Ж

Дт

бс

ДТ

ДТ

дт

ДТ

ид

нд

нд

нд

Тестовая си­ туация Т2

© О

Ш

ДП :

 

1

2

3

4

5

6

7

8

9

10

СУТ-2

ПО

ПО

ПО

ПО

Э

Э

ПО

Э

Э

Э

ПО

ДА

шц

шц

ил

пл

пп

пп

пл

пл

пп

Э

 

нв

УД

УД

УД

УД

УВ

РД

УД

УД

Ж

бс

ДТ

ДТ

ДТ

дт

нд

ДТ

дт

ДТ

дт

 

 

 

 

Q О О

 

 

 

 

 

 

 

 

 

О

о

 

 

 

 

 

Тестовая си­

 

 

 

О

 

 

 

ДП:

 

туация тз

 

 

 

 

 

 

 

 

 

 

1

2

3

4

5

6

7

8

9

10

СУТ-2

ПО

ПО

ПО

э

э

ПО

ПО

ПО

Э

Э

ПО

дв

д в

шз

пи

ГШ

ДР

пн

пп

пп

пп

Э

 

сх

НТ

нт

нт

нт

нв

нт

нт

нт

Ж

дт

бс

ДТ

дт

дт

Дт

нд

ид

ДТ

ДТ

 

выше особенности соответствуют интуитивным представле­

 

ниям

об удовлетворительном

поведении; с формальной сто­

 

роны реакции оцениваются как адекватные.

 

 

Описанные тесты проводились с автоматом, блок дейст­

 

вия

которого был заторможен. При его растормаживании

 

автомат выполнил в тестовых ситуациях

шаги, указанные

 

на рис. 102 стрелками. Шаги выполнялись

в моменты (5 —

334

U. План, заданный автомату,

требовал его

передвижения

Т а б л и ц а

22

 

 

 

Ситуа­

 

 

Коэффициенты

 

 

 

 

 

ции

е

Л

 

 

 

 

 

Р

Т1

—70,8

1

1

1

Т2

26,4

1

0,57

0,57

ТЗ

—67,1

1

0,89

0,89

Т4

8,2

1

0,24

0,24

в направлении, указанном стрелкой для ДП в СУТ-таб- лицах. Видно, что в ситуациях Т1 и ТЗ автомат выполняет шаги, соответствующие плану и обеспечивающие обход пре­ пятствий. В ситуациях Т2 и Т4 он переходит в ячейки, со­ держащие «абсолютно положительный» раздражитель. Уве­ личивая возбуждение i-модели первого этапа плана (т. е. си­ лу цели), удается заставить автомат выполнить нужный шаг и в этих ситуациях.

а

©

 

 

©

о

 

 

©

 

о

© ©

©

 

© ©

©

 

a

 

 

О о

 

 

 

ш © ©

©

 

 

a

 

 

©

 

 

©

 

 

 

©

 

 

©

 

 

©

 

 

 

©

 

©

 

о

©

 

a

 

a

a

a

о

Q

Q © ©

 

 

© © о

 

о

7

 

a

 

 

a

©

 

©

Г/

 

©

 

 

 

 

©

© ifч

 

©

a

 

a

©

 

 

 

Q Q

© ©

о

 

 

 

© © О

 

о

© ©

 

©

i

Q

©

 

 

1

 

 

 

 

©

 

о

О

t1

 

©

 

 

 

©

 

О Q f1

a

о

 

© ©

©

 

о

о

 

© ©

 

 

о

 

a

Q

©

О

© ©

 

a

©

 

 

 

©

 

 

 

©

 

Рис. 104. Внешние ре­

©акции Л0 в среде St.

a a a

© © о

a о

©

©

aо

©© © ©

©

i ©

1 © о

©i© a о a ©

i©

©

©

a

© ©

 

a

 

©

Для проверки взаимодействия всех механизмов модели (плана, выбора активных действий, эффекторных алгоритмов и др.) было рассмотрено поведение автомата в условной сре­ де. Эта среда изображена на рис. 103 и состоит из регулярно расположенных тестовых ситуаций T l — Т4. Автомат стар­ товал из ячейки А. Ориентиры последовательных этапов плана отмечены римскими цифрами. Видно, что все этапы плана выполнены полностью. Выполнялись также все актив­ ные действия.

 

 

Характерны реакции автомата в области 1. Автомат «съе­

 

дает пищу», переходит в «убежище», где «спит». Во время

 

«сна» возрастает «голод» и, после выполнения следующего

 

шага, автомат опять «ест». Аналогичные ситуации сущест­

 

вуют в области 2. Здесь автомат также «ест» и затем пере­

 

ходит

в

«убежище». В этом случае, однако, он не «спит»

 

(так

как

недавно выполнял это действие и «усталость» еще

 

не накопилась); соответственно не накапливается и «голод»

 

и,

восприняв следующую «пищу», автомат «не съедает» ее,

336

а

«несет

с собой». В течение дальнейших шести шагов «пи*

 

 

 

Т а б л и ц а

23

 

 

 

 

 

СУТ-

 

О

 

 

 

 

 

 

О о о

 

 

о

О

 

 

 

 

 

о

 

 

таблица

 

 

 

 

 

 

о

 

А0 в S,

 

 

CD

 

 

 

 

 

о

 

реакции

 

 

 

 

 

 

 

 

 

 

 

Блоки

 

 

 

 

 

 

 

7 | 8

9

10

11

СУТ-2

ПО

ПО

Э

ПО

по э

ш

ПО

Э

Э

Ш

ПО

зВ

зв

зв

пи

пп

пп

зв

зв

пп

пп

пп

Э

сх

нт

цт

нт

ну

пт

нт

нт

нт

сх

Ж

бс

дт

дт

дт

лт

нд

нд

нд

дт

дт

дт

оО

О©

12

13

14

15

16

17

18

ЭЭ

Э

ПО

Э

Э

Ш

РЦ

др

пп

пп

пп

зв

зв

пп

нт

нт

нт

ну

нт

нт

нт

нд

нд

дт

дт

дт

дт

НД

о

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

(2

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ф

 

о о

 

 

 

 

 

 

 

 

 

 

 

 

 

\

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

«Спит»

 

 

 

19

20

21

22

 

23

24

25

26

 

27

28

 

 

29

30

31

32

33

34

35

36

э

Э

m

ПО ПО

э

Э

Ш

ПО

ш

 

 

э

э

Ж

ш

АД

ПО

ПО

ПО

пп

пп

пп

зв

пп

пп

ДР

пп

пп

пп

 

пл

пл

пп

пп

пп

пл

пл

пп

ну

НТ

нт

пт

ну

ну

ИТ

нт

нт

НУ

 

нт

нт

нт

сх

ну

нт

нт

нт

ДТ

ДТ

ДТ

нд

ид

ДТ

дт

дт

нд

 

 

нд

нд

дт

дт

нд

нд

дт

дт

 

 

©

 

 

 

 

 

ф

 

 

 

 

 

 

 

 

о о ©

©1

 

 

 

 

 

 

 

 

©

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

«Ест»

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

37

 

38

39

40

41

42

 

4.4

44

45

46

47

48

',9

 

50

51

52

53

54

ш

 

АД ПО ПО ПО Ш

 

ж

ж

Ш

Р

 

Р

ПО га

РЦ

ш

РЦ

ш

э

пп

 

пп

пп

пп

пп пп

зв

зв

пп

ЦП зв

пп

пп

 

пп

зв

пп

пп

пп

УД

 

у д

уд

уд

нт

у д

 

УД

УД

УД

УД сх

сх

сх

 

нт

сх

сх

нт

нт

ДТ

 

нд

пд

дт

дт

дт

 

пд

нд

дт

д т

дт

нд

нд

 

нд

ДТ

ДТ

дт

нд

ща» остается не съеденной («голод» не накопился). Затем автомат «видит зверя», возникает «страх» и автомат «бро­ сает пищу», продолжает путь и через некоторое время «съе­ дает» другой объект «пища».

 

Из рисунка видно

также,

что действие

«создать

убежи­

 

ще» автомат выполняет, как правило, в тех случаях,

когда

337-

в течение некоторого

времени

воспринимает

раздражитель

класса «зверь». Это действие является, таким образом, свое­ образной реакцией на восприятие «плохих» ситуаций и име­ ет компенсирующее значение, так как восприятие «убежи­ ща» вызывает возбуждение i-моделей «положительных чувств». Видно, кроме того, что действие «спать» выполня­ ется всегда в тех ячейках, где имеется «убежище». Обе эти реакции в явном виде автомату не задавались.

На основании описанных экспериментов можно сделать вывод, что принятый вариант предорганизации обеспечивает адекватное поведение автомата и может быть признан удов­ летворительным. Отметпм, что получение этого результата потребовало проведения значительной работы по настройке модели, связанной с целым рядом коррекций исходного ва­ рианта предорганизации М-сети. Необучающийся М-автомат, предорганизацию которого мы исследовали, будем в дальней­ шем считать «опорным» вариантом и обозначать симво­ лом Ао.

Среда, изображенная на рис. 103, характеризуется малой плотностью раздражителей. В дальнейшем для уменьшения затрат машинного времени мы будем исследовать поведение автомата в средах меньшего размера, но с большей плот­

ностью

раздражителей. Первую

из

таких

сред — Si

(рис. 104) получпм из варианта

рпс. 103 путем

некоторо­

го его

усложнения. Буквой F обозначен

ориентир первого

этапа плана — цель движения. Точкой старта автомата явля­ ется ячейка А.

Рассматривалось поведение автомата А0 в среде S\. Внеш­

ние реакции автомата

представлены на рис. 104, внутрен­

ние— СУТ-таблицей

(табл. 23). 'Начиная с момента tea

траектория автомата зацикливается. Оказывается, таким образом, что автомат Ао в среде Si план выполнить не в со­ стоянии. Этот результат используется при дальнейшем рас­ смотрении. Ниже приводятся и оценочные коэффициенты реакций автомата.

Итак, зафиксировав предорганизацию модели, можно приступать к исследованию процессов обучения в ней.

§ 4. Варианты обучения

Процессы обучения в модели реализуются путем проторения и забывания связей в М-сеги, установлением новых связей и формированием новых i-моделей. Последняя возможность обеспечивается функционированием алгоритма Bsu (возбуж­ дающего новую, ранее не связанную с другими, «резервную» i-модель всякий раз, когда автомат воспринимает новую си­ туацию). Различные режимы использования Bsu позволяют

реализовать существенно отличающиеся друг от друга ре­

жимы обучения.

 

 

Bsit

 

 

Предположим

вначале,

что

вообще

не работает.

В этом случае все изменения в сети сводятся только к уста­

новлению, проторению и затуханию связей. Автомат, следо­

вательно, способен к обучению. Процессы обучения в таком

режиме — режиме

изменения

весов

связей — рассматрива­

лись в работах [10, 66]. Ряд особенностей предложенной мо­

дели (применение СУТ и пр.) не позволяет непосредственно

использовать полученные в этих работах результаты и дела­

ет целесообразным специальное изучение адаптационных

возможностей М-автомата

с изменяющимися

весами связей

 

в различных средах. Автомат, реализующий описанный ва­

 

риант обучения, будем обозначать символом

А\.

 

 

Пусть теперь

Bsit

функционирует

так,

как

описано в

 

гл. 8. Каждой новой ситуации ставится в соответствие спе­

 

циальная i-модель. Между такими i-моделями ситуаций уста­

 

навливаются связи, фиксирующие порядок восприятия си­

 

туаций автоматом

(Bas).

Алгоритм задержанного

обучения

 

Во обеспечивает

установление

адекватных

связей между

 

i-моделыо каждой из ситуаций и выполненными в них дейст­

 

виями. Автомат, таким образом, оказывается способным

 

«узнавать» ситуации, «вспоминать» их и выбирать в них

 

нужные действия. Кроме того, в таком автомате протекают

 

все те процессы, которые имеют место в варианте At. Авто­

 

мат, реализующий описанный режим обучения (режим «па­

 

мяти ситуаций»), обозначим символом

As.

 

 

 

Следующий режим обучения также связан с использо­

 

ванием BSit. В ходе переработки информации автоматом At

 

структура его М-сети постоянно изменяется. Устанавлива­

 

ющиеся и меняющиеся связи создают в

различные мо­

 

менты времени новые конфигурации каналов передачи воз-

339

буждения между

блоками сети

и внутрп них. Со

временем

0

\

©

в О

©

г

© Р

© щ

 

О Q

Ф© V

 

©

©©

©

о

п

о О

Q © © щ

©

к +1

©

©

9

ф

©

Q Q

 

Щ © © О

©

т

Q

а

©

©

t

©

Q О Q

Ш о

О

© ©

©

Q

О

©©

©

о

*>

©

©

©

©о

Q

оQ

0 (

© т

© ¥

©

©

оQ О

оГ ^ /

Q а* О

©

©

©

© ©

* о Q

©

к* © ©

© © ff

У©

©

оо

©© о

i

о

т

©

1

т

©

т

 

/А

а о

О © ©

о

 

 

©

 

 

©

©

 

 

О

© ©

 

 

 

 

 

Q

¥*

 

© ©

 

о

 

©

 

 

 

©

©

©

 

 

©

Ф

т

 

о

 

 

1

 

 

 

t

 

 

о © ©

 

 

к

 

О

 

 

т о

©

 

 

 

>| ч

 

\

 

 

©

 

 

© а

 

 

©

 

©

 

S© © QО

Q

 

 

©

А

т Q

©

 

о

Q Q /

i

 

о

 

т

 

 

 

©

 

 

 

©

 

о

 

^ / © ©

©

 

Q А

О

 

 

 

©

 

 

 

©

Аг

Рпс.

106. Внешние реакции М-автоматов А ь Л,, Л2 в

среде

Sj.

эти конфигурации распадаются и на их месте возникают другие. Каждая такая конфигурация соответствует опреде­ ленному состоянию автомата и фиксирует в себе некоторую информацию о его внутренних реакциях. В варианте At эта «память состояний» является неустойчивой, временной. В М-сети, однако, существует возможность долговременного запоминания собственных состояний. Эта возможность свя­ зана с возникновением новых i-моделей. Проиллюстрируем ее на условном примере.

Пусть в некоторый момент t возбуждены определенные i-модели at,. .., ап и между ними установлены связи с высо­ кой проходимостью — создана некоторая их конфигурация р (рис. 105, а). Пусть в этот же момент оказалась возбужден­ ной «резервная» i-модель г. Между нею и i-моделями ai,...

..., ап установятся связи (рис. 105, б). Потребуем, чтобы эти

 

связи

затухали медленно (В, В для них велики). Через неко­

 

торое

время возбуждения i-моделей могут затухнуть и

кон­

340

фигурация р начнет распадаться из-за затухания части

свя-

Т а б л и ц а 24

СУТ-

 

О

 

 

© о

 

 

©

 

 

 

 

 

 

©

 

т

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

©

 

таблица

 

 

 

 

 

 

 

 

 

 

 

 

 

 

©

 

реакций

 

 

 

 

 

 

 

 

 

 

 

 

 

О о

 

 

 

А1 в St

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

«Роет» «Спит»

 

 

 

 

 

 

 

«Роет»

 

 

Клоки

37

38

39

40

41

42

43

44

45

'г 6

47

 

48

49

50

51

52

53

54

СУТ-2

ДР

РЦ

ш

РЦ п о

ш

РД

АД АД АД

Ш

 

РЦ РЦ

ш

АД

НП

 

 

ПО

др

зв

зв

зв

пп

пн

пл

зв

пп

пп

уб

 

пщ

пл

пп

ап

др

 

 

Э

гл

ИТ

гл

нт

рд

уд

гл

нт

гл

бп

уд

 

бп

нт

нв

ПВ

ГН

 

 

Ж

ДТ

ст

НД

от

бс

—•

дт

ст

ПД

НД

ДТ

 

НД

ДТ

ДТ

ДТ

 

 

 

 

 

Т а б л и ц а

25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

СУТ-

 

О О О

О

о

©

 

 

 

©

 

1

 

 

 

 

 

 

 

 

О

 

 

 

 

 

 

 

 

 

 

 

 

таблица

 

 

 

 

 

 

 

 

©

 

1

 

 

©

 

©

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

реакций

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

©

 

 

 

Л2 в 5,

/

 

I

 

 

 

 

 

 

 

 

 

 

\

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

«Роет»

 

 

 

 

15л они

37

38

39

40

41

 

42

. 43

44

45

46

 

47

48

49

50

51

52

5?

54

СУТ-2

Ш

РЦ

Ш

ПО

ш

Э

Ш

Э

Э

ПО

уб

пл

др

пп

зв

уб

уб

уб

пл

Э

ГН

бп

уд

ус

уд

ус

уд

ус

нт

Ж

ст

бс

СП

пд

НД

нд

ст

нд

НД

 

 

Т а б л и ц а

26

 

СУТ-

О О

 

©

 

О

 

©

таблица

О

©

1

 

реакций

\

А

t

А3 в 5,

f

t

«Есм

Э

АД Ш АД РЦ Ш

РЦ

ш

РЦ

уб

пл

уб

пн

уб

зв

ПП

пп

зв

гл

нт

ус

нт

бп

рд

лб

сх

УД

ст

НД

СП

НД

ДТ

нд

бс

бс

бс

 

 

в

©

о

©

1

 

/

 

«Роет»

 

 

Блоки

37

38

39

40

41

42

43

44

45

46

47

48

49

5(1

51

52

53

54

СУТ-2

Ш

ПО

ш

РЦ

III

РЦ

АД

ш

РЦ

ш

РЦ АД

РЦ

Ш

РЦ

Ш

РЦ ПО

ПО

пл

дв

зв

пп

пл

зв

зв

Дв

дв

зв

дв

ПЩ

пп

пл

пл

уб

зв

Уб

Э

лб

УС

ГН

ув

УД

гл

УД

УС

уд

гл

СХ

нт

нд

ус

нт

УС

нт

уд

Ж

от

нд

ст

ДТ

 

нд

~ *

СП

 

ДТ

от

бс

от

ВД

ст

нд

 

ДТ

/

2 3 4 5 6 7 8 9 Ю

/

1 2 3 4 5 6 7 8 9 Ю

 

 

t 2 3 4 5 6 7 8 9 Ю

1

1 1

1

1 1

11

1

11

 

/

1 I

1

1 1

2

1 1 1

2

1 1 1 1 1

 

1 1 1

 

2

1 1 1 1

 

1 1 1

3

1

1 1

1

1 1 1

3

1 1 1 1 1 1 1 1 1

 

3

1 1 1 1

 

1

1 1

4

1

1 1

1

1 1 1

4

1 1 1 1

 

1 1 1 1

 

4

1 1 1 1

 

1 1 1

5

1

1 1

1

1 1 1

5

1 1 1 1

 

1 1 1

 

5

1 1 1 1

 

1 1 1

6

 

 

 

 

6

1 1 1

1 1 1

 

6

1

 

1

 

7

 

 

 

 

7

1 1

1 1 1

 

7

 

 

 

 

8

1

1 1

1

1 1 1

8

1 1 1 1 1 1 1 1 1

1

8

1 1 1 1

 

1

1 1

9

 

 

 

1

9

 

 

 

9

 

 

 

 

W

 

 

 

 

10

 

 

 

 

10

 

 

 

 

4

Рис. 107. Разрешающие матрицы обучения М-автоматов.

 

зей (рис. 105, в). Если

в

этом

состоянии вновь

 

окажется

 

возбужденной г-модель г

(от других аналогичных

i-моделей

 

состояний или от возбудившихся

в ходе

работы

 

сети

 

неко­

 

торых из i-моделей аи ..., ап),

то возбуждение

г

передастся

 

на все г-модели at,..., ап,

связи

между

ними

проторятся

 

и конфигурация р окажется восстановленной

(рис. 105, г).

 

Таким образом, формирование i-моделей конфигураций (со­

 

стояний) обеспечивает их долговременное запоминание. Мож­

 

но предположить, что формирование новых

конфигураций

 

обусловлено поступлением в сеть новой информации. Послед­

 

нее связано с перемещением

автомата из одной

ситуации

 

в другую. Оказывается, таким

образом, что в качестве

i-мо­

 

делей состояний могут быть использованы «резервные»

i-мо­

 

дели

блока ПС. Такое их использование

обеспечивается ра­

 

ботой

алгоритма Вви при наложении следующих

 

ограниче­

 

ний: установление связей между i-моделями ситуаций и дей­

 

ствий будем считать запрещенным, а установление связей

 

между i-моделями ситуаций и всеми остальными

 

i-моделями

 

сети — разрешенным. Автомат,

реализующий

такой

режим

 

обучения (режим «памяти состояний»), обозначим

симво­

 

лом Az-

 

 

 

 

 

 

 

 

 

 

 

Исследуем эффективность различных режимов обучения,

 

помещая автоматы Ai, As

и Az в среду Si. О качестве

обуче­

 

ния будем судить по значениям введенных выше

 

оценочных

 

коэффициентов. Внешние реакции автоматов изображены на

 

рис. 106. Фрагменты внутренних реакций представлены в

 

табл. 24—26. Видно, что все

автоматы

выполнили

 

план.

 

«Трудное место», через которое не смог пройти опорный

 

вариант Ао, автоматы преодолели

с разной степенью

эффек­

 

тивности. Серию неудачных шагов автомата Ai в области

 

ячейки F можно пояснить восприятием большого количества

 

отрицательных раздражителей

(«паника»). Автомат Az в этой

 

области «вел» себя лучше, поскольку случайно

 

(выполняя

342

шаг «быстро») попал на «пищу» и «съел» ее. Ai также «на-

Соседние файлы в папке книги из ГПНТБ