книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования
.pdfна к i-модели «обобщенного» действия и определяет таким образом содержание этапа. В ходе работы М-автомата, по мере выполнения им намеченного плана, оказывается воз бужденной одна (и в каждый момент времени — только од на) i-модель этапа. По имеющейся связи возбуждение пере дается на соответствующую i-модель «обобщенного» дейст вия и далее — на i-модели действий-шагов, которыми данное «обобщенное» действие может быть реализовано. Таким об разом, i-модели шагов, удовлетворяющих плану, получают дополнительное возбуждение и вероятность их выполнения повышается. В исходном состоянии возбуждена i-модель Р\. Одновременно со структурой рис. 90 модель планирования формирует информацию о зонах расположения «ориентиров» каждого этапа, т. е. таких объектов среды, при достижении которых соответствующий этап считается выполненным, а также об ожидаемых возбуждениях i-моделей Пр и НПр
при |
выполнении каждого из этапов и примерном числе ша |
||
гов, |
необходимых для выполнения этапа. Эта информация |
||
используется при работе следящих |
систем «по |
результатам» |
|
и «по чувствам», контролирующих |
выполнение |
плана. |
|
Следящая система «по результатам» обеспечивает выпол нение следующих операций: 1) если в ходе перемещений автомата в среде оказывается воспринятым объект, отмечен ный как ориентир i-ro этапа плана, то возбуждение i-модели Pi снижается до нуля и возбуждается i-модель Pj+i; 2) если после выполнения автоматом определенного в модели плани рования числа шагов ориентир не воспринят, то возбужде ние i-модели выполняемого этапа плана снижается до нуля, получает дополнительное возбуждение i-модель НПр и ав томат в течение некоторого времени выполняет шаги без
Рис. 90. Задание плана в М-сетп.
|
учета плана («попек ориентира»). Если за |
это время |
ориен |
||||||
|
тир обнаружен, выполняется операция 1, если нет — автомат |
||||||||
|
формирует требование на построение нового плана |
(вызов |
|||||||
|
модели планирования). |
|
|
|
|
|
|||
|
Следящая система «по чувствам» постоянно производит |
||||||||
|
сравнение |
текущего |
значения |
величины |
А' = |
П'Н П р — П П р |
|||
|
с «критическим» |
значением этой величины, |
определенным |
||||||
|
в модели планирования для каждого из этапов плана. Если |
||||||||
|
текущее значение |
превышает |
критическое, |
автомат |
форми |
||||
|
рует требование на построение нового плана. Отметим, что |
||||||||
|
новый план будет построен с учетом сложившегося состоя |
||||||||
|
ния сферы эмоций автомата и может отличаться от преды |
||||||||
|
дущего. |
|
|
|
|
|
|
|
|
|
Алгоритмы, реализующие описанные операторы, включе |
||||||||
|
ны в программу так, как показано на блок-схеме рис. 56. |
||||||||
|
Дополним теперь приведенное ранее описание блока по |
||||||||
|
нятийных обобщений исследуемого М-автомата. При задании |
||||||||
|
начальной структуры этого блока были использованы сведе |
||||||||
|
ния о характере и числовых параметрах связей, |
полученные |
|||||||
|
при исследовании модели формирования понятий |
(§ 5, гл. 9). |
|||||||
|
Данные этого исследования нетрудно обобщить на случаи |
||||||||
|
формирования иерархических понятийных структур и поня |
||||||||
|
тий по различным признакам. На рис. 91 приведено схема |
||||||||
|
тическое изображение принятой нами структуры «системы |
||||||||
|
знаний» автомата. Кроме «системы знаний», блок понятий |
||||||||
|
ных обобщений содержит субблок «мотивации принятия ре |
||||||||
|
шений», или просто блок «решений». (Это название удобно |
||||||||
|
ввиду его краткости, |
однако неточно, поскольку г-моделями |
|||||||
|
возможных |
решений |
автомата |
являются, |
|
вообще |
говоря, |
||
|
г-модели его действий, а мотивация принятия решений, т. е. |
||||||||
|
выбора действий, задается в каждый момент времени струк- |
||||||||
314 |
турой и состоянием |
всей М-сети автомата.) |
Заданием опре- |
||||||
деленной структуры блока решений в автомат введена «па мять» о его гипотетическом прошлом опыте. Схематически фрагмент этой структуры изображен на рис. 92, где зна ки и —С обозначают связи с преимущественно усиливаю щим и тормозным компонентами соответственно. Схема де монстрирует влияние на выбор решения состояния воспри
нимающей и эмоциональной сфер. Отметим, что |
«выбор» |
(т. е. возбуждение) той или иной i-модели решений |
не озна |
чает еще выполнения соответствующих действий, а лишь создает благоприятные условия для их выбора СУТ. Состоя ние остальной части М-сети может обусловить выполнение других действий. Аналогичные структуры построены для вы бора решений «есть» и «нести», «спать» и «создать убежи ще». При работе автомата в блоке могут устанавливаться новые связи и меняться проходимости заданных — «опыт» может изменяться.
Числовые характеристики блоков М-сети автомата пред ставлены в табл. 15. Формула автомата: Р^ПиСгооЭюЖбД!^. На рис. 93 приведена уточненная блок-схема автомата. Обо значения на схеме соответствуют табл. 15 (ПР — блок при-
Рнс. 92. Фрагмент структуры блока принятия решений.
Блок ПО
|
|
Т а б л и ц а |
15 |
|
||
|
|
Обозна |
К-во |
Число |
||
Блоки |
чение |
|||||
(-моделей |
уровней |
|||||
|
|
блоков |
||||
|
|
|
|
|
||
Приема |
инфор |
Р |
|
82 |
1 |
|
мации |
|
ПО |
|
44 |
3 |
|
Понятийных |
|
|||||
обобщений |
ПС |
|
200 |
2 |
||
Памяти |
ситуа |
|
||||
ций |
|
э |
|
|
|
|
Эмоций |
|
|
16 |
1 |
||
Желаний |
|
ж |
|
6 |
2 |
|
Действий |
|
д |
|
41 |
2 |
|
Примечание
Содержит i-модели объектов, аапахов,
ощущений Содержит субблок принятия решений, за
дана начальная организация
Задана начальная организация
Задана начальная организация Содержит ('-модели действий-шагов, дейст вий «нападать», «активных» действий, эта пов плава. Задана начальная организа ция
нятия решений). Отдельно показаны различные уровни бло ков ПО и ПС. Линии на схеме и штриховка указывают, что между t'-моделями соединенных блоков и внутри заштрихо ванных связи задаются на этапе предорганизации. Введена нумерация блоков, которая понадобится в дальнейшем. Мес та, где связи вводятся на уровне предорганизации, обозна чены буквами а, б и т. д. Связи, помеченные буквой а, вводятся на основании данных, полученных в § 5 гл. 8, их
Среда
|
fill, „шаги" „нападать", |
|
ю |
„активные" действия |
д |
316 |
Среда |
Рис. 93. Уточненная блок-схе |
ма М-автомата МОД. |
|
схема приведена на рис. 91. Связи, помеченные буквой б, |
||
|
вводятся на основании данных § 3 гл. 8. Схема связей, по |
||
|
меченных буквой в, проиллюстрирована на рис. 92. Связи, |
||
|
помеченные буквой г, задают предорганизацию «эмоцио |
||
|
нального» канала переработки |
информации. Представление |
|
|
о структуре этого канала дают рис. 21, 23 в работе [3] и, бо |
||
|
лее конкретно, схема на рис. |
94. Связи, |
помеченные бук |
|
вой 5, задают автомату план |
действий, |
разный в различ |
|
ных экспериментах; связи д вводятся по типу рис. 90. |
||
|
Из схемы рис. 87 видно, что этап предорганизации зани |
||
|
мает важное место в построении модели и что после выпол |
||
|
нения этого этапа автомат оказывается способным органи |
||
|
зовать некоторое поведение. Между блоками Р и Д имеются |
||
|
два пересекающихся канала |
информации — «логический» |
|
|
(понятийный) и «эмоциональный». Таким образом, восприя- |
||
317 |
тие некоторой информации в блоке Р может вызвать выпол- |
||
нение действия. Информация о результатах этого действия воспринимается блоком Р в виде соответствующего измене ния среды. Система оказывается замкнутой. Очевидно, ха рактер поведения автомата определяется характером предорганизации. Поскольку предорганизацпя является сущест венным этапом работы, во многом предопределяющим ее конечный результат, необходимо провести проверку «качест ва» принятого варианта. Выполним эту проверку путем ис следования поведения предорганизованного автомата в не которой среде, причем исключим из алгоритма А все опера ции, связанные с обучением сети. В случае, если поведение автомата окажется удовлетворительным, будем считать удов летворительным и принятый вариант предоргапизации и не будем изменять его при всех дальнейших экспериментах. Такой (необучающийся) вариант М-автомата назовем опор ным.
Прежде чем приступить к исследованию предоргапизации модели, необходимо определить способы представления и об работки информации о ее функционировании.
§ 2. Способы представления |
и обработки |
результатов |
Пусть предорганизованный М-автомат находится в ситуации, представленной на рис. 95 (напомним, что используются обозначения раздражителей, введенные в табл. 6). Исклю чим из алгоритма А все операции, связанные с обучением сети. Для этого достаточно придать нулевые значения вво димым параметрам обучения. Тогда характер реакций авто мата будет определяться особенностями его предорганизации. Будем различать внешние и внутренние реакции. В рассмат риваемом случае внешней реакцией автомата является выполнение им некоторого действия dt из множества возмож ных действий D. К выбору действия di приводит переработ ка информации, воспринятой автоматом. Внутренние реак ции автомата состоят в изменении возбужденностей всех i-моделей сети. С этими изменениями связаны также пере ключения на различные сферы и i-модели системы усиле ния — торможения. Таким образом, внутренние реакции опи-
о
• © ©
318 Рис. 95. Тестовая ситуация.
сывают ход процесса переработки информации, приводящего к выбору du Рассмотрение внутренних р е а к ц и й позволит, очевидно, более полно представить работу автомата. Начнем поэтому с анализа именно этих реакций .
Б у д е м рассматривать |
внутренние |
р е а к ц и и автомата |
в те |
чение некоторого времени с момента |
выполнения и м опера |
||
ц и й осмотра ситуации . |
Ч т о б ы исключить на это время |
вы |
|
полнение в н е ш н и х реакций, «затормозим» двигательную сферу
сети пу т ем , например, п р и д а н и я малых значений |
коэффи |
циентам Кп всех i-моделей действия. Внутренние |
р е а к ц и и |
автомата на восприятие ситуации рис. 95 в течение |
10 мо |
ментов дискретного времени представлены на рис. 96—100. В ы ш е м ы зафиксировали некоторую (вообще говоря, про извольную) содержательную интерпретацию рассматривае мой задачи. В рамках этой интерпретации проведена и предоргапизацпя модели. Поэтому содержательное описание внут
ренних реакций автомата проведем, используя |
|
введенную |
|||||||||
ранее терминологию . П р и содержательном |
описании |
г р а ф и к и |
|||||||||
на рис. 96—100 отображают |
«ход мыслей» |
некоторого |
услов |
||||||||
ного субъекта, обладающего |
фиксированным набором |
«поня |
|||||||||
т и й » , «чувств», «желаний» и т. п. «Ход мыслей» |
|
субъекта |
|||||||||
вызван |
восприятием определенных |
раздражителей |
|
из |
окру |
||||||
ж а ю щ е й |
среды. Результатом «мышления» |
является |
|
принятие |
|||||||
р е ш е н и я о выполнении некоторого |
действия. |
И н т е р п р е т а ц и я |
|||||||||
р е а к ц и й |
основана на том, что возбужденность |
к а ж д о й |
i-мо |
||||||||
дели сопоставляется с н а п р я ж е н н о с т ь ю |
(выраженностью, |
||||||||||
субъективной |
важностью) |
«мыслей» |
субъекта о |
соответст |
|||||||
в у ю щ е м |
объекте ил и состоянии. Наиболее в а ж н ы е |
|
«мысли» |
||||||||
(наиболее возбужденные i-модели) |
|
«осознаются» |
субъектом |
||||||||
(выбираются |
С У Т ) . Менее |
в а ж н ы е |
составляют |
«подсозна |
|||||||
ние» . |
|
|
|
|
|
|
|
|
|
|
|
Ситуация, |
в которой находится |
автомат, содержит |
всего |
||||||||
п я т ь раздражителей, из которых |
тр и относятся |
к |
классу |
||||||||
«зверь», |
четыре — «препятствие», |
два — «пища» |
и |
один — |
|||||||
«убежище» . Два раздражителя («зверь |
А » и |
«зверь В») |
|||||||||
абсолютно н е п р и я т н ы , два имеют смешанный характер и один абсолютно приятен . С и т у а ц и я , т а к и м образом, весьма неоднородна и может вызвать противоречивые «стремления»
и«мысли».
На рис. 96 представлены кривые возбуждения i-моделей блока п о н я т и й н ы х обобщений. Вид этих к р и в ы х допускает следующую содержательную интерпретацию . В первый после
осмотра |
момент |
возбуждены «мысли» о раздражителях, имею |
щ и х с я |
в среде. |
Степень их возбужденности одинакова — |
выполняется фиксация ситуации . В следующий момент про
исходит «узнавание» раздражителей и возбуждаются |
i-моде |
л и п о н я т и й первого уровня (см. рис. 91) — возникают |
«мыс |
л и » : «зверь», «пища», «дерево», «убежище» . И х степень воз-
бужденности уже неодинакова — наиболее выраженной ока
зывается |
«мысль» о «звере», менее выраженной — о |
«пище» |
и т. д. Это обусловлено различным Представлением |
соответ |
|
ствующих |
раздражителей в ситуации. В дальнейшем |
(начи |
ная с £з) здесь будет сказываться влияние эмоциональных оценок, вырабатываемых в блоке Э. Процесс «узнавания» раздражителей продолжается, и в момент is возбуждаются понятия высшего уровня — «препятствие» и «полезное». На чиная с этого момента «мысли» о «звере», «пище», «препят ствии» и «полезном» остаются ведущими, причем работа СУТпо и изменения эмоциональных состояний приводит к временному доминированию то одной, то другой пз них. Остальные же «мысли» играют меньшую роль, т. е. оказы вают меньшее влияние па выбор действия. Начиная с мо мента tz формируются представления о количественной нагруженности среды раздражителями: возбуждаются i-моде ли «много зверей», «много пищи» и т. п. Видно, что степень их возбужденности адекватна ситуации. Хорошо выражена ритмика возбуждения всех i-моделей, что обеспечивается функционированием алгоритмов СУТ-2 и СУТпо. Из рисунка видно, что основную роль в переработке информации играют понятия высших уровней.
На рис. 97 представлены кривые возбуждения i-моделей блока эмоций. В момент U эмоциональная оценка еще не выработана и i-модели блока не возбуждены. Наиболее воз бужденными в следующий момент оказываются «страх» и «гнев». Их возбуждение обусловлено «безусловной реак цией» автомата на восприятие раздражителей класса «зверь».
Рис. 96. Внутренние реакции МОД в тестовой си туации. Блок понятийных обобщений.
Рис. 97. Внутренние реакции МОД в тестовой ситуации. Блок эмоций.
|
Этим «чувствам» соответствуют два основных вида реакций |
||||||||
|
автомата |
на опасность — пассивно оборонительная |
(«страх» |
||||||
|
включает «программу побега») и активно оборонительная |
||||||||
|
(«гнев» включает «программу нападения»). При этом |
||||||||
|
«страх» вызывается прежде всего восприятием раздражите |
||||||||
|
лей «зверь А» и «зверь В», по условию |
наиболее |
опасных |
||||||
|
для модели, а «гнев» — восприятием |
съедобного |
«зверя |
С», |
|||||
|
на которого нужно «напасть», чтобы его можно было, |
||||||||
|
«съесть». |
В ходе |
переработки |
информации выработанные |
|||||
|
оценки меняются: |
«страх» постепенно |
исчезает |
(поскольку |
|||||
|
наличие |
в среде «убежища» вызывает «чувства» |
«уверен |
||||||
|
ности» и «безопасности»), а «гнев» становится менее интен |
||||||||
|
сивным, уходит в «подсознание», хотя и поддерживается на |
||||||||
|
сравнительно высоком уровне, поскольку его возбуждение |
||||||||
|
необходимо для овладения съедобным «зверем». Таким об |
||||||||
|
разом, действие «нападать» является одним из возможных |
||||||||
|
решений автомата, поддерживаемым «пищевым рефлексом». |
||||||||
|
Связь «гнева» с этим рефлексом позволяет ожидать, что- |
||||||||
|
«гнев» будет возбужден тем сильнее, чем больше будет на |
||||||||
|
пряжен «пищевой рефлекс», Напряженность последнего ото |
||||||||
|
бражается в сети возбуждением i-модели «чувство голода». |
||||||||
|
Таким образом, возбуждения «голода» и «гнева» должны |
||||||||
|
коррелировать друг |
с другом. Такая |
(положительная) |
кор |
|||||
|
реляция |
и наблюдается в эксперименте. Характерно, что |
|||||||
|
i-модели |
«гнев» и |
«чувство голода» |
непосредственно |
друг |
||||
|
с другом не связаны. Это дает основания полагать, что сово |
||||||||
|
купность связей между i-моделями чувств удовлетворптель- |
||||||||
321 |
но отражает работу |
механизмов |
пищевого рефлекса. |
|
|||||
1/2 11 3-1176
|
Рис. 98. Внутренние реакции МОД в тестовой си |
|
|
|
|
|
||||||||||||
|
туации. Блок |
желаний. |
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
Изложенные рассуждения приведены в качестве приме |
|||||||||||||||||
|
ра, иллюстрирующего возможность и способы содержатель |
|||||||||||||||||
|
ной интерпретации числовых результатов просчета модели. |
|||||||||||||||||
|
Кривые рис. 97—100 могут служить основанием для целого |
|||||||||||||||||
|
ряда такого рода рассуждений, которые мы приводить здесь |
|||||||||||||||||
|
не будем. Отметим лишь несколько интересных моментов. |
|||||||||||||||||
|
Как указывалось ранее, возбуждение i-модели «голод» дис |
|||||||||||||||||
|
кретно увеличивается в каждый момент времени |
(от |
«тела») |
|||||||||||||||
|
и в данном |
эксперименте |
в |
момент |
времени |
iio составило |
||||||||||||
|
40 усл. ед. i-Модель «чувства |
голода» |
в блоке |
Э связана |
как |
|||||||||||||
|
с i-моделью «голод», так и с i-моделямп других чувств. Пред |
|||||||||||||||||
|
ставленные на рисунках возбуждепия «чувства голода» со |
|||||||||||||||||
|
ответствуют, |
таким |
образом, |
«субъективному» |
восприятию |
|||||||||||||
|
модели и возникают «рефлекторно» прп восприятии раздра |
|||||||||||||||||
|
жителей класса «пища». i-Модель чувства «близость цели» |
|||||||||||||||||
|
также возбуждается дискретно и пропорционально расстоя |
|||||||||||||||||
|
нию от собственной ячейки до ближайшего ориентира. Она |
|||||||||||||||||
|
также |
«субъективно» |
переживается |
автоматом |
в |
зависимос |
||||||||||||
|
ти от его состояния. |
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
Рассмотрение графиков показывает, что при переработке |
|||||||||||||||||
|
информации автомат меняет характер оценки воспринятой |
|||||||||||||||||
|
ситуации. Действительно, примерно до момента |
t5 |
ведущую |
|||||||||||||||
|
роль играют возбуждения «негативно окрашенных» чувств, |
|||||||||||||||||
|
затем они существенно затухают и преимущество получают |
|||||||||||||||||
|
«положительные» |
чувства. Соответственно |
изменяются п воз |
|||||||||||||||
|
буждения |
интегрирующих |
центров |
Пр. и |
НПр. |
Переоценка |
||||||||||||
' |
осуществляется |
в |
период |
£5 — h |
и является |
устойчивой, |
по |
|||||||||||
|
скольку |
разность |
Ппр — Пнпр |
монотонно |
|
возрастает |
во |
|||||||||||
|
времени. Такая «установка» модели на первоочередное вы |
|||||||||||||||||
|
деление негативных свойств ситуации отображает домини |
|||||||||||||||||
|
рующее влияние «оборонительного рефлекса», представлен |
|||||||||||||||||
|
ного, |
как |
и |
«пищевой |
рефлекс», |
|
совокупностью |
связей |
||||||||||
|
в М-сети. Как и следовало ожидать, неоднородность раздра- |
|||||||||||||||||
322 |
жителей |
воспринятой ситуации |
привела |
к |
одновременному |
|||||||||||||
