Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования

.pdf
Скачиваний:
13
Добавлен:
25.10.2023
Размер:
17.04 Mб
Скачать

времени. Соответственно, при реализации модели двигатель­ ного поведения с помощью необучающегося М-автомата спо­ собности к экстраполяции представлены в ней не будут. Та­ кой автомат может, вообще говоря, организовывать поведение и в динамической среде, однако принимаемые им решения будут основываться лишь на анализе данных одномомент­ ных восприятий ее состояния. Иначе говоря, необучающийся М-автомат будет воспринимать динамическую среду как дискретную последовательность статических сред. При этом он окажется не в состоянии выделить общие закономер­ ности происходящих изменений и, следовательно, не сможет использовать их при планировании и принятии решений.

При использовании М-автомата с обучением и самоорга­ низацией дело обстоит несколько иначе. В этом случае ав­ томат также не содержит специальных i-моделей и функцио­ нальных структур, обеспечивающих функцию предсказания. Однако в процессе его самоорганизации элементы такого рода могут быть сформированы. В дальнейшем эта возмож­ ность будет проиллюстрирована экспериментальным иссле­ дованием процесса повторения последовательностей М-авто- матом. Значение этого примера состоит в том, что способ­ ность к повторению последовательности предполагает наличие в автомате внутренней информационной модели соответ­ ствующего временного процесса. С другой стороны, сущест­ вование такой модели является необходимым условием также и любого предсказания. Следовательно, определенные воз­ можности воспроизведения программ ориентировки во вре­ мени возникают при использовании М-автоматов даже без специальной предорганизацпи. Можно полагать, таким обра­ зом, что поведение обучающихся М-автоматов в динамиче­ ских средах будет отличаться от поведения необучающихся, являясь более «разумным». Последовательным изучением этого вопроса мы, однако, не занимались, ограничиваясь на начальных этапах моделирования изучением основных свойств М-автоматов, проявляющихся при их функциониро­ вании в сравнительно простых статических средах.

Окончательный вариант модели двигательного поведения. Итак, после всех введенных ограничений окончательный ва­ риант модели двигательного поведения может быть кратко описай следующим образом.

Модель выполняется в виде программы для ЦВМ и со­ держит две подсистемы: машинную среду и М-автомат. Ма­ шинная среда является статической и задается в виде упоря­ доченной совокупности клеток, каждая из которых может быть либо пустой, либо содержать в себе один из объектов, в различной степени «полезных» или «опасных» для авто­ мата. Машинная среда может являться моделью некоторых естественных сред.

6 3—1176

М-автомат является моделью некоторого (условного) субъекта, осуществляющего двигательное поведение в есте­ ственной среде, соответствующей машинной. М-сеть автома­ та предварительно организована и содержит i-модели объек­ тов, которые имеются в среде, г-модели действий, которые он может выполнить, а также г-модели, соответствующие различным образам, понятиям, чувствам, эмоциям и жела­ ниям моделируемого субъекта.

В каждый момент дискретного времени автомат нахо­ дится в одной пз клеток среды и может производить ее «осмотр». «Поле зрения» автомата (количество одновремен­ но рассматриваемых клеток среды) ограничено. В процессе осмотра автомат перемещает поле зрения по клеткам среды, причем воспринпмает тем меньше признаков объектов, чем они дальше от него.

На основе данных осмотра автомат намечает цель (клет­ ку пли совокупность клеток среды), достижение которой позволит удовлетворить его стремление к пище, отдыху, без­ опасности п т. п. Автомат может формировать ташке иерар­ хии целей. Затем он строит планы достижения целей и при­ нимает решение о выполнении того из них, который наибо­ лее полно удовлетворяет ряду формируемых автоматом критериев. В качестве критериев могут выступать безопас­ ность маршрута, его длина и т. п.

Построив план, автомат приступает к его выполнению, передвигаясь из одной клетки среды в другую. При этом считается, что поле его зрения ограничено клетками, сосед­ ними с той, в которой он находится в каждый данный мо­ мент. В процессе передвижения автомат принимает решения о выполнении в каждый момент одного из возможных дей­ ствий, а также о коррекции или полной перестройке имею­ щегося плана.

Передвигаясь в среде, автомат стремится избегать опас­ ных объектов, чередует движение и отдых, удовлетворяет голод, преодолевает препятствия и т. п. Автомат способен использовать собственный прошлый опыт. Мотивом его дея­ тельности служит задаваемое ему изначально стремление

ксамосохранению.

Вразличных вариантах модели двигательного поведения описанный сюжет представлен с различной степенью пол­ ноты.

Из приведенного описания следует, что функции, реали­ зуемые автоматом, могут быть отнесены к таким основным видам проявлений разумной деятельности: направленное восприятие, целеполагание и планирование, принятие реше­ ний при организации конкретных действий в среде.

В автомате воспроизводятся следующие из основных про­ грамм переработки информации мозгом человека (изложение

ведется в соответствия с разработкой этого вопроса, данной

вработе [5, стр. 63—121]).

1.Программа восприятия внешней информации. В ав­ томате эта программа представлена такими подпрограмма­ ми: настройка анализаторов (при организации осмотра сре­ ды), узнавание (возбуждение i-моделей объектов, если восприняты их признаки, а также возбуждение i-моделей понятий более высокого уровня, если восприняты объекты); запоминания (формирование новых i-моделей и связей в М-сети, а также формирование внутренней модели среды); вспоминания (выделение СУТ i-моделей отдельных образов объектов, их совокупностей и последовательностей, а также понятий различных уровней); предвидения (формирование «цепочек» i-моделей, отражающих последовательности вос­ принимаемых событий, и влияние возбуждения таких «це­ почек» на процессы в сети).

2.Программа чувств. Представлена в автомате процес­ сами возбуждения i-моделей чувств «от тела»: передачей возбуждения между i-моделями чувств и i-моделями образов, понятий, желаний и действий, что составляет «эмоциональ­ ный» компонент процесса переработки информации М-сетью; установлением новых связей между i-моделями чувств и дру­ гими i-моделями сети. Основные подпрограммы этой про­

граммы связаны с инстинктами и сложными рефлексами. В автомате представлен инстинкт самосохранения с его под­ программами защиты и питания. Из подпрограмм, соответ­ ствующих сложным рефлексам, представлены рефлекс цели, обеспечивающий общую направленность деятельности ав­ томата, рефлекс свободы, организующий деятельность ав­ томата по преодолению имеющихся в среде препятствий и ограничений, и рефлекс любопытства, определяющий струк­ туру процессов осмотра среды.

3. Программа действий. Представлена в автомате сово­ купностью простых безусловных рефлексов и подпрограмм: связывания (формирование условных рефлексов), предвиде­ ния (формирование плана), контроля действий (функциони­ рование во время выполнения плана следящих систем «по чувствам» и «по результатам»), многоуровневого анализа вариантов (наличие в М-сети i-моделей действий различной степени общности — от «идей» до «элементарных» действий и связь этих i-моделей с другими); построение планов раз­ ных уровней.

4. Программа сознания. Представлена в автомате подпро­ граммами внимания (СУТ), ориентирования в пространстве (построение и использование внутренней модели среды), во­ левого действия (наличие i-моделей желаний, чувств и дей­ ствий, построение плана и выполнение его с преодолением препятствий, а также автономный выбор цели, построение

6*

иерархии целей и последующие изменения их), отделения реального и нереального (при обращении к внутренней мо­ дели среды и планировании), моделирования собственных действий (при планировании).

Упомянутые программы имеют следующие общие черты: в исходном состоянии автомата все они задаются введением

в

М-сеть определенных «врожденных» i-моделей и связей,

а

для неполных автоматов — специальных алгоритмов. Об­

щим принципом организации всех программ является этаж­ ность, или многоуровневость. В процессе работы М-автомата программы могут усложняться и дополняться за счет форми­ рования новых i-моделей и связей. Каждая программа реали­ зуется определенными, «свопмп» i-моделями и связями. Одни и те же i-модели п связи могут участвовать в реализации различных программ.

Следует отметить, что приведенное перечисление про­ грамм и подпрограмм не является полным. С одной стороны, различные подпрограммы представлены в рамках принятого

сюжета моделирования в разной степеип, причем

некото­

рые — в весьма незначительной. С другой стороны,

автомат

реализует много других, не отмеченных при перечислении

подпрограмм, принадлежащих

более

низкому

(по сравне­

нию с упомянутыми) уровню.

Более

полное

представление

об объеме программ можно составить на основе подробного рассмотрения работы его конкретных действующих реализа­ ций, описание которых приводится ниже. Посмотрим теперь, в какой степени предлагаемая модель двигательного поведе­ ния соответствует общим требованиям к моделям гипотез (см. выше).

Одно из основных требований состоит в том, что модель должна воспроизводить действительно сложные виды чело­ веческой деятельности. В противном случае она не может быть использована для проверки эффективности исходной ги­ потезы. Мы полагаем, что перечисление программ перера­ ботки информации, реализуемых с помощью предлагаемого автомата, свидетельствует о достаточной сложности решае­ мых проблем, так что первое требование можно считать вы­ полненным.

Требуется далее, чтобы на основе исследования модели можно было определить область практического применения проверяемых с ее помощью принципов исходной гипотезы. Уже упоминалось, что рассматриваемая нами условная за­ дача организации двигательного поведения М-автоматом по своей структуре и проблематике весьма близка к практиче­ ской задаче автоматизации управления передвижением в естественной среде различного рода информационных и тран­ спортных средств. Иначе говоря, наша вычислительная мо­ дель М-автомата может быть рассмотрена как -действующий

макет реального устройства управления движением, а полу­ ченные результаты могут быть непосредственно использова­ ны при конструировании такого устройства. Можно также отметить, что принципы построения М-автоматов могут быть применены при решении класса практических задач, интер­ претируемых как общая задача поиска путей в простран­ ствах параметров произвольной природы. Класс таких задач достаточно широк, и в него входит ряд важных задач авто­ матического управления. Вопросы практического использова­ ния разработанной модели мы еще рассмотрим в дальней­ шем. Сказанного, однако, достаточно, чтобы уже теперь считать выполненным обсуждаемое требование.

Следующее важное требование предполагает перспектив­ ность модели. Выполнение этого требования обеспечивается тем обстоятельством, что воспроизводимые в предлагаемом автомате программы переработки информации лежат в осно­ ве более сложных проявлений разумной деятельности чело­ века (труд, речь). Подробнее этот вопрос обсуждался выше (см. «Второе ограничение»). Задачи воспроизведения более сложных видов деятельности могут, следовательно, решаться путем дальнейшего развития и усложнения предлагаемой модели и с учетом результатов, полученных при ее исследо­ вании.

Основные требования, предъявляемые к предлагаемой модели, оказываются, таким образом, выполненными, что позволяет использовать приведенное выше описание сюжета моделирования в качестве содержательной основы для по­ строения действующей модели двигательного поведения. Формальная постановка задачи моделирования дана в рабо­ те [6].

ЧАСТЬ ВТОРАЯ

Эксперимен­

тальное

исследование

поведения М-автоматов

Раздел III

М-АВТОМАТ РЭМ. ФОРМИРОВА­ НИЕ ДВИГА­ ТЕЛЬНОГО ПОВЕДЕНИЯ

Нами разработаны два варианта действующей модели дви­

гательного поведения. Первый из

них — М-автомат РЭМ.

С помощью этой модели необходимо

было экспериментально

проверить наиболее важные представления исходной гипоте­ зы: принципы организации М-сети как устройства, осуще­ ствляющего параллельную переработку информации; прин­ ципы работы СУТ и ее роль ъ функционировании М-автома­ та; способы организации взаимодействия между М-сетью и алгоритмическими (функциональными) моделями, т. е. ме­ тоды построения неполных М-автоматов; многоуровневую структуру информационных систем, реализующих процессы принятия решений, и др.

Экспериментальное исследование РЭМа должно было от­ ветить на вопрос о том, в какой мере эффективен предлагае­ мый подход к построению систем искусственного разума, а также определить пути дальнейшего усовершенствования модели.

При разработке РЭМа были введены дополнительные ограничения на сюжет моделирования и набор воспроизводи­ мых автоматом программ переработки информации. В част­ ности, РЭМ реализован как необучающийся и неполный М-автомат. Одна его часть, воспроизводящая процессы вос­ приятия и планирования, выполнена в виде алгоритмической модели, а другая, воспроизводящая процессы принятия ре­ шений в ходе выполнения плана,— в виде полного М-автома­ та. Обе части относительно самостоятельны и могут быть названы моделями планирования и выполнения плана соот­ ветственно.

Функционирование РЭМа как целостной модели двига­ тельного поведения организуется в ходе последовательного (поочередного) функционирования моделей планирования и выполнения плана. Автомат представляет собой упрощен­ ный вариант модели двигательного поведения, ее, так ска­ зать, первое приближение.

Название автомата — РЭМ — относится к целому классу автоматов, задаваемых одним и тем же описанием (про­ граммой) .

Глава 6

МОДЕЛЬ

ДВИГАТЕЛЬНОГО

ПОВЕДЕНИЯ

РЭМ

Разработка этой моделп рассматривалась нами как первый этап создания «разумного» автомата. В связи с этим мы су­ щественно ограничили функции РЭМа и отразили в нем только наиболее важные, с нашей точки зрения, программы переработки информации, необходимые для организации це­ ленаправленного двигательного поведения в средах, близких к естественным.

§ 1. Блок-схема модели

Общая блок-схема модели РЭМ показана на рис. 11. Автомат помещен в среду, каждая клетка которой может содержать не более одного объекта. Количество различных типов объек­ тов фиксировано. В среде РЭМ может совершать только действия по -перемещению из одной клетки в другую — со­ седнюю. Прп этом он может «ходить» как по пустым, т. е. не содержащим объекты, клеткам, так и по тем клеткам, в которых уже находится какой-либо объект. Однако это толь­ ко принципиальная возможность «свободы действий». За­ дачей РЭМа является выбор такого пути передвижения, ко­ торый обеспечил бы ему сохранение целостности и минимум отрицательных «эмоциональных переживаний». Иначе гово­ ря, ему не безразлично, какие действия-шаги выполнять в тех пли иных ситуациях.

В М-сети РЭМа имеются i-модели всех типов объектов

внешней среды, и восприятие

одного из

них

отражается

в возбуждении соответствующей

i-моделн.

Блок

восприятия

организован таким образом, что для каждого пространствен­ ного положения объекта относительно автомата существует

своя i-модель. Это позволяет автомату не только

«узнавать»

объекты, но п учитывать их пространственную

ориентацию

прп выборе определенных действий. Процесс

восприятия

РЭМом информации из внешней среды назовем

«осмотром».

В поведении РЭМа можно выделить два основных эта­

па — выбор плана

передвижения

и выполнение

этого плана.

В соответствии со

спецификой

каждого этапа

существуют

и два режима работы блока восприятия, т. е. два различных режима осмотра внешней среды. Общая цель движения за­ дается РЭМу экспериментатором в виде координат опреде­ ленной клетки среды. В процессе планирования автомат про­ изводит осмотр достаточно большого участка среды и в том случае, если конечная цель движения находится за преде­ лами этого участка, намечает себе промежуточную цель и строит план ее достижения. При выполнении плана, т. е. при непосредственном передвижении в среде, РЭМ после каждого шага осматривает только окружающие его клетки среды. На основе воспринятой при осмотре информации и ранее выработанного плана он принимает решение о выпол­ нении следующего действия-шага.

Как видно из блок-схемы РЭМа, информация о результа­ те осмотра (в случае планирования) или о плане и осмотре (в случае выполнения плана) не является единственной, на основе которой автомат принимает решения о действиях в среде. Прежде чем принимается какое-либо решение, вос­ принятая информация подвергается «логической» и «эмоцио­ нальной» оценкам в блоках эмоциональной оценки и поня-

 

 

Рис. 11. Блок-схема

 

Блок

модели РЭМ.

 

 

 

планирования

 

Блок

Блок

 

эмоциональной

понятийных

 

оценки

обобщений

 

 

Блок

 

Блок

принятия

 

восприятия

решений

 

Среда

т

 

 

 

тийпых обобщений. Это обеспечивает автомату, во-первых, возможность учитывать свой предыдущий опыт, выражен­ ный в структуре М-сети и определенном распределении воз­ буждений составляющих ее i-моделеп, и, во-вторых, возмож­ ность самостоятельно оценивать значимость воспринятой информации. Таким образом, каждое принимаемое автома­ том решение о выборе определенного этапа плана или кон­ кретного действия-шага является результатом сложных и взаимосвязанных процессов, протекающих в его М-сети.

 

При разработке РЭМа намеренно были исключены из

 

рассмотрения такие важные аспекты разумного поведения,

 

как обучение,

самоорганизация, ориентирование

во времени

 

и т. п. Это позволило создать сравнительно простую модель,

 

разработка и исследование которой могли быть

проведены

 

без больших затрат

времени. В то же время представленные

 

в РЭМе программы

переработки

информации

достаточно

 

полно отражают основные положения исходной

гипотезы,

 

и экспериментальное исследование автомата позволило оце­

 

нить эффективность их использования в более сложных ва­

 

риантах моделей разумного поведения;

 

 

Построение РЭМа в виде необучающегося

М-автомата

 

обусловило необходимость ряда ограничений в его структуре

 

и функциях. Так, например, мы вынуждены были отказаться

-*

от введения в автомат программ, связанных с активной дея­

 

тельностью

в

среде, существенно

ограничили

количество

 

i-моделей в М-сети, упростили характеристики i-моделей и

 

связей. Кроме того, некоторые функции РЭМа оказалось

 

более удобным

представлять в виде алгоритмических описа­

 

ний. Прежде всего это относится к функции планирования.

 

Предварительные исследования показали, что реализация

 

процесса планирования в М-сети принципиально

осуществи-

171

ма, однако

требует

значительных

затрат времени, больших

объемов оперативной памяти ЦВМ и, самое главное, непер­ спективна без реализации функций обучения и самооргани­ зации. Поэтому блок планирования РЭМа выполнен в виде функционального описания соответствующего процесса.

Таким образом, РЭМ является неполным иеобучающимся М-автоматом, в котором блоки восприятия, понятийных обоб­ щений, эмоциональной оценки и принятия решений пред­ ставлены в виде взаимосвязанных сфер М-сети, а блок пла­ нирования — в виде взаимодействующего с сетью алгоритма. Использование принципиально отличного от сетевого способа реализации функций плаппрования в автомате позволило оценить возможность п эффективность построения неполных М-автоматов. Оказалось, что организация оперативного взаи­ модействия алгоритмических и сетевых блоков автомата может быть осуществлена сравнительно простыми средства­ ми. Этот вывод был использован нами в дальнейших рабо­

тах по созданию систем, способных к

разумному пове­

дению.

 

 

 

 

 

Несмотря

на

то что

РЭМ

выполнен

в виде неполного

М-автомата,

его

основой

все

же является

М-сеть. Имеипо

в результате протекающих в сети процессов производится оценка воспринимаемой пзвне информации, учет плана п опыта предыдущей деятельности п выработка новых реше­ ний о выполнении конкретных действий пли выборе нового плана поведения. То обстоятельство, что одна и та же М-сеть используется п при планировании, и при выполнении плана, позволяет автомату стропть такие планы поведения, которые соответствуют его «субъективному» восприятию среды. В процессе движения «эмоциональная» оценка тех или иных объектов среды может измениться, что приведет к необходимости коррекции или перестройки плана. В этом случае новый план будет построен уже с учетом изменив­ шихся «эмоциональных» оценок объектов.

Эффективность различных действий автомата в значи­ тельной мере зависит от того, каким образом организована его М-сеть, т. е. насколько обоснованно п согласованно с об­ щей задачей автомата выбраны i-модели и связи сети, их характеристики и законы взаимодействия. Для необучающегося М-автомата этап задания организации М-сети является наиболее важным, поскольку в процессе функционирования структура сети автомата остается неизменной. Именно по­ этому подробное описание автомата РЭМ мы начнем с рас­ смотрения принципиальной схемы структуры и динамики его М-сети. Конкретные содержательные интерпретации объ­ ектов среды, в которой функционирует РЭМ, и содержатель­ ное описание структуры сети автомата будут приведены не­ сколько позже. На этом этапе, т. е. при описании принци­ пиальной схемы М-сети, будем пользоваться пока только

Соседние файлы в папке книги из ГПНТБ