![](/user_photo/_userpic.png)
книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования
.pdfвремени. Соответственно, при реализации модели двигатель ного поведения с помощью необучающегося М-автомата спо собности к экстраполяции представлены в ней не будут. Та кой автомат может, вообще говоря, организовывать поведение и в динамической среде, однако принимаемые им решения будут основываться лишь на анализе данных одномомент ных восприятий ее состояния. Иначе говоря, необучающийся М-автомат будет воспринимать динамическую среду как дискретную последовательность статических сред. При этом он окажется не в состоянии выделить общие закономер ности происходящих изменений и, следовательно, не сможет использовать их при планировании и принятии решений.
При использовании М-автомата с обучением и самоорга низацией дело обстоит несколько иначе. В этом случае ав томат также не содержит специальных i-моделей и функцио нальных структур, обеспечивающих функцию предсказания. Однако в процессе его самоорганизации элементы такого рода могут быть сформированы. В дальнейшем эта возмож ность будет проиллюстрирована экспериментальным иссле дованием процесса повторения последовательностей М-авто- матом. Значение этого примера состоит в том, что способ ность к повторению последовательности предполагает наличие в автомате внутренней информационной модели соответ ствующего временного процесса. С другой стороны, сущест вование такой модели является необходимым условием также и любого предсказания. Следовательно, определенные воз можности воспроизведения программ ориентировки во вре мени возникают при использовании М-автоматов даже без специальной предорганизацпи. Можно полагать, таким обра зом, что поведение обучающихся М-автоматов в динамиче ских средах будет отличаться от поведения необучающихся, являясь более «разумным». Последовательным изучением этого вопроса мы, однако, не занимались, ограничиваясь на начальных этапах моделирования изучением основных свойств М-автоматов, проявляющихся при их функциониро вании в сравнительно простых статических средах.
Окончательный вариант модели двигательного поведения. Итак, после всех введенных ограничений окончательный ва риант модели двигательного поведения может быть кратко описай следующим образом.
Модель выполняется в виде программы для ЦВМ и со держит две подсистемы: машинную среду и М-автомат. Ма шинная среда является статической и задается в виде упоря доченной совокупности клеток, каждая из которых может быть либо пустой, либо содержать в себе один из объектов, в различной степени «полезных» или «опасных» для авто мата. Машинная среда может являться моделью некоторых естественных сред.
6 3—1176
М-автомат является моделью некоторого (условного) субъекта, осуществляющего двигательное поведение в есте ственной среде, соответствующей машинной. М-сеть автома та предварительно организована и содержит i-модели объек тов, которые имеются в среде, г-модели действий, которые он может выполнить, а также г-модели, соответствующие различным образам, понятиям, чувствам, эмоциям и жела ниям моделируемого субъекта.
В каждый момент дискретного времени автомат нахо дится в одной пз клеток среды и может производить ее «осмотр». «Поле зрения» автомата (количество одновремен но рассматриваемых клеток среды) ограничено. В процессе осмотра автомат перемещает поле зрения по клеткам среды, причем воспринпмает тем меньше признаков объектов, чем они дальше от него.
На основе данных осмотра автомат намечает цель (клет ку пли совокупность клеток среды), достижение которой позволит удовлетворить его стремление к пище, отдыху, без опасности п т. п. Автомат может формировать ташке иерар хии целей. Затем он строит планы достижения целей и при нимает решение о выполнении того из них, который наибо лее полно удовлетворяет ряду формируемых автоматом критериев. В качестве критериев могут выступать безопас ность маршрута, его длина и т. п.
Построив план, автомат приступает к его выполнению, передвигаясь из одной клетки среды в другую. При этом считается, что поле его зрения ограничено клетками, сосед ними с той, в которой он находится в каждый данный мо мент. В процессе передвижения автомат принимает решения о выполнении в каждый момент одного из возможных дей ствий, а также о коррекции или полной перестройке имею щегося плана.
Передвигаясь в среде, автомат стремится избегать опас ных объектов, чередует движение и отдых, удовлетворяет голод, преодолевает препятствия и т. п. Автомат способен использовать собственный прошлый опыт. Мотивом его дея тельности служит задаваемое ему изначально стремление
ксамосохранению.
Вразличных вариантах модели двигательного поведения описанный сюжет представлен с различной степенью пол ноты.
Из приведенного описания следует, что функции, реали зуемые автоматом, могут быть отнесены к таким основным видам проявлений разумной деятельности: направленное восприятие, целеполагание и планирование, принятие реше ний при организации конкретных действий в среде.
В автомате воспроизводятся следующие из основных про грамм переработки информации мозгом человека (изложение
ведется в соответствия с разработкой этого вопроса, данной
вработе [5, стр. 63—121]).
1.Программа восприятия внешней информации. В ав томате эта программа представлена такими подпрограмма ми: настройка анализаторов (при организации осмотра сре ды), узнавание (возбуждение i-моделей объектов, если восприняты их признаки, а также возбуждение i-моделей понятий более высокого уровня, если восприняты объекты); запоминания (формирование новых i-моделей и связей в М-сети, а также формирование внутренней модели среды); вспоминания (выделение СУТ i-моделей отдельных образов объектов, их совокупностей и последовательностей, а также понятий различных уровней); предвидения (формирование «цепочек» i-моделей, отражающих последовательности вос принимаемых событий, и влияние возбуждения таких «це почек» на процессы в сети).
2.Программа чувств. Представлена в автомате процес сами возбуждения i-моделей чувств «от тела»: передачей возбуждения между i-моделями чувств и i-моделями образов, понятий, желаний и действий, что составляет «эмоциональ ный» компонент процесса переработки информации М-сетью; установлением новых связей между i-моделями чувств и дру гими i-моделями сети. Основные подпрограммы этой про
граммы связаны с инстинктами и сложными рефлексами. В автомате представлен инстинкт самосохранения с его под программами защиты и питания. Из подпрограмм, соответ ствующих сложным рефлексам, представлены рефлекс цели, обеспечивающий общую направленность деятельности ав томата, рефлекс свободы, организующий деятельность ав томата по преодолению имеющихся в среде препятствий и ограничений, и рефлекс любопытства, определяющий струк туру процессов осмотра среды.
3. Программа действий. Представлена в автомате сово купностью простых безусловных рефлексов и подпрограмм: связывания (формирование условных рефлексов), предвиде ния (формирование плана), контроля действий (функциони рование во время выполнения плана следящих систем «по чувствам» и «по результатам»), многоуровневого анализа вариантов (наличие в М-сети i-моделей действий различной степени общности — от «идей» до «элементарных» действий и связь этих i-моделей с другими); построение планов раз ных уровней.
4. Программа сознания. Представлена в автомате подпро граммами внимания (СУТ), ориентирования в пространстве (построение и использование внутренней модели среды), во левого действия (наличие i-моделей желаний, чувств и дей ствий, построение плана и выполнение его с преодолением препятствий, а также автономный выбор цели, построение
6*
иерархии целей и последующие изменения их), отделения реального и нереального (при обращении к внутренней мо дели среды и планировании), моделирования собственных действий (при планировании).
Упомянутые программы имеют следующие общие черты: в исходном состоянии автомата все они задаются введением
в |
М-сеть определенных «врожденных» i-моделей и связей, |
а |
для неполных автоматов — специальных алгоритмов. Об |
щим принципом организации всех программ является этаж ность, или многоуровневость. В процессе работы М-автомата программы могут усложняться и дополняться за счет форми рования новых i-моделей и связей. Каждая программа реали зуется определенными, «свопмп» i-моделями и связями. Одни и те же i-модели п связи могут участвовать в реализации различных программ.
Следует отметить, что приведенное перечисление про грамм и подпрограмм не является полным. С одной стороны, различные подпрограммы представлены в рамках принятого
сюжета моделирования в разной степеип, причем |
некото |
рые — в весьма незначительной. С другой стороны, |
автомат |
реализует много других, не отмеченных при перечислении
подпрограмм, принадлежащих |
более |
низкому |
(по сравне |
нию с упомянутыми) уровню. |
Более |
полное |
представление |
об объеме программ можно составить на основе подробного рассмотрения работы его конкретных действующих реализа ций, описание которых приводится ниже. Посмотрим теперь, в какой степени предлагаемая модель двигательного поведе ния соответствует общим требованиям к моделям гипотез (см. выше).
Одно из основных требований состоит в том, что модель должна воспроизводить действительно сложные виды чело веческой деятельности. В противном случае она не может быть использована для проверки эффективности исходной ги потезы. Мы полагаем, что перечисление программ перера ботки информации, реализуемых с помощью предлагаемого автомата, свидетельствует о достаточной сложности решае мых проблем, так что первое требование можно считать вы полненным.
Требуется далее, чтобы на основе исследования модели можно было определить область практического применения проверяемых с ее помощью принципов исходной гипотезы. Уже упоминалось, что рассматриваемая нами условная за дача организации двигательного поведения М-автоматом по своей структуре и проблематике весьма близка к практиче ской задаче автоматизации управления передвижением в естественной среде различного рода информационных и тран спортных средств. Иначе говоря, наша вычислительная мо дель М-автомата может быть рассмотрена как -действующий
макет реального устройства управления движением, а полу ченные результаты могут быть непосредственно использова ны при конструировании такого устройства. Можно также отметить, что принципы построения М-автоматов могут быть применены при решении класса практических задач, интер претируемых как общая задача поиска путей в простран ствах параметров произвольной природы. Класс таких задач достаточно широк, и в него входит ряд важных задач авто матического управления. Вопросы практического использова ния разработанной модели мы еще рассмотрим в дальней шем. Сказанного, однако, достаточно, чтобы уже теперь считать выполненным обсуждаемое требование.
Следующее важное требование предполагает перспектив ность модели. Выполнение этого требования обеспечивается тем обстоятельством, что воспроизводимые в предлагаемом автомате программы переработки информации лежат в осно ве более сложных проявлений разумной деятельности чело века (труд, речь). Подробнее этот вопрос обсуждался выше (см. «Второе ограничение»). Задачи воспроизведения более сложных видов деятельности могут, следовательно, решаться путем дальнейшего развития и усложнения предлагаемой модели и с учетом результатов, полученных при ее исследо вании.
Основные требования, предъявляемые к предлагаемой модели, оказываются, таким образом, выполненными, что позволяет использовать приведенное выше описание сюжета моделирования в качестве содержательной основы для по строения действующей модели двигательного поведения. Формальная постановка задачи моделирования дана в рабо те [6].
ЧАСТЬ ВТОРАЯ
Эксперимен
тальное
исследование
поведения М-автоматов
Раздел III
М-АВТОМАТ РЭМ. ФОРМИРОВА НИЕ ДВИГА ТЕЛЬНОГО ПОВЕДЕНИЯ
Нами разработаны два варианта действующей модели дви
гательного поведения. Первый из |
них — М-автомат РЭМ. |
С помощью этой модели необходимо |
было экспериментально |
проверить наиболее важные представления исходной гипоте зы: принципы организации М-сети как устройства, осуще ствляющего параллельную переработку информации; прин ципы работы СУТ и ее роль ъ функционировании М-автома та; способы организации взаимодействия между М-сетью и алгоритмическими (функциональными) моделями, т. е. ме тоды построения неполных М-автоматов; многоуровневую структуру информационных систем, реализующих процессы принятия решений, и др.
Экспериментальное исследование РЭМа должно было от ветить на вопрос о том, в какой мере эффективен предлагае мый подход к построению систем искусственного разума, а также определить пути дальнейшего усовершенствования модели.
При разработке РЭМа были введены дополнительные ограничения на сюжет моделирования и набор воспроизводи мых автоматом программ переработки информации. В част ности, РЭМ реализован как необучающийся и неполный М-автомат. Одна его часть, воспроизводящая процессы вос приятия и планирования, выполнена в виде алгоритмической модели, а другая, воспроизводящая процессы принятия ре шений в ходе выполнения плана,— в виде полного М-автома та. Обе части относительно самостоятельны и могут быть названы моделями планирования и выполнения плана соот ветственно.
Функционирование РЭМа как целостной модели двига тельного поведения организуется в ходе последовательного (поочередного) функционирования моделей планирования и выполнения плана. Автомат представляет собой упрощен ный вариант модели двигательного поведения, ее, так ска зать, первое приближение.
Название автомата — РЭМ — относится к целому классу автоматов, задаваемых одним и тем же описанием (про граммой) .
Глава 6
МОДЕЛЬ
ДВИГАТЕЛЬНОГО
ПОВЕДЕНИЯ
РЭМ
Разработка этой моделп рассматривалась нами как первый этап создания «разумного» автомата. В связи с этим мы су щественно ограничили функции РЭМа и отразили в нем только наиболее важные, с нашей точки зрения, программы переработки информации, необходимые для организации це ленаправленного двигательного поведения в средах, близких к естественным.
§ 1. Блок-схема модели
Общая блок-схема модели РЭМ показана на рис. 11. Автомат помещен в среду, каждая клетка которой может содержать не более одного объекта. Количество различных типов объек тов фиксировано. В среде РЭМ может совершать только действия по -перемещению из одной клетки в другую — со седнюю. Прп этом он может «ходить» как по пустым, т. е. не содержащим объекты, клеткам, так и по тем клеткам, в которых уже находится какой-либо объект. Однако это толь ко принципиальная возможность «свободы действий». За дачей РЭМа является выбор такого пути передвижения, ко торый обеспечил бы ему сохранение целостности и минимум отрицательных «эмоциональных переживаний». Иначе гово ря, ему не безразлично, какие действия-шаги выполнять в тех пли иных ситуациях.
В М-сети РЭМа имеются i-модели всех типов объектов
внешней среды, и восприятие |
одного из |
них |
отражается |
в возбуждении соответствующей |
i-моделн. |
Блок |
восприятия |
организован таким образом, что для каждого пространствен ного положения объекта относительно автомата существует
своя i-модель. Это позволяет автомату не только |
«узнавать» |
||
объекты, но п учитывать их пространственную |
ориентацию |
||
прп выборе определенных действий. Процесс |
восприятия |
||
РЭМом информации из внешней среды назовем |
«осмотром». |
||
В поведении РЭМа можно выделить два основных эта |
|||
па — выбор плана |
передвижения |
и выполнение |
этого плана. |
В соответствии со |
спецификой |
каждого этапа |
существуют |
и два режима работы блока восприятия, т. е. два различных режима осмотра внешней среды. Общая цель движения за дается РЭМу экспериментатором в виде координат опреде ленной клетки среды. В процессе планирования автомат про изводит осмотр достаточно большого участка среды и в том случае, если конечная цель движения находится за преде лами этого участка, намечает себе промежуточную цель и строит план ее достижения. При выполнении плана, т. е. при непосредственном передвижении в среде, РЭМ после каждого шага осматривает только окружающие его клетки среды. На основе воспринятой при осмотре информации и ранее выработанного плана он принимает решение о выпол нении следующего действия-шага.
Как видно из блок-схемы РЭМа, информация о результа те осмотра (в случае планирования) или о плане и осмотре (в случае выполнения плана) не является единственной, на основе которой автомат принимает решения о действиях в среде. Прежде чем принимается какое-либо решение, вос принятая информация подвергается «логической» и «эмоцио нальной» оценкам в блоках эмоциональной оценки и поня-
|
|
Рис. 11. Блок-схема |
|
Блок |
модели РЭМ. |
|
|
|
|
планирования |
|
Блок |
Блок |
|
эмоциональной |
понятийных |
|
оценки |
обобщений |
|
|
Блок |
|
Блок |
принятия |
|
восприятия |
решений |
|
Среда |
т |
|
|
|
тийпых обобщений. Это обеспечивает автомату, во-первых, возможность учитывать свой предыдущий опыт, выражен ный в структуре М-сети и определенном распределении воз буждений составляющих ее i-моделеп, и, во-вторых, возмож ность самостоятельно оценивать значимость воспринятой информации. Таким образом, каждое принимаемое автома том решение о выборе определенного этапа плана или кон кретного действия-шага является результатом сложных и взаимосвязанных процессов, протекающих в его М-сети.
|
При разработке РЭМа намеренно были исключены из |
|||||
|
рассмотрения такие важные аспекты разумного поведения, |
|||||
|
как обучение, |
самоорганизация, ориентирование |
во времени |
|||
|
и т. п. Это позволило создать сравнительно простую модель, |
|||||
|
разработка и исследование которой могли быть |
проведены |
||||
|
без больших затрат |
времени. В то же время представленные |
||||
|
в РЭМе программы |
переработки |
информации |
достаточно |
||
|
полно отражают основные положения исходной |
гипотезы, |
||||
|
и экспериментальное исследование автомата позволило оце |
|||||
|
нить эффективность их использования в более сложных ва |
|||||
|
риантах моделей разумного поведения; |
|
||||
|
Построение РЭМа в виде необучающегося |
М-автомата |
||||
|
обусловило необходимость ряда ограничений в его структуре |
|||||
|
и функциях. Так, например, мы вынуждены были отказаться |
|||||
-* |
от введения в автомат программ, связанных с активной дея |
|||||
|
тельностью |
в |
среде, существенно |
ограничили |
количество |
|
|
i-моделей в М-сети, упростили характеристики i-моделей и |
|||||
|
связей. Кроме того, некоторые функции РЭМа оказалось |
|||||
|
более удобным |
представлять в виде алгоритмических описа |
||||
|
ний. Прежде всего это относится к функции планирования. |
|||||
|
Предварительные исследования показали, что реализация |
|||||
|
процесса планирования в М-сети принципиально |
осуществи- |
||||
171 |
ма, однако |
требует |
значительных |
затрат времени, больших |
объемов оперативной памяти ЦВМ и, самое главное, непер спективна без реализации функций обучения и самооргани зации. Поэтому блок планирования РЭМа выполнен в виде функционального описания соответствующего процесса.
Таким образом, РЭМ является неполным иеобучающимся М-автоматом, в котором блоки восприятия, понятийных обоб щений, эмоциональной оценки и принятия решений пред ставлены в виде взаимосвязанных сфер М-сети, а блок пла нирования — в виде взаимодействующего с сетью алгоритма. Использование принципиально отличного от сетевого способа реализации функций плаппрования в автомате позволило оценить возможность п эффективность построения неполных М-автоматов. Оказалось, что организация оперативного взаи модействия алгоритмических и сетевых блоков автомата может быть осуществлена сравнительно простыми средства ми. Этот вывод был использован нами в дальнейших рабо
тах по созданию систем, способных к |
разумному пове |
||||
дению. |
|
|
|
|
|
Несмотря |
на |
то что |
РЭМ |
выполнен |
в виде неполного |
М-автомата, |
его |
основой |
все |
же является |
М-сеть. Имеипо |
в результате протекающих в сети процессов производится оценка воспринимаемой пзвне информации, учет плана п опыта предыдущей деятельности п выработка новых реше ний о выполнении конкретных действий пли выборе нового плана поведения. То обстоятельство, что одна и та же М-сеть используется п при планировании, и при выполнении плана, позволяет автомату стропть такие планы поведения, которые соответствуют его «субъективному» восприятию среды. В процессе движения «эмоциональная» оценка тех или иных объектов среды может измениться, что приведет к необходимости коррекции или перестройки плана. В этом случае новый план будет построен уже с учетом изменив шихся «эмоциональных» оценок объектов.
Эффективность различных действий автомата в значи тельной мере зависит от того, каким образом организована его М-сеть, т. е. насколько обоснованно п согласованно с об щей задачей автомата выбраны i-модели и связи сети, их характеристики и законы взаимодействия. Для необучающегося М-автомата этап задания организации М-сети является наиболее важным, поскольку в процессе функционирования структура сети автомата остается неизменной. Именно по этому подробное описание автомата РЭМ мы начнем с рас смотрения принципиальной схемы структуры и динамики его М-сети. Конкретные содержательные интерпретации объ ектов среды, в которой функционирует РЭМ, и содержатель ное описание структуры сети автомата будут приведены не сколько позже. На этом этапе, т. е. при описании принци пиальной схемы М-сети, будем пользоваться пока только