Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования

.pdf
Скачиваний:
61
Добавлен:
25.10.2023
Размер:
17.04 Mб
Скачать

параметров Тср и Тср. Типичные для большинства испытуе­ мых процессы обучения можно описать в этом случае сле­ дующим образом. Вначале выделяется класс П как содержа­ щий наиболее информативные (в сумме) релевантные при­ знаки. Как только эти признаки выделены, испытуемые ана­ лизируют классы Р и К, причем для обоих классов процесс развивается параллельно, независимо от того, осознан он или нет. В какой-то момент определяется один из классов и обу­ чение заканчивается.

Предположим теперь, что процесс обучения в модели раз­ вивается по той же схеме. Вначале анализ всех трех классов идет параллельно: в модели не реализован механизм созна­ тельного выбора объекта анализа. Анализ класса П заканчи­ вается первым (по тем же причинам, что и у людей-испытуе­ мых), и с этого момента соответствующая часть структуры изменяется мало (это обусловлено структурой алгоритмов обучения — см. рис. 84). Поэтому оп < <?к и оп < о"р. Про­ исходит дальнейший параллельный анализ классов Р и К. В какой-то момент заканчивается анализ класса, например К, и следовало бы ожидать, что дальнейшая работа связана с продолжением анализа Р. Однако этому противоречит ра­ венство ор « ок, что заставляет предположить, что с окон­ чанием анализа класса К заканчивается и обучение вообще.

Об этом же свидетельствуют равенство рр = рк

и отмечен­

ная

раньше «недостаточная обученность» связей

в классе Р

от

его

релевантных признаков (определенная по парамет­

ру

у).

Таким образом, возникает предположение о том, что

М-сеть автомата в неявной форме реализует некоторое пра­ вило, сходное по своему влиянию на ход обучения с прави­ лом, используемым испытуемыми. Это предположение, оче­ видно, не является достаточно обоснованным, однако позво­ ляет объяснить ряд совпадений числовых характеристик модели.

В ходе экспериментов с программой был обнаружен и ряд ограничений, присущих модели. Это, в частности, касается

воспроизведения

автоматом

кривых обучения

испытуемых

I I I

группы. Для

последних характерно большое время об­

учения ( Г > 2 0 ) ,

значительную часть которого

количество

правильных

ответов

за серию колеблется в пределах

4—7.

В

случаях

же Т >

20 для

М-автомата большую часть

вре­

мени обучения количество правильных ответов за серию со­ ставляет 10—12. Это приводит к тому, что коэффициент для автоматов I I I группы меньше, чем для людей-испытуе­ мых. В тех случаях, когда подбором параметров удается уве­ личить \х, часто обнаруживается эффект «растягивания» верхней части кривой (в ряде заключительных серий коли­ чество ответов близко к 15), который у людей-испытуемых наблюдался весьма редко. Эти ограничения указывают на

определенную неполноту модели. Однако удовлетворитель­ ные результаты моделирования испытуемых I и I I групп (17 человек из 20) позволяют использовать полученные ре­ зультаты при дальнейшей работе.

Описанный эксперимент подтверждает правомерность предложенной интерпретации индивидуальных различий ис­ пытуемых как различий некоторых параметров обучения М-автомата. Поскольку в основу модели положены сообра­ жения относительно вида информационных процессов в коре,

то можно полагать, что она является

моделью испытуемого,

а не конкретного эксперимента и,

следовательно, должна

давать удовлетворительные результаты в широком классе методик этого эксперимента. (Обычно математическая мо­ дель психологического эксперимента описывает только одну методику. Например, модель, разработанная для случая од­ новременного формирования двух понятий, не является мо­ делью формирования трех, четырех и т. д. понятий [9].) Про­ верим это предположение.

Не изменяя полученных выше характеристик М-автома­ та, используем его в качестве «испытуемого» при проведе­ нии эксперимента по формированию двух понятий. Рассмот­ рим также имеющиеся в литературе данные («эталонные») аналогичного психологического эксперимента. Далее, при­ меним к обеим группам данных одну из известных частных моделей формирования двух понятий. Если предсказания этой частной модели относительно эталонной группы данных хорошо совпадут с аналогичными предсказаниями относи­ тельно поведения М-автомата, мы будем иметь основания считать, что М-автомат является адекватной моделью фор­ мирования понятий при различных методиках эксперимента.

В качестве эталонных приняты данные, полученные Бау­ эром п Трабассо [72]. Их эксперимент по формированию двух понятий проведен с 46 испытуемыми. Стимулами служили изображения геометрических фигур, представляющих собой вариации шести признаков. Задача считалась решенной при получении 10 правильных ответов подряд.

Для модельного эксперимента была использована описан­ ная в настоящем параграфе программа. Изменения касались входной информации, которая соответствовала здесь 100 кар­ там с шестью признаками (цифрами) на каждой. Карты разделялись на два класса по релевантному признаку, состоя­ щему из трех цифр. Значения параметров обучения соответ­ ствовали основному варианту. Чтобы обеспечить статистиче­ скую достоверность результатов, эксперимент был проведен со 100 М-автоматами (т. е. со 100 «испытуемыми»), которые

отличались друг от друга значениями В и В. Эти параметры менялись для различных автоматов в пределах 0,895—0,995.

Рис.

88.

Теоретическая

(А)

и

эксперименталь­

ная

(М)

кривые обуче­

ния М-автомата двум

понятиям.

 

Рис.

89.

Теоретическое

(А)

и

эксперименталь­

ное

(М)

распределение

числа правильных

от­

ветов, попадающих

меж­

ду

соседними ошибоч­

 

 

 

 

ными.

 

 

 

Номер пробы

 

 

к

 

 

 

Эксперимент с каждым автоматом проводился до получения

 

10 правильных ответов подряд.

 

 

 

В качестве частной описывающей модели была принята

 

модель, разработанная и проверенная Р. Аткинсоном и др.

 

Ее описание приведено в работе [9, стр. 52—103]. Там же по­

 

казано, что предложенная модель весьма удовлетворительно

 

предсказывает результаты Бауэра и Трабассо.

Рассмотрим

 

ее предсказания относительно результатов, полученных в

 

эксперименте с М-автоматами.

 

 

 

Среднее по 100 автоматам количество ошибок за экспе­

 

римент составило

9,23. Это

число используется в

модели

 

Аткинсона для предсказания характеристик эксперименталь­

 

ного

материала. С его помощью был рассчитан

ряд таких

 

характеристик. Те же характеристики были определены пу­

 

тем обработки эмпирического материала, полученного в экс­

 

перименте с автоматами. Приведем результаты их сравнения.

 

1.

Вероятность

ошибки

в n-ж пробе (qn)-

Выражение

 

для qn

характеризует процесс обучения группы испытуемых.

 

На рис. 88 приведена кривая обучения, предсказанная мо­

 

делью Аткинсона

(А), т. экспериментальная кривая

(М), по­

 

лученная при исследовании 100 автоматов. Оценка согласо­

 

ванности кривых

по критерию Пирсона дает значение %2 =

 

= 4,1

при 10 степенях свободы, что позволяет считать наб­

 

людаемые расхождения несущественными и отнести их за

 

счет случайных причин.

 

 

 

 

2.

Номер пробы, соответствующий последней ошибке (L) .

 

Модель Аткинсона предсказывает значение математического

 

ожидания L , равное 18,5 при среднеквадратичном отклоне­

 

нии 18. В результате обработки экспериментальных данных

 

найдено, что среднее значение L равнялось 20,4, а среднее

 

квадратичное — 19,1. Таким

образом, теоретически

предска­

305

занные числа удовлетворительно совпадают с наблюдаемыми

в эксперименте.

 

 

 

 

3. Распределение числа правильных ответов, попадающих между соседними ошибочными ответами (Я). На рис. 89 по­ казаны теоретическое (.4) и эмпирическое (М) распределе­ ния Н. Оценка степени согласованности распределений по критерию Колмогорова дает р(^) = 1 (при К =0,25) , что позволяет считать имеющиеся расхождения несуществен­ ными.

Из приведенных данных видно, что модель Аткинсона, хорошо описывающая поведение людей-испытуемых при формировании двух понятий (эталонные данные), хорошо описывает также и поведение в аналогичных условиях М-ав­ томата. Показано также, что автомат вырабатывает адекват­ ное поведение в различных экспериментах без специальной перенастройкп. Построенная нами модель, таким образом, обладает определенной общностью и может рассматриваться как правомерное описание информационных процессов, реа­ лизуемых мозгом в ходе деятельности по формированию по­

нятий описанного типа.

Основным результатом изложенных

в настоящем параграфе

работ является заключение о том,

что выбранные (в § 1—3 настоящей главы) значения пара­

метров обучения

можно считать удовлетворительными.

§ 6. Обсуждение

результатов

Целью описанных в этой главе исследований являлось реше­ ние следующих задач: а) выбор значений существенных параметров в выражениях, задающих систему (9.33); б) от­ ладка основных алгоритмов модели; в) рассмотрение воз­ можностей моделирования относительно простых психиче­ ских функций с помощью предложенного аппарата; г) полу­ чение некоторых дополнительных данных для построения основного варианта модели. Рассмотрим с этих позиций ре­ зультаты исследования описанных выше моделей.

Модель обучения избеганию наказаний. Задача, решаемая этой моделью, широко применяется в качестве теста при исследовании свойств обучающихся автоматов. Ряд авторов [34, 48] указывают на важность этой задачи при решении некоторых проблем автоматического управления. Обычно она формируется как задача минимизации суммы штрафов, получаемых автоматом в случайных средах. Мы использо­ вали геометрическую интерпретацию этой задачи (случай­ ные блуждания автомата в среде, содержащей случайно рас­ положенные раздражители), более удобную для наших целей. Основным результатом исследования модели обу­ чения избеганию наказаний является определение области допустимых значений коэффициентов проторения связей М-сети.

Существенные результаты в исследовании задачи мини­ мизации штрафов получены М. Л. Цетлиным [63] и его по­ следователями. Нетрудно видеть, что структура и алгоритмы предложенной модели плохо описываются на языке развитой ими теории автоматов с линейной тактикой. Особые труд­ ности возникают при описании функций СУТ. Предложен­ ный М-автомат не содержит каких-либо специальных алго­ ритмов, обеспечивающих решение задачи. Способность к обуче­ нию в случайных средах заложена в основных свойствах М-сети.

Исследование модели показало, что М-автомат способен устанавливать «условнорефлекторные» связи между i-моде­ лями «раздражителей» и действий, а также позволило из­ учить конфигурацию и параметры этих связей. Это дает воз­ можность включить указанные конфигурации в структуру основного варианта модели двигательного поведения на эта­ пе ее предорганизации. Будем полагать, что основной вари­ ант уже имеет некоторый «опыт» действий, зафиксирован­ ный вводимыми связями. По аналогии будем также задавать связи между i-моделями раздражителей и «активных» дейст­ вий («есть», «спать» и др.).

Модель повторения последовательностей. Представляет собой модель хорошо изученной психической функции. Основной целью ее построения и результатом исследования является определение области допустимых значений коэф­ фициентов затухания связей М-сети.

Существенную роль в организации функций модели игра­ ет вспомогательный алгоритм асимметрии связей Bas. Этот алгоритм имеет весьма малый объем, поскольку выполняет лишь корректирующую функцию свойств М-сети, обуслов­ ленных ее основными операторами. Подбором некоторых

коэффициентов (В, В) параметры поведения модели легко приводятся в соответствие с параметрами моделируемого процесса. При повторении последовательностей моделью на­ блюдается ряд особенностей, характерных и для людейиспытуемых (плохое воспроизведение последовательности «назад», эффект начала, персеверации и др.). Это дает осно­ вание считать свойства модели адекватными свойствам моде­ лируемого объекта.

Исследование модели позволило определить значения па­ раметров В, В, обеспечивающие феномен запоминания «ис­ тории» возбуждений в М-сети. Отработка модели проведена на сети, соответствующей блоку «памяти ситуаций» основ­ ного варианта модели. Полученные результаты могут, одна­ ко, применяться и в других блоках, где целесообразно обес­ печить запоминание последовательностей. В частности, эти результаты будут использованы при предорганизации блока «решений».

Модель формирования понятий. На примере задачи фор­ мирования простых понятий мы должны показать пригод­ ность всех выбранных ранее параметров обучения при сов­ местном их использовании. Положительное решение этой за­ дачи и составляет основной результат исследования модели.

Задача моделирования процесса формирования понятий ставилась многими авторами и в разных вариантах [9, 10, 54, 62]. Интерес к ней обусловлен тем обстоятельством, что мо­ дель формирования понятий может быть использована при решении как некоторых психологических задач, так и ряда задач практического характера. Принятая нами постановка задачи имеет специфику, заключающуюся в том, что моде­ лировались психические процессы, развивающиеся (предпо­ ложительно) при решении задачи в строго определенной экспериментальной ситуации. Такая постановка, во-первых, упрощает задачу моделирования и, во-вторых, дает доста­ точный материал для решения основного вопроса — о сов­ местимости найденных параметров обучения.

Результаты исследования позволяют сделать заключение об адекватности модели. При этом обнаруживаются следую­ щие интересные моменты.

1.Модель одновременного формирования трех понятий выполнена в виде М-автомата, погруженного в специфиче­ скую среду конкретного эксперимента. Удовлетворительный режим функционирования автомата был получен за счет ис­ пользования основных свойств М-сети. Все перенастройки мо­ дели проводились путем изменения значений параметров обу­ чения. При этом удалось совместить характеристики обуче­ ния модели с аналогичными характеристиками людей-испы­ туемых.

2.Не потребовалась перенастройка автомата и в случае использования его в режиме работы по формированию двух понятий. Это обстоятельство позволяет полагать, что предло­ женный М-автомат может рассматриваться в качестве удовле­ творительной модели испытуемого, занятого решением задач описанного класса. Этот вывод представляет определенный интерес, поскольку известные модели аналогичного типа [9] строятся как модели экспериментальных результатов, полу­ ченных в рамках строго определенной методики. Такие моде­ ли теряют адекватность при изменении методики эксперимен­ та. В частности, известные модели формирования трех поня­ тий уже не могут использоваться для описания результатов эксперимента по одновременному формированию двух по­ нятий.

Входе экспериментального исследования модели изучены конфигурации связей, возникающих в М-автомате в процес­ се выработки понятий, и установлены параметры связей. Полученные результаты естественно распространяются па

случай формирования многоуровневых структур, отображаю­ щих родо-видовые отношения понятий. Их можно, таким об­ разом, использовать при задании предорганизации блока по­ нятийных обобщений в основном варианте модели. Задавая связи, отражающие отношения включения на множестве i-моделей различных «понятий» этого блока, мы тем самым зададим автомату некоторую начальную систему «знаний» об 'объектах окружающего его мира. При функционировании модели эти «знания» будут подвергаться коррекции и попол­ няться за счет установления новых «ассоциативных» связей.

Таким образом, в ходе работ, описанных в настоящей главе, были решены такие задачи: выбраны области допусти­ мых значений параметров обучения; отлажены все основные блоки алгоритма А; получены сведения, необходимые при задании предорганизации М-сети основного варианта моде­ ли двигательного поведения. Кроме того, исследованы воз­ можности М-сети при моделировании некоторых психических функций. При этом установлено следующее.

1. М-сеть является достаточно гибким средством модели­ рования, поскольку оказалось возможным, используя ее ос­ новные свойства и не вводя какие-либо специальные меры, построить ряд моделей некоторых психических функций, су­ щественно отличающихся друг от друга по характеру и спо­ собам проявления. Отметим, что при построении различных моделей в разной степени использовались блоки алгорит­ ма А. Предварительный анализ показывает, что использова­ ние А в полном объеме не меняет существенно результатов, полученных в каждой из моделей. Полностью этот вопрос, однако, не исследовался. Его решение, тем не менее, не влия­ ет существенно на сделанный вывод, так как, используя любую часть алгоритма А или любое сочетание его частей, мы по-прежнему используем «языковые средства» рассмат­ риваемого метода моделирования.

2. М-сеть является достаточно эффективным средством моделирования, поскольку позволяет использовать при по­ строении действующих моделей не только количественные, но и качественные сведения об объектах; допускает представле­ ние информации в наглядной и легко обозримой форме; обе­ спечивает простоту корректирования моделей путем измене­ ния лишь отдельных ее параметров (обучения, порогов и т. п.), без перестройки модели в целом.

До сих пор, однако, мы имели дело со сравнительно прос­ тыми моделями. Более интересный случай — использование М-сети при построении достаточно сложного автомата —бу­ дет рассмотрен в следующей главе на примере эксперимен­ тального исследования основного варианта модели двигатель­ ного поведения. Формальная постановка задачи моделирова­ ния двигательного поведения в общем виде приведена в

работе [6]. Здесь мы рассмотрим некоторые дополнительные сведения, необходимые для дальнейшего изложения. В [6] описаны структура и способ задания абстрактной си­ стемы М, организующей поведение в некоторой среде Р. Среда может быть представлена в виде ненаправленного связного конечного графа G, каждая вершина gi которого сопоставляется с определенной областью «жизненного про­ странства» системы М. Упомянутые ббласти содержат на­ боры объектов, воспринимаемых системой и являющихся раздражителями для нее.

Система функционирует в дискретном времени. Верши­ ну gi графа G, в которой система М находится в момент t, будем называть собственной (в момент t) вершиной. Собст­ венную вершину и множество соседипх, соединенных с пей ребрами вершин будем называть окрестностью системы (в момент t). Система М может воспринять раздражители, имеющиеся в ее окрестности, и распознать их.

Будем выделять в системе М следующие подсистемы: MV, ответственную за восприятие информации об окрестнос­ ти системы; MP, осуществляющую хранение и переработку воспринятой в MV информации; MD, формирующую после­ довательность действий как результат переработки инфор­ мации в MP; ME, формирующую оценки функционирования системы М.

Задание М сводится к заданию следующей системы функ­

ций:

 

 

 

 

 

 

 

 

 

St = Фг (Р, gi)

 

— функция

восприятия,

 

Ct

=

Ф 2

(ct-i, St, et, g (gu g„)) — функция переработки,

(9.33)

dt

= Ф 3 (ct, et)

 

— функция принятия ре­

et

 

 

(e(_i, ct, St)

 

шений,

 

 

 

= Ф4

— функция

оценки.

 

Здесь g,- — собственная (в момент t) вершина;

St — восприня­

тая ситуация, т. е. состояние MV после восприятия раздра­

жителей

из

окрестности gi; с< — состояние в

момент

t под­

системы

MP,

ct £ С = {сг,

с 2 ,

. . . } ;

et — текущее

значе­

ние

оценки,

вырабатываемой

подсистемой ME,— численная

величина, лежащая в границах между

(—А) — «максималь­

но

 

плохо»

и

{А) — «максимально

хорошо»

— const);

g{Su

Sn) — функция цели,

числовое

значение

которой опре­

деляется «близостью» текущего (gi) положения системы в

среде к заданному (gn);

dt — действие, выполняемое

систе­

мой в момент t; dt £ D =

Н X V, где Н — множество

«ша­

гов», перемещающих М из gi

в одну из вершин окрестности;

V— множество «воздействий»

(«активных действий»), изме­

няющих расположение раздражителей в среде.

 

Введем показатель качества функционирования систе­ мы М. Пусть система функционирует Т моментов времени

начиная с момента t =

1, причем тем лучше, чем больше

величина

 

т

 

е « 2 в , .

(9.34)

Очевидно, что значение е определяется видом функций (9.33), задающих систему. Существует множество возмож­ ных видов этих функций. Конкретный вид функций назовем вариантом задания системы М и будем рассматривать упо­ рядоченное некоторым образом множество таких вариантов, т. е. вектор вариантов т. Пусть на входе системы имеется случайная последовательность ситуаций {S[i], t = 1, 2, .. . }, a S — вектор случайных последовательностей. Таким обра­ зом, величина е есть функционал вектора вариантов т, зависящий также от вектора случайных последовательнос­ тей S. Выражение (9.34) можно записать следующим об­ разом:

e = Q(S, т).

(9.35)

В обшей форме показатель качества функционирования си­ стемы М запишем в виде

i

Т

(9.36)

/ (m) =

lim 4-

2

Q (S М, т).

 

Г-оо 1

t=i

 

 

Наилучший, оптимальный, вариант задания^системы соответ­ ствует максимуму показателя качества /(т).Следовательно, процесс оптимизации системы состоит в нахождении такого варианта ее задания, при котором алгебраическая сумма оценок, выработанных блоком ME за фиксированный (доста­ точно большой) промежуток времени в данной среде, оказы­ вается максимальной. Для того чтобы задача оптимизации имела смысл, необходимо наложить определенные ограниче­

ния на векторы ти

S. Вид этих ограничений обусловлен вы­

бором конкретного

способа задания системы М с помощью

М-автомата. Ряд

таких

ограничений обсуждался

выше,

в гл. 5.

 

 

 

Поскольку настоящая

работа имеет бионическую

направ­

ленность, потребуем, чтобы модель удовлетворяла дополни­ тельным требованиям.

Среда Р является аналогом определенного класса естест­ венных сред. Будем рассматривать двигательное поведение испытуемого (человека или животного) в среде из этого класса. Пусть испытуемый пытается достичь некоторой точ­

ки

в среде.

В зависимости от типа нервной деятельности

и

прошлого

опыта различные испытуемые построят различ-

ные поведения, образующие множество N' = \п\, п->, . . . \ , которое может быть исследовано экспериментально.

Сопоставим ход мышления человека-испытуемого с опре­ деленной последовательностью переходов из состояния в состояние системы М. Пусть каждой последовательности переходов может быть единственным образом поставлена в соответствие последовательность слов в естественном язы­ ке. Назовем такую последовательность слов «ходом мышле­ ния» системы М. Располагая сведениями о среде, поведении и «ходе мышления» системы М, человек-экспериментатор может судить о рациональности ее «хода мышления». Необ­ ходимо построить модель двигательного поведения так, что­ бы, во-первых, поведение пм системы М соответствовало некоторому «естественному» поведению п' £ N" и, во-вторых, «ход мышления» системы М был рационален.

Глава 10

ЭКСПЕРИМЕНТЫ С МОДЕЛЬЮ ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ

312

§ 1. Дополнительные сведения о модели МОД

Работы по определению значений параметров обучения со­ ставили первый этап исследования модели. Второй его этап связан с экспериментальным изучением свойств модели, представленной в полном объеме. Изложению эксперимен­ тальных результатов следует предпослать более детальное описание структуры исследуемой модели и некоторых ее ме­ ханизмов, не описанных ранее.

В организации поведения существенную роль играют про­ цессы, связанные с построением предварительного плана действий. Моделирование двигательного поведения было бы неполным без разработки специальной модели процессов планирования. М-автомат МОД рассчитан на взаимодейст­ вие с такой моделью. Поскольку ее описание содержится в предыдущих разделах книги, ограничимся здесь упомина­ нием лишь о тех ее компонентах, которые непосредственно включены в структуру нашего автомата. Прежде всего, к ним относятся механизмы представления плана в М-сети и меха­ низмы систем, следящих за выполнением плана.

Выходная информация модели планирования фиксирует­ ся в М-сети специфичной структурой, схематически изобра­ женной на рис. 90. Группа i-моделей ДП состоит из i-моде­ лей «обобщенных» действий, характеризующих общее направ­ ление движения автомата за определенное время, например, «двигаться вперед» и т. п. Группа i-моделей Р состоит из i-моделей этапов плана. Р,- — i-модель п-то этапа. Резуль­ тат планирования представляется в виде совокупности свя­ зей, каждая из которых направлена от i-модели этапа пла-

Соседние файлы в папке книги из ГПНТБ