книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования
.pdfпараметров Тср и Тср. Типичные для большинства испытуе мых процессы обучения можно описать в этом случае сле дующим образом. Вначале выделяется класс П как содержа щий наиболее информативные (в сумме) релевантные при знаки. Как только эти признаки выделены, испытуемые ана лизируют классы Р и К, причем для обоих классов процесс развивается параллельно, независимо от того, осознан он или нет. В какой-то момент определяется один из классов и обу чение заканчивается.
Предположим теперь, что процесс обучения в модели раз вивается по той же схеме. Вначале анализ всех трех классов идет параллельно: в модели не реализован механизм созна тельного выбора объекта анализа. Анализ класса П заканчи вается первым (по тем же причинам, что и у людей-испытуе мых), и с этого момента соответствующая часть структуры изменяется мало (это обусловлено структурой алгоритмов обучения — см. рис. 84). Поэтому оп < <?к и оп < о"р. Про исходит дальнейший параллельный анализ классов Р и К. В какой-то момент заканчивается анализ класса, например К, и следовало бы ожидать, что дальнейшая работа связана с продолжением анализа Р. Однако этому противоречит ра венство ор « ок, что заставляет предположить, что с окон чанием анализа класса К заканчивается и обучение вообще.
Об этом же свидетельствуют равенство рр = рк |
и отмечен |
||
ная |
раньше «недостаточная обученность» связей |
в классе Р |
|
от |
его |
релевантных признаков (определенная по парамет |
|
ру |
у). |
Таким образом, возникает предположение о том, что |
|
М-сеть автомата в неявной форме реализует некоторое пра вило, сходное по своему влиянию на ход обучения с прави лом, используемым испытуемыми. Это предположение, оче видно, не является достаточно обоснованным, однако позво ляет объяснить ряд совпадений числовых характеристик модели.
В ходе экспериментов с программой был обнаружен и ряд ограничений, присущих модели. Это, в частности, касается
воспроизведения |
автоматом |
кривых обучения |
испытуемых |
||||
I I I |
группы. Для |
последних характерно большое время об |
|||||
учения ( Г > 2 0 ) , |
значительную часть которого |
количество |
|||||
правильных |
ответов |
за серию колеблется в пределах |
4—7. |
||||
В |
случаях |
же Т > |
20 для |
М-автомата большую часть |
вре |
||
мени обучения количество правильных ответов за серию со ставляет 10—12. Это приводит к тому, что коэффициент \х для автоматов I I I группы меньше, чем для людей-испытуе мых. В тех случаях, когда подбором параметров удается уве личить \х, часто обнаруживается эффект «растягивания» верхней части кривой (в ряде заключительных серий коли чество ответов близко к 15), который у людей-испытуемых наблюдался весьма редко. Эти ограничения указывают на
определенную неполноту модели. Однако удовлетворитель ные результаты моделирования испытуемых I и I I групп (17 человек из 20) позволяют использовать полученные ре зультаты при дальнейшей работе.
Описанный эксперимент подтверждает правомерность предложенной интерпретации индивидуальных различий ис пытуемых как различий некоторых параметров обучения М-автомата. Поскольку в основу модели положены сообра жения относительно вида информационных процессов в коре,
то можно полагать, что она является |
моделью испытуемого, |
а не конкретного эксперимента и, |
следовательно, должна |
давать удовлетворительные результаты в широком классе методик этого эксперимента. (Обычно математическая мо дель психологического эксперимента описывает только одну методику. Например, модель, разработанная для случая од новременного формирования двух понятий, не является мо делью формирования трех, четырех и т. д. понятий [9].) Про верим это предположение.
Не изменяя полученных выше характеристик М-автома та, используем его в качестве «испытуемого» при проведе нии эксперимента по формированию двух понятий. Рассмот рим также имеющиеся в литературе данные («эталонные») аналогичного психологического эксперимента. Далее, при меним к обеим группам данных одну из известных частных моделей формирования двух понятий. Если предсказания этой частной модели относительно эталонной группы данных хорошо совпадут с аналогичными предсказаниями относи тельно поведения М-автомата, мы будем иметь основания считать, что М-автомат является адекватной моделью фор мирования понятий при различных методиках эксперимента.
В качестве эталонных приняты данные, полученные Бау эром п Трабассо [72]. Их эксперимент по формированию двух понятий проведен с 46 испытуемыми. Стимулами служили изображения геометрических фигур, представляющих собой вариации шести признаков. Задача считалась решенной при получении 10 правильных ответов подряд.
Для модельного эксперимента была использована описан ная в настоящем параграфе программа. Изменения касались входной информации, которая соответствовала здесь 100 кар там с шестью признаками (цифрами) на каждой. Карты разделялись на два класса по релевантному признаку, состоя щему из трех цифр. Значения параметров обучения соответ ствовали основному варианту. Чтобы обеспечить статистиче скую достоверность результатов, эксперимент был проведен со 100 М-автоматами (т. е. со 100 «испытуемыми»), которые
отличались друг от друга значениями В и В. Эти параметры менялись для различных автоматов в пределах 0,895—0,995.
Рис. |
88. |
Теоретическая |
|
(А) |
и |
эксперименталь |
|
ная |
(М) |
кривые обуче |
|
ния М-автомата двум |
|||
понятиям. |
|
||
Рис. |
89. |
Теоретическое |
|
(А) |
и |
эксперименталь |
|
ное |
(М) |
распределение |
|
числа правильных |
от |
||
ветов, попадающих |
меж |
||
ду |
соседними ошибоч |
||
|
|
|
|
ными. |
|
|
|
Номер пробы |
|
|
к |
|
|
|
Эксперимент с каждым автоматом проводился до получения |
|||||
|
10 правильных ответов подряд. |
|
|
|||
|
В качестве частной описывающей модели была принята |
|||||
|
модель, разработанная и проверенная Р. Аткинсоном и др. |
|||||
|
Ее описание приведено в работе [9, стр. 52—103]. Там же по |
|||||
|
казано, что предложенная модель весьма удовлетворительно |
|||||
|
предсказывает результаты Бауэра и Трабассо. |
Рассмотрим |
||||
|
ее предсказания относительно результатов, полученных в |
|||||
|
эксперименте с М-автоматами. |
|
|
|||
|
Среднее по 100 автоматам количество ошибок за экспе |
|||||
|
римент составило |
9,23. Это |
число используется в |
модели |
||
|
Аткинсона для предсказания характеристик эксперименталь |
|||||
|
ного |
материала. С его помощью был рассчитан |
ряд таких |
|||
|
характеристик. Те же характеристики были определены пу |
|||||
|
тем обработки эмпирического материала, полученного в экс |
|||||
|
перименте с автоматами. Приведем результаты их сравнения. |
|||||
|
1. |
Вероятность |
ошибки |
в n-ж пробе (qn)- |
Выражение |
|
|
для qn |
характеризует процесс обучения группы испытуемых. |
||||
|
На рис. 88 приведена кривая обучения, предсказанная мо |
|||||
|
делью Аткинсона |
(А), т. экспериментальная кривая |
(М), по |
|||
|
лученная при исследовании 100 автоматов. Оценка согласо |
|||||
|
ванности кривых |
по критерию Пирсона дает значение %2 = |
||||
|
= 4,1 |
при 10 степенях свободы, что позволяет считать наб |
||||
|
людаемые расхождения несущественными и отнести их за |
|||||
|
счет случайных причин. |
|
|
|
||
|
2. |
Номер пробы, соответствующий последней ошибке (L) . |
||||
|
Модель Аткинсона предсказывает значение математического |
|||||
|
ожидания L , равное 18,5 при среднеквадратичном отклоне |
|||||
|
нии 18. В результате обработки экспериментальных данных |
|||||
|
найдено, что среднее значение L равнялось 20,4, а среднее |
|||||
|
квадратичное — 19,1. Таким |
образом, теоретически |
предска |
|||
305 |
занные числа удовлетворительно совпадают с наблюдаемыми |
|||||
в эксперименте. |
|
|
|
|
||
3. Распределение числа правильных ответов, попадающих между соседними ошибочными ответами (Я). На рис. 89 по казаны теоретическое (.4) и эмпирическое (М) распределе ния Н. Оценка степени согласованности распределений по критерию Колмогорова дает р(^) = 1 (при К =0,25) , что позволяет считать имеющиеся расхождения несуществен ными.
Из приведенных данных видно, что модель Аткинсона, хорошо описывающая поведение людей-испытуемых при формировании двух понятий (эталонные данные), хорошо описывает также и поведение в аналогичных условиях М-ав томата. Показано также, что автомат вырабатывает адекват ное поведение в различных экспериментах без специальной перенастройкп. Построенная нами модель, таким образом, обладает определенной общностью и может рассматриваться как правомерное описание информационных процессов, реа лизуемых мозгом в ходе деятельности по формированию по
нятий описанного типа. |
Основным результатом изложенных |
в настоящем параграфе |
работ является заключение о том, |
что выбранные (в § 1—3 настоящей главы) значения пара
метров обучения |
можно считать удовлетворительными. |
§ 6. Обсуждение |
результатов |
Целью описанных в этой главе исследований являлось реше ние следующих задач: а) выбор значений существенных параметров в выражениях, задающих систему (9.33); б) от ладка основных алгоритмов модели; в) рассмотрение воз можностей моделирования относительно простых психиче ских функций с помощью предложенного аппарата; г) полу чение некоторых дополнительных данных для построения основного варианта модели. Рассмотрим с этих позиций ре зультаты исследования описанных выше моделей.
Модель обучения избеганию наказаний. Задача, решаемая этой моделью, широко применяется в качестве теста при исследовании свойств обучающихся автоматов. Ряд авторов [34, 48] указывают на важность этой задачи при решении некоторых проблем автоматического управления. Обычно она формируется как задача минимизации суммы штрафов, получаемых автоматом в случайных средах. Мы использо вали геометрическую интерпретацию этой задачи (случай ные блуждания автомата в среде, содержащей случайно рас положенные раздражители), более удобную для наших целей. Основным результатом исследования модели обу чения избеганию наказаний является определение области допустимых значений коэффициентов проторения связей М-сети.
Существенные результаты в исследовании задачи мини мизации штрафов получены М. Л. Цетлиным [63] и его по следователями. Нетрудно видеть, что структура и алгоритмы предложенной модели плохо описываются на языке развитой ими теории автоматов с линейной тактикой. Особые труд ности возникают при описании функций СУТ. Предложен ный М-автомат не содержит каких-либо специальных алго ритмов, обеспечивающих решение задачи. Способность к обуче нию в случайных средах заложена в основных свойствах М-сети.
Исследование модели показало, что М-автомат способен устанавливать «условнорефлекторные» связи между i-моде лями «раздражителей» и действий, а также позволило из учить конфигурацию и параметры этих связей. Это дает воз можность включить указанные конфигурации в структуру основного варианта модели двигательного поведения на эта пе ее предорганизации. Будем полагать, что основной вари ант уже имеет некоторый «опыт» действий, зафиксирован ный вводимыми связями. По аналогии будем также задавать связи между i-моделями раздражителей и «активных» дейст вий («есть», «спать» и др.).
Модель повторения последовательностей. Представляет собой модель хорошо изученной психической функции. Основной целью ее построения и результатом исследования является определение области допустимых значений коэф фициентов затухания связей М-сети.
Существенную роль в организации функций модели игра ет вспомогательный алгоритм асимметрии связей Bas. Этот алгоритм имеет весьма малый объем, поскольку выполняет лишь корректирующую функцию свойств М-сети, обуслов ленных ее основными операторами. Подбором некоторых
коэффициентов (В, В) параметры поведения модели легко приводятся в соответствие с параметрами моделируемого процесса. При повторении последовательностей моделью на блюдается ряд особенностей, характерных и для людейиспытуемых (плохое воспроизведение последовательности «назад», эффект начала, персеверации и др.). Это дает осно вание считать свойства модели адекватными свойствам моде лируемого объекта.
Исследование модели позволило определить значения па раметров В, В, обеспечивающие феномен запоминания «ис тории» возбуждений в М-сети. Отработка модели проведена на сети, соответствующей блоку «памяти ситуаций» основ ного варианта модели. Полученные результаты могут, одна ко, применяться и в других блоках, где целесообразно обес печить запоминание последовательностей. В частности, эти результаты будут использованы при предорганизации блока «решений».
Модель формирования понятий. На примере задачи фор мирования простых понятий мы должны показать пригод ность всех выбранных ранее параметров обучения при сов местном их использовании. Положительное решение этой за дачи и составляет основной результат исследования модели.
Задача моделирования процесса формирования понятий ставилась многими авторами и в разных вариантах [9, 10, 54, 62]. Интерес к ней обусловлен тем обстоятельством, что мо дель формирования понятий может быть использована при решении как некоторых психологических задач, так и ряда задач практического характера. Принятая нами постановка задачи имеет специфику, заключающуюся в том, что моде лировались психические процессы, развивающиеся (предпо ложительно) при решении задачи в строго определенной экспериментальной ситуации. Такая постановка, во-первых, упрощает задачу моделирования и, во-вторых, дает доста точный материал для решения основного вопроса — о сов местимости найденных параметров обучения.
Результаты исследования позволяют сделать заключение об адекватности модели. При этом обнаруживаются следую щие интересные моменты.
1.Модель одновременного формирования трех понятий выполнена в виде М-автомата, погруженного в специфиче скую среду конкретного эксперимента. Удовлетворительный режим функционирования автомата был получен за счет ис пользования основных свойств М-сети. Все перенастройки мо дели проводились путем изменения значений параметров обу чения. При этом удалось совместить характеристики обуче ния модели с аналогичными характеристиками людей-испы туемых.
2.Не потребовалась перенастройка автомата и в случае использования его в режиме работы по формированию двух понятий. Это обстоятельство позволяет полагать, что предло женный М-автомат может рассматриваться в качестве удовле творительной модели испытуемого, занятого решением задач описанного класса. Этот вывод представляет определенный интерес, поскольку известные модели аналогичного типа [9] строятся как модели экспериментальных результатов, полу ченных в рамках строго определенной методики. Такие моде ли теряют адекватность при изменении методики эксперимен та. В частности, известные модели формирования трех поня тий уже не могут использоваться для описания результатов эксперимента по одновременному формированию двух по нятий.
Входе экспериментального исследования модели изучены конфигурации связей, возникающих в М-автомате в процес се выработки понятий, и установлены параметры связей. Полученные результаты естественно распространяются па
случай формирования многоуровневых структур, отображаю щих родо-видовые отношения понятий. Их можно, таким об разом, использовать при задании предорганизации блока по нятийных обобщений в основном варианте модели. Задавая связи, отражающие отношения включения на множестве i-моделей различных «понятий» этого блока, мы тем самым зададим автомату некоторую начальную систему «знаний» об 'объектах окружающего его мира. При функционировании модели эти «знания» будут подвергаться коррекции и попол няться за счет установления новых «ассоциативных» связей.
Таким образом, в ходе работ, описанных в настоящей главе, были решены такие задачи: выбраны области допусти мых значений параметров обучения; отлажены все основные блоки алгоритма А; получены сведения, необходимые при задании предорганизации М-сети основного варианта моде ли двигательного поведения. Кроме того, исследованы воз можности М-сети при моделировании некоторых психических функций. При этом установлено следующее.
1. М-сеть является достаточно гибким средством модели рования, поскольку оказалось возможным, используя ее ос новные свойства и не вводя какие-либо специальные меры, построить ряд моделей некоторых психических функций, су щественно отличающихся друг от друга по характеру и спо собам проявления. Отметим, что при построении различных моделей в разной степени использовались блоки алгорит ма А. Предварительный анализ показывает, что использова ние А в полном объеме не меняет существенно результатов, полученных в каждой из моделей. Полностью этот вопрос, однако, не исследовался. Его решение, тем не менее, не влия ет существенно на сделанный вывод, так как, используя любую часть алгоритма А или любое сочетание его частей, мы по-прежнему используем «языковые средства» рассмат риваемого метода моделирования.
2. М-сеть является достаточно эффективным средством моделирования, поскольку позволяет использовать при по строении действующих моделей не только количественные, но и качественные сведения об объектах; допускает представле ние информации в наглядной и легко обозримой форме; обе спечивает простоту корректирования моделей путем измене ния лишь отдельных ее параметров (обучения, порогов и т. п.), без перестройки модели в целом.
До сих пор, однако, мы имели дело со сравнительно прос тыми моделями. Более интересный случай — использование М-сети при построении достаточно сложного автомата —бу дет рассмотрен в следующей главе на примере эксперимен тального исследования основного варианта модели двигатель ного поведения. Формальная постановка задачи моделирова ния двигательного поведения в общем виде приведена в
работе [6]. Здесь мы рассмотрим некоторые дополнительные сведения, необходимые для дальнейшего изложения. В [6] описаны структура и способ задания абстрактной си стемы М, организующей поведение в некоторой среде Р. Среда может быть представлена в виде ненаправленного связного конечного графа G, каждая вершина gi которого сопоставляется с определенной областью «жизненного про странства» системы М. Упомянутые ббласти содержат на боры объектов, воспринимаемых системой и являющихся раздражителями для нее.
Система функционирует в дискретном времени. Верши ну gi графа G, в которой система М находится в момент t, будем называть собственной (в момент t) вершиной. Собст венную вершину и множество соседипх, соединенных с пей ребрами вершин будем называть окрестностью системы (в момент t). Система М может воспринять раздражители, имеющиеся в ее окрестности, и распознать их.
Будем выделять в системе М следующие подсистемы: MV, ответственную за восприятие информации об окрестнос ти системы; MP, осуществляющую хранение и переработку воспринятой в MV информации; MD, формирующую после довательность действий как результат переработки инфор мации в MP; ME, формирующую оценки функционирования системы М.
Задание М сводится к заданию следующей системы функ
ций: |
|
|
|
|
|
|
|
|
|
||
St = Фг (Р, gi) |
|
— функция |
восприятия, |
|
|||||||
Ct |
= |
Ф 2 |
(ct-i, St, et, g (gu g„)) — функция переработки, |
(9.33) |
|||||||
dt |
= Ф 3 (ct, et) |
|
— функция принятия ре |
||||||||
et |
|
|
(e(_i, ct, St) |
|
шений, |
|
|
|
|||
= Ф4 |
— функция |
оценки. |
|
||||||||
Здесь g,- — собственная (в момент t) вершина; |
St — восприня |
||||||||||
тая ситуация, т. е. состояние MV после восприятия раздра |
|||||||||||
жителей |
из |
окрестности gi; с< — состояние в |
момент |
t под |
|||||||
системы |
MP, |
ct £ С = {сг, |
с 2 , |
. . . } ; |
et — текущее |
значе |
|||||
ние |
оценки, |
вырабатываемой |
подсистемой ME,— численная |
||||||||
величина, лежащая в границах между |
(—А) — «максималь |
||||||||||
но |
|
плохо» |
и |
{А) — «максимально |
хорошо» |
(А — const); |
|||||
g{Su |
Sn) — функция цели, |
числовое |
значение |
которой опре |
|||||||
деляется «близостью» текущего (gi) положения системы в
среде к заданному (gn); |
dt — действие, выполняемое |
систе |
|
мой в момент t; dt £ D = |
Н X V, где Н — множество |
«ша |
|
гов», перемещающих М из gi |
в одну из вершин окрестности; |
||
V— множество «воздействий» |
(«активных действий»), изме |
||
няющих расположение раздражителей в среде. |
|
||
Введем показатель качества функционирования систе мы М. Пусть система функционирует Т моментов времени
начиная с момента t = |
1, причем тем лучше, чем больше |
величина |
|
т |
|
е « 2 в , . |
(9.34) |
Очевидно, что значение е определяется видом функций (9.33), задающих систему. Существует множество возмож ных видов этих функций. Конкретный вид функций назовем вариантом задания системы М и будем рассматривать упо рядоченное некоторым образом множество таких вариантов, т. е. вектор вариантов т. Пусть на входе системы имеется случайная последовательность ситуаций {S[i], t = 1, 2, .. . }, a S — вектор случайных последовательностей. Таким обра зом, величина е есть функционал вектора вариантов т, зависящий также от вектора случайных последовательнос тей S. Выражение (9.34) можно записать следующим об разом:
e = Q(S, т). |
(9.35) |
В обшей форме показатель качества функционирования си стемы М запишем в виде
— |
i |
Т |
— |
(9.36) |
/ (m) = |
lim 4- |
2 |
Q (S М, т). |
|
|
Г-оо 1 |
t=i |
|
|
Наилучший, оптимальный, вариант задания^системы соответ ствует максимуму показателя качества /(т).Следовательно, процесс оптимизации системы состоит в нахождении такого варианта ее задания, при котором алгебраическая сумма оценок, выработанных блоком ME за фиксированный (доста точно большой) промежуток времени в данной среде, оказы вается максимальной. Для того чтобы задача оптимизации имела смысл, необходимо наложить определенные ограниче
ния на векторы ти |
S. Вид этих ограничений обусловлен вы |
||
бором конкретного |
способа задания системы М с помощью |
||
М-автомата. Ряд |
таких |
ограничений обсуждался |
выше, |
в гл. 5. |
|
|
|
Поскольку настоящая |
работа имеет бионическую |
направ |
|
ленность, потребуем, чтобы модель удовлетворяла дополни тельным требованиям.
Среда Р является аналогом определенного класса естест венных сред. Будем рассматривать двигательное поведение испытуемого (человека или животного) в среде из этого класса. Пусть испытуемый пытается достичь некоторой точ
ки |
в среде. |
В зависимости от типа нервной деятельности |
и |
прошлого |
опыта различные испытуемые построят различ- |
ные поведения, образующие множество N' = \п\, п->, . . . \ , которое может быть исследовано экспериментально.
Сопоставим ход мышления человека-испытуемого с опре деленной последовательностью переходов из состояния в состояние системы М. Пусть каждой последовательности переходов может быть единственным образом поставлена в соответствие последовательность слов в естественном язы ке. Назовем такую последовательность слов «ходом мышле ния» системы М. Располагая сведениями о среде, поведении и «ходе мышления» системы М, человек-экспериментатор может судить о рациональности ее «хода мышления». Необ ходимо построить модель двигательного поведения так, что бы, во-первых, поведение пм системы М соответствовало некоторому «естественному» поведению п' £ N" и, во-вторых, «ход мышления» системы М был рационален.
Глава 10
ЭКСПЕРИМЕНТЫ С МОДЕЛЬЮ ДВИГАТЕЛЬНОГО ПОВЕДЕНИЯ
312
§ 1. Дополнительные сведения о модели МОД
Работы по определению значений параметров обучения со ставили первый этап исследования модели. Второй его этап связан с экспериментальным изучением свойств модели, представленной в полном объеме. Изложению эксперимен тальных результатов следует предпослать более детальное описание структуры исследуемой модели и некоторых ее ме ханизмов, не описанных ранее.
В организации поведения существенную роль играют про цессы, связанные с построением предварительного плана действий. Моделирование двигательного поведения было бы неполным без разработки специальной модели процессов планирования. М-автомат МОД рассчитан на взаимодейст вие с такой моделью. Поскольку ее описание содержится в предыдущих разделах книги, ограничимся здесь упомина нием лишь о тех ее компонентах, которые непосредственно включены в структуру нашего автомата. Прежде всего, к ним относятся механизмы представления плана в М-сети и меха низмы систем, следящих за выполнением плана.
Выходная информация модели планирования фиксирует ся в М-сети специфичной структурой, схематически изобра женной на рис. 90. Группа i-моделей ДП состоит из i-моде лей «обобщенных» действий, характеризующих общее направ ление движения автомата за определенное время, например, «двигаться вперед» и т. п. Группа i-моделей Р состоит из i-моделей этапов плана. Р,- — i-модель п-то этапа. Резуль тат планирования представляется в виде совокупности свя зей, каждая из которых направлена от i-модели этапа пла-
