Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Автоматы и разумное поведение. Опыт моделирования

.pdf
Скачиваний:
61
Добавлен:
25.10.2023
Размер:
17.04 Mб
Скачать

р

Рис. 85. Усредненная кривая обу­

 

чения М-автомата.

б

2

О

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-1

\2\-

 

 

 

 

 

 

 

 

 

-Z

. О

2

3

4

5

6

7

8

9

 

 

1

 

 

 

 

Номер серии

 

 

 

 

«проторение» — функция

(8.10),

«пересчет» — функция

(8.6). Значения параметров М-сети соответствовали вели­ чинам, определенным в § 1—4. На обучение автомата отво­ дилось не более 30 серий предъявлений. Чтобы исключить влияние на результаты обучения последовательности предъ­ явления карт в серии, кривая обучения определялась путем статистической обработки 20 экспериментов. Таким образом, кривая обучения автомата характеризует динамику величины математического ожидания числа правильных ответов в се­ рии. Программа была записана на входном языке трансля­ тора АЛГОЛ-БЭСМ и исследовалась на ЦВМ БЭСМ-6. Объем программы составлял 2000в рабочих команд, время просчета модели — около 3 мин.

Эксперименты с моделью. На рис. 85 представлена кривая обучения автомата и ее среднеквадратичные отклонения. Значения параметров обучения соответствовали координатам точки А на рис. 62, 76 и 79. В дальнейшем будем называть эту совокупность значений основным вариантом. Для кри­ вой, изображенной на рисунке, Т = 7; ц = 0,347; К = 2,43. Представляющая точка автомата в пространстве парамет­ ров Т и и. принадлежит первой, наиболее представительной группе, однако не совпадает ни с одной из точек, представ­ ляющих людей-испытуемых.

Наблюдаемый в психологическом эксперименте разброс результатов может быть объяснен индивидуальными разли­ чиями в характере нервных процессов испытуемых, а также отличиями их мотивации при решении задачи. В терминах М-автомата эти различия могут быть интерпретированы в различия параметров обучения, т. е. коэффициентов уста­ новления, проторения и затухания связей, а также интен­ сивности возбуждения i-моделей Пр и НПр при правильных

и неправильных ответах. Чтобы показать правомерность это­ го утверждения, была предпринята попытка воспроизвести в модели кривые обучения испытуемых путем изменения указанных параметров.

Изменения проводились внутри определенных ранее об­ ластей допустимых значений. Полное исследование простран­ ства параметров не являлось необходимым для решения по­ ставленной задачи. Варьировались все основные параметры обучения и некоторые их совокупности. Характеристики ря­ да интересных в практическом отношении вариаций пред­ ставлены в табл. 11. На каждом шаге изменения параметров проводилось 20 экспериментов с автоматом, кривые обучения усреднялись и по усредненной кривой вычислялись коэффи­ циенты Т и ц.. Изменения Т и ц. соответствуют перемещению представляющей точки автомата в пространстве (рис. 82). Каждая вариация, таким образом, может быть графически изображена в виде траектории представляющей точки в этом пространстве.

Вариации 1—8 проводились с целью изучения характера влияния отдельных параметров на процесс обучения. Соот­ ветствующие траектории представлены на рис. 86, а. Видно, что изменения отдельных параметров редко выводят пред­ ставляющую точку за границы I группы. Обнаруживается

 

 

 

Т а б л и ц а

11

 

 

 

Номер

Исходные значения

Варьируемые пара­

Шаг

Результаты

вариации

параметров *

метр DI

 

вариации **

вариации

 

(см. рис. 82)

 

 

 

 

 

 

 

1

 

/с, = к0 = 0,0003

 

 

0,0003

а

2

 

кл = к0 = 0,0005

 

 

0,0005

а

3

 

к2

= 0

К

 

0,000004

а

4

 

2

= 0

к„

 

0,000001

б

5

 

Р =

0,975

ь

 

0,005

а

6

 

Р =

0,960

р

 

0,005

б

7

 

П п Р = 0

Возбуждение Пр

10

а

8

 

П Н П р = 0

Возбуждение НПр

10

а

9

 

ft, = к0

=0,004

Возбуждение

Пр

5

б

 

 

П П Р = 1 5 - Р = 0,960

 

 

 

 

10

 

ft, = ft0

= 0,0045

Возбуждение

Пр

10

б

 

 

Р = 0,995

П П р = 20

 

 

 

 

*

Приводятся значения параметров, отличные от основного варианта.

**

Число шагов

вариации 9.

 

 

 

 

Рис. 86. Траекто­ рии представляю­ щей точкп М-авто- мата при измене­ нии параметров.

 

также, что в области допустимых значений автомат некри­

 

тичен к изменению каждого из параметров обучения усили­

 

вающих компонент связей — траектории вариаций

1, 3 и

5

 

суть точки.

 

 

 

 

На рис. 86, б приведены траектории вариаций

4,

6, 9,

10,

 

переводящих рабочую точку в области пространства, соот­

 

ветствующие I , I I и I I I группам. Таким образом,

изменяя

 

параметры обучения, можно совмещать показатели обучения

 

автомата с показателями обучения испытуемых

различных

 

групп. Иначе говоря, разработанный М-автомат может быть

 

использован в качестве модели испытуемых

различных

 

групп. Параметры, превращающие автомат в такие модели,

295

приведены в табл. 12.

 

 

 

Номер группы

1

2

3

(4-10-"

1,5

4

4,5

Представляет также интерес сопоставление кривых об­ учения автомата с кривыми обучения отдельных испытуе­

мых. Это сопоставление проведено по данным

испытуемых

и автоматов I группы. Сравнивались кривые

обучения лю­

дей и неусредненные кривые

обучения автоматов. Сравнение

показало, что кривые имеют

одинаковый характер и в ряде

случаев могут быть хорошо совмещены. В качестве примера на рис. 87 приведено шесть пар кривых обучений. В каждой паре одна кривая получена в эксперименте с человеком и одна — в эксперименте с автоматом (отмечены буквой М). Чтобы исключить субъективность в оценке совместимости кривых, был использован модифицированный критерий Тью­ ринга. Каждая пара кривых была предъявлена 10 лицам, знакомым с характером и результатами эксперимента (быв­ шим испытуемым), с просьбой указать «машинную» кривую. Всего, таким образом, наблюдалось 60 выборов. «Машинные» кривые были правильно названы в 24 случаях, что мало от­ личается от вероятного числа удачных выборов при случай­ ном угадывании. Описанные выше результаты позволяют считать предложенную модель в целом адекватной экспери­ ментальным данным.

Дальнейший анализ результатов экспериментального ис­

следования

модели связан с рассмотрением структуры М-се­

ти, возникающей в ходе обучения

автомата. Ниже приведе­

на

матрица

связей, направленных

от i-моделей признаков

1,

2, ...,10

к i-моделям классов «пуно»

(П), «риду» (Р),

«кема»

(К). Пара чисел на пересечении

i-й строки и /-го

столбца

соответствует численному

значению компонент гц

(в клетке вверху) и Гц (внизу) связи Иц. Числа представ­ ляют собой среднеарифметические значения проходимостей, полученные при обработке 15 матриц, каждая из которых соответствовала одной реализации процесса обучения основ­ ного варианта модели. Разброс значений для всех связей характеризуется величиной среднеквадратичного отклонения порядка 0,05—0,16,

Т а б л и ц а 12

 

 

 

 

 

 

 

 

Параметры М-автомата

 

 

 

Характе­

 

 

 

 

 

 

 

ристики

 

 

 

 

 

Возбуж­

 

обучения

feo-10-»,

 

k, • 10-'

3

 

Возбуж­

 

 

k, • 10-'

 

 

дение

дение Пр

 

 

 

 

 

 

НПр

 

 

 

2,5

1 , 5 - Ю - 5

0,5

0,99

0,975

50

100

10

0,36

2,5

1,5-10~3

0,5

0,99

0,98

40

50

21

0,355

2,5

1 , 5 - Ю - 3

0,5

0,99

0,999

20

50

20

0.525

Номер

признака

1

2

3

4

5

6

7

8

9

10

 

Классы

 

П

Р

К

1,27

0,153

0,13

0,096

0,338

0,41

0,52

0,222

0,2

0,11

0,229

0,244

0,2

0,275

0,461

0,218

0,224

0,219

0,106

1,03

0,236

0,318

0,107

0,298

0,138

0,73

0,218

0,256

0,11

0,304

0,13

0,45

0,49

0,362

0,212

0,201

0,089

0,41

0,732

0,33

0,212

0,118

0.107

0,295

0,841

0,358

0,288

0,115

0,428

0,224

0,282

0.151

0,314

0,208

0,183

0,341

0,375

0,321

0,31

0,219

Из структуры матрицы видно, что возбуждение i-ro при­ знака ведет к возбуждению i-моделей П, Р и К. При этом возбужденности последних в общем случае оказываются раз­ личными. Значимость i-ro признака для возбуждения i-моде­ ли класса можно охарактеризовать величиной

ух = IfEl .

(9.22)

В табл. 13 приведены значения у для i-моделей призна­ ков 1—10. Видно, что максимально значимыми для каждого класса оказываются его релевантные признаки (в таблице подчеркнуты). Это свидетельствует о том, что правильное отнесение карты к одному из классов осуществляется за счет преимущественного значения усиливающих компонент свя­ зей, направленных от i-моделей релевантных признаков к

i-моделям соответствующих классов. Из содержательного анализа процессов в автомате ясно, что наибольшее относи­ тельное возбуждение i-модели «правильного» класса при предъявлении некоторой карты может быть получено в слу­ чае, если значения тормозных компонент связей, направлен­ ных к i-моделям «неправильных» классов от i-моделей реле­ вантных признаков, окажутся большими, чем значения уси­ ливающих компонент этих связей. Следовательно, наиболее эффективной явится такая структура модели, для которой все, кроме подчеркнутых, значения у в 1, 2, 4, 5, 7 и 8-й стро­ ках табл. 13 будут удовлетворять неравенству 0 ^ у ^ 1 . Из приведенной таблицы видно, что для структуры, получен­ ной в эксперименте, это неравенство удовлетворяется не всюду. В частности, «недостаточно обученными» остались связи Rpi и RPs. Возможные причины этого явления будут проанализированы ниже.

Данные табл. 13 позволяют оценить «степень обучеипости» групп связей, направленных от i-моделей признаков к i-моделям П, К, Р. В момент установления связи Яц при-

Т а б л и ц а

13

 

 

 

Значения у

i-моделей

классов

t-Модель

 

 

 

признака

П

р

к

1

13,4

0,452

0,317

2

4,72

0,97

0,819

3

0,916

1,23

4

0,333

9,6

0,793

5

0,546

6,62

0,718

6

0,359

2,14

2,44

7

0,27

1,93

6,19

8

0,3

1,02

7,3

9

2,83

0,714

1,35

10

0,57

1,1

1,71

знак i приобретает некоторое начальное значение Voi- По­ скольку все связи в момент установления равны, то, при принятых в основном варианте значениях параметров обуче­ ния, для всех i и /

YJi = Vo = 0-6.

(9.23)

Используя начальное уо и финальные (табл. 13) значения у, введем для каждой связи меру обученности

° * Н ? { — Ы -

(9-24)

Среднюю обучепность групп связей, направленных к г-моде- лям П, Р, К, определим как

o-x = - V - -

(9 -2 5 )

При подсчете параметров (9.25) с целью выравнивания результатов не учитывались три признака, каждый из ко­ торых имел максимальное значение у. Для исследуемой структуры получено:

а п = 0,73; <тР = 1,05; отк =1,11 .

(9.26)

Структура связей автомата формируется в основном под влиянием двух факторов: набора значений параметров обуче­ ния и структуры обучающего материала. Показанное выше совпадение поведений модели и испытуемых является кос­ венным свидетельством правильности выбора значений пара­ метров обучения. Чтобы продемонстрировать это в явной

форме, необходимо показать адекватность структуры обуча­ ющего материала отражающей ее структуре М-сети автома­ та. Сделаем это следующим образом. Имея данную структуру обучающего материала, т. е. определенное размещение при­ знаков на картах, можно определить информативность I» каждого из признаков. Анализируя приведенную выше мат­ рицу, можно определить информативность i f каждой г-мо­ дели признака в М-сети. В случае, если информативности признаков и их г-моделей совпадают достаточно близко, бу­ дем считать, что М-сеть хорошо отображает обучающий ма­ териал. Определим необходимые понятия.

Информативность данного признака обратно пропорцио­ нальна числу карт п, в которых этот признак встречается. Информативность релевантных признаков естественно счи­ тать большей и обратно пропорциональной числу вхождений признака в карты, принадлежащие классам, для которых он не релевантен. Таким образом, информативность г-го при­ знака определяется как

= J L + E _ J ° ,

(9.27)

где

[ 1 для признака, релевантного какому-либо классу;

^\ 0 для признака, не релевантного никакому классу.

Информативность i-модели некоторого признака относи­ тельно i-модели данного класса интуитивно оценивается по степени ее влияния, усиливающегося или тормозного, на i-модель этого класса. В соответствии с этим информативность iix г-и г-модели признака относительно класса х вы­ числяется как отношение большей компоненты связи Rx% к меньшей компоненте этой же связи:

(9.28)

где

 

 

g

( 1 при rxi >

rxi,

 

1— 1 при rxi

«^rxi.

Полная информативность i-модели признака г в М-сети определяется в виде

= /?П + /?Р + / Ш .

(9.29)

Т а б л и ц а 14

Информативность / признаков и их i-моделей

/-Модель признака

1

18,77

6,5

5,2

2

6,97

2,42

3,03

3

4,42

1,53

1,67

4

13,86

4,85

3,17

5

9,84

3,41

3,5

6

7,37

2,53

1,87

7

11,82

4,1

3,5

8

11,65

4,04

3,5

9

5,58

1,93

1,87

10

4,56

1,58

2,14

Значения // нормировались путем умножения на коэф­ фициент

* = - ^ 7 p

(9-30)

i

 

Результаты расчетов приведены в табл. 14. Близость

и if оценивалась по критерию %2. Для полученных данных значение %2, рассчитанное стандартным способом, составило 2,16, что с высокой степенью достоверности (р — 0,98) по­ зволяет считать информативности признаков и их г'-моделей совпадающими. Таким образом, выбранные значения пара­ метров обучения можно рассматривать как удовлетворитель­ ные.

Представляет интерес определение устойчивости U реше­ ния задач моделью. Под устойчивостью понимается отноше­ ние количества правильно классифицированных карт к об­ щему количеству предъявленных карт при неограниченном увеличении числа предъявлений. Определим нижнюю гра­ ницу U. Пользуясь значениями Iix, нетрудно подобрать для каждого из классов наиболее «трудные» карты, т. е. такие, которые содержат релевантные признаки данного класса и те из остальных признаков, сумма информативностей ко­ торых относительно других классов максимальна. Для клас­ са П, например, такая карта будет содержать признаки 1,

2, 4, 6, 7, 10. Предъявим автомату эти (три) карты и оценим выполненные им в каждом случае решения параметром р, вычисляемым как отношение возбужденности i-модели «пра­ вильного» к максимальной возбужденности i-модели «непра­ вильного» класса. Для классов П, Р, К этот параметр соста­ вил соответственно: рп = 0,64, рр = 1,32 и рк = 1,32. Это означает, что для класса П ответ был дан неправильно и, следовательно, среди всех возможных карт класса П име­ ются такие, которые будут классифицированы неверно. Лю­ бые же карты классов Р и К будут распознаваться правиль­ но. Таким образом, нижняя граница V лежит не ниже 0,66 или, грубо, U ^ 0,7.

Следует отметить, что между вычисленными выше чис­ ловыми характеристиками элементов анализируемой струк­ туры и результатами психологического эксперимента имеют­ ся определенные соответствия. Так, из табл. 15 видно, что максимальной информативностью обладает признак 1. Ана­ лиз протоколов эксперимента показывает, что именно этот признак анализировался испытуемым в первую очередь. Да­ лее, как показано выше, минимальному обучению подверга­ лась группа связей, направленных к i-модели класса П ( а п = 0,73), причем отношение

- ^ - « - 5 L « l , 5 .

(9.31)

Можно предположить, что чем меньше оч-, тем быстрее заканчивается обучение и тем раньше испытуемые обучают­ ся правильно распознавать класс X. Анализ протоколов по­ казал, что среднее время ТСр обучения испытуемых пра­ вильному распознаванию классов П, Р, К составляет соот­

ветственно: Тер — Ю; Тф = 16,6;

= 16,6. При этом

ср

1 ср

 

что хорошо совпадает с аналогичным отношением для моде­ ли. Интересно, что завершившееся наиболее легко обучение класса П оказалось для модели и самым неустойчивым ( р п = 0 , 6 4 ) .

Особо следует остановиться на следующем обстоятельст­ ве. Эксперимент показал, что как только испытуемый выде­ ляет релевантные признаки двух каких-либо классов, он начинает относить к третьему классу все карты, не содержа­ щие известные ему признаки. Обучение заканчивается, та­ ким образом, в момент определения признаков двух, а не трех классов. Этим, в частности, можно объяснить равенство

Соседние файлы в папке книги из ГПНТБ