Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Слэйгл Д. Искусственный интеллект. Подход на основе эвристического программирования

.pdf
Скачиваний:
13
Добавлен:
25.10.2023
Размер:
12.47 Mб
Скачать

П Р О Г Р А М М А Д Л Я В О С П Р И Я Т И Я И З А П О М И Н А Н И Я (ЕРАМ)

241

ленном в табл. 12.2 эксперименте по чтению вслух первым предложенным стимулом в первой серии является САД. Поскольку в ЕРАМ еще нет никаких сетей, она не отве­ чает. Когда сообщается ответ сат, программа обучения строит «сети», показанные на фиг. 12.1. Дискримина­ ционная программа обучения строит алфавитную сеть (за исключением сигнала с — — ) , состоящую из одного оконечного узла, в который она помещает модель стиму­ ла С , частично повторяющую стимул САД. После

этого

дискриминационная программа

обучения строит

фонематическую

сеть, состоящую из

одного оконечного

узла,

и помещает

в этот узел полную

модель ответа сат.

На этот раз используется полная модель, потому что ответ всегда требуется только полный. Далее ассоциативная программа обучения записывает в алфавитную сеть сиг­

нал с

и модель

стимула

С

.

Вторым

предлагается

стимул

ЛЕД .

Функционирова­

ние программы ответов начинается с применения

к

алфа­

витной сети

дискриминатора.

Последний сразу

находит

модельный

список (С

, с

). Программа

отве­

тов выявляет сигнал С

и применяет дискриминатор

к фонематической сети. Дискриминатор находит модель­ ный список (CAT). Программа ответов выбирает модель реакции CAT. Исходя из этого, программа ответов прямо генерирует ответ сат. Этот ответ ошибочен, и сообщается правильный ответ льот.

Программа обучения из сетей, показанных на фиг. 12.1, строит сети, показанные на фиг. 12.2. Дискриминацион­ ная программа обучения наращивает алфавитную сеть, за исключением сигнала л — —. Она строит проверку А(1) — программу, распределяющую стимулы: те, что начинаются с буквы С, налево, а те, что начинаются с бук­ вы Л, направо. Стимулы, начинающиеся с других букв, могут попасть как в ту, так и в другую сторону. Про­ верка осуществляется на первой букве — такова система приоритетов, названная порядком внимания. Обычно по­ рядок внимания дает высший приоритет первой букве элемента (стимула или сигнала), затем — по порядку последней букве и средним буквам. Таким образом, если дискриминационная программа обучения не обнаружила различия в первых буквах стимулов, она производит

16—1677

242

Г Л А ВА 12

(Проверка\

А(І)

(С--,

(Л--,

с—)

л — )

Ф и г. 12.2. Программа обучения строит эти сети после предъявления второго стимула Л Е Д и второй реакции льот.

вместо проверки А(1) проверку А(3) для последней бук­ вы в стимуле. Для повышения эффективности своих дейст­ вий дискриминационная программа обучения в действи­ тельности строит также и так называемые избыточные проверки. Так, в нашем примере она, вероятно, образова­ ла бы одну избыточную проверку, и построенный таким образом третий конечный узел остался бы пустым и мог бы в дальнейшем оказаться полезным. Мы больше не бу­ дем упоминать об избыточных проверках.

Вернемся теперь к нашему примеру. Дискримина­ ционная программа обучения генерирует также модель стимула Л — —. Аналогичным образом дискримина­ ционная программа обучения построит потом фонемати­ ческую сеть, изображенную на фиг. 12.2. Ассоциативная программа обучения записывает в алфавитную сеть сиг­ нал л и модель стимула Л .

Третьим стимулом является САН. Функционирование программы ответов начинается с применения к алфавит­ ной сети дискриминатора. Последний применяет провер-

П Р О Г Р А М М А Д Л Я В О С П Р И Я Т И Я И З А П О М И Н А Н И Я

(ЕРАМ)

243

ку А(1) к стимулу САН и переходит к

левой

ветви,

где

он находит модельный список (С

, с

).

Программа

ответов выделяет сигнал с— — и применяет к изображен­ ной на фиг. 12.2 фонематической сети дискриминатор. Последний осуществляет проверку а(1) и переходит к левой ветви, где он находит модельный список (CAT).

Программа ответов получает модель

ответа

сат. Исходя

из этого, она прямо генерирует ответ

сат. Это неправиль­

но, и сообщается ответ сан.

 

 

 

Программа обучения из сетей, показанных на фиг.

12.2

строит сети, изображенные на фиг.

12.3.

Дискримина­

ционная программа обучения строит

алфавитную

сеть,

за исключением сигнала С — Н. Поскольку эта программа не в состоянии найти различие между первыми буквами модели стимула С и стимула САН, она, руководст­ вуясь порядком внимания, строит проверку В(3), кото­ рая распределяет слова, оканчивающиеся на букву Н, направо, а некоторые другие слова налево. Дискрими­ национная программа обучения записывает вместо модели

стимула

С— —,

который частично

является

копией

старого

стимула

САД, новую модель

стимула

С — н и

тем самым избегает будущих ошибок.

 

 

Аналогичным

образом дискриминационная программа

обучения строит фонематическую сеть, изображенную на фиг. 12.3. Проверка Ь(3) распределяет элементы, оканчи­ вающиеся звуком д, налево, а элементы, оканчивающиеся звуком и, направо. Ассоциативная программа обучения

записывает

сигнал

С — н вместе с

моделью стимула

С — Н. На

этом первая серия

завершается.

 

Во второй серии первым стимулом является

ЛЕД .

Программа

ответов

применяет

к

изображенной

на

фиг. 12.3 алфавитной сети дискриминатор. Последний при проверке А(1) проходит по правой ветви, ибо первой буквой является Л. Дискриминатор получает модельный

список

, л— — ) .

Программа ответов выделяет

сигнал

л—

— и применяет

к изображенной на фиг. 12.3

фонематической сети дискриминатор. Последний при про­ верке а(1) проходит по правой ветви, так как первым звуком является Л. Так получается модельный список (льот). Программа ответов, исходя из модели льот, прямо генерирует правильный ответ льот. Поскольку сообщае-

16*

244

ГЛАВА 12

[Проверкам 1 АО) '

 

/Проверка]

 

 

С/1--.

 

 

 

л - - )

 

В(3)

 

 

 

 

(C--,

 

(С-Н,

 

 

 

с—)

 

с-н)

 

 

 

 

 

(Проверка\

 

 

 

 

а(І)

 

 

 

 

ter

 

 

[Лбот)

 

 

 

 

 

(cam)

 

(сан)

 

 

 

Ф и г .

12.3.

Программа

обучения строит эти

сети

после

предъявления

третьего

стимула

«САН» и третьей реакции «сан».

 

мый

ответ — тоже льот,

обучения

программы не проис­

ходит.

 

 

 

 

Вторым

стимулом

во

второй серии является САН.

Функционирование программы ответов начинается с при­ менения дискриминатора к изображенной на фиг. 12.3 алфавитной сети. Дискриминатор выполняет проверку А(1) и переходит к левой ветви, так как первой буквой является буква С. После проверки В(3) дискриминатор переходит направо, так как третьей буквой является Н.

П Р О Г Р А М МА Д Л Я В О С П Р И Я Т И Я И З А П О М И Н А Н И Я (ЕРАМ)

245

После этого он находит конечный узел, в котором содер­ жится модельный список ( С — Н , с — и). Программа ответов выделяет сигнал с — н и применяет дискримина­ тор к изображенной на фиг. 12.3 фонематической сети. После проверки а(1) дискриминатор переходит к левой ветви, так как первым звуком является звук с. А после проверки Ь(3) он переходит к правой ветви, так как по­ следним звуком является звук н. После этого он находит конечный узел, в котором содержится модельный список (сан). Программа ответов, исходя из этой модели сан, прямо генерирует правильный ответ сан. Сообщаемый ответ — тоже сан, так что обучения программы не про­ исходит.

Третьим стимулом во второй серии является САД. Программа ответов применяет дискриминатор к изобра­ женной на фиг. 12.3 алфавитной сети. После проверки А(1) дискриминатор переходит к левой ветви, так как первой буквой является буква С. После этого стимул САД проходит проверку В(3), которая должна обеспечить переход к правой ветви стимула, оканчивающегося на букву Н. Таким образом, стимул САД может быть распре­ делен как направо, так и налево. Распределение направо приводит к ошибочному ответу сан, и программа обуче­ ния выполняет соответствующие действия. Если же САД распределяется налево, то программа ответов на­ ходит сигнал с — — и применяет к изображенной на фиг. 12.3 фонематической сети дискриминатор. Послед­ ний после проверки а(1) переходит к левой ветви, так как первым звуком является звук с. После этого дискри­ минатор подвергает проверке Ь(3) конечный звук в сигна­ ле с — —. Так как конечный звук в сигнале неизвестен, после проверки Ь(3) можно с одинаковой вероятностью попасть как на левую, так и на правую ветвь. При по­ падании на правую ветвь программа ответов выдает оши­ бочный ответ сан, и программа обучения принимает со­ ответствующие меры. При попадании на левую ветвь программа ответов выдает правильный ответ CAT, и обу­ чения программы не происходит. При этой последней возможности ЕРАМ выдаст во всей второй серии только правильные ответы. Экспериментатор, полагая, что ЕРАМ уже полностью обучилась ассоциациям, обычно

246

Г Л А ВА 12

Ф и г. 12.4. Программа

обучения

строит

эту алфавитную сеть после

предъявления

первого стимула «ДАС»

п

первой

реак­

ции «жик».

 

 

 

прекращает на этом эксперимент. Однако ЕРАМ при реагировании на стимул САД «гадала», так что она с вероятностью 0,5 выдаст в следующей серим ошибочную реакцию.

В качестве второго примера проследим, каким обра­ зом ЕРАМ могла бы выполнять роль испытуемого в эксперименте, описанном в табл. 12.1. В силу того что и стимулами, и ответами являются бессмысленные слоги, используется лишь алфавитная сеть. Первым стимулом в первой серии является ДАС. Поскольку еще не построе­ на ни одна сеть, программа ответов не реагирует. Когда сообщается реакция ЖИК, программа обучения строит сеть, показанную на фиг. 12.4. Дискриминационная программа обучения строит целую сеть, за исключением сигнала Ж • После проверки А(1) налево распреде­ ляются слоги с первой буквой Д,. а направо — слоги, начинающиеся с Ж- Ассоциативная программа обучения записывает сигнал Ж — — и модель стимула Д — —.

Вторым стимулом является ПИН. Программа ответов применяет дискриминатор к сети, изображенной на фиг. 12.4. Если проверка А(1) распределяет ПИН на­ право, то дискриминатор выработает модельный список (ЖИК), а поскольку сигнала нет, программа ответов не будет реагировать. Однако в этом примере мы примем, что проверка А(1) распределяет ПИН налево. Дискри­

минатор находит модельный список

(Д — —,

Ж

),

а программа ответов получает сигнал

Ж

• Она

при-

П Р О Г Р А М М А Д Л Я В О С П Р И Я Т И Я II З А П О М И Н А Н И Я (ЕРАМ)

247

Ф и г. 12.5.

Программа обучения строит эту

сеть

после

предъявления второго стимула «ПИН» и

вто­

рой

реакции

«ЖУР».

 

меняет дискриминатор к той же сети. Дискриминатор находит модельный список (ЖИК). Исходя из модели ЖИК, программа ответов прямо генерирует ответ ЖИК . Этот ответ ошибочен, и сообщается ответ ЖУРПрограм­ ма обучения из сети, изображенной на фиг. 12.4, строит сеть, изображенную на фиг. 12.5.

Во второй серии первым стимулом является ПИН. Программа ответов выдает правильную реакцию ЖУР, так что обучения программы не происходит. Вторым сти­ мулом является ДАС. Программа ответов применяет к изображенной на фиг. 12.5 сети дискриминатор, который находит модельный список (Д , Ж )• Програм­ ма ответов получает сигнал Ж — — и применяет дискри­ минатор к той же сети. Так как третья буква сигнала Ж — — неизвестна, проверка С(3) приводит к случайно­ му распределению. При попадании на правую ветвь программа ответов «угадает» правильный ответ ЖИК . Однако в этом примере предполагается, что после про­ верки дискриминатор попадает налево, и, следовательно, программа ответов выдает ошибочный ответ ЖУРСооб­ щаемый ответ — ЖИК . Программа обучения принимает соответствующие меры, а именно ассоциативная про­ грамма обучения заменяет сигнал Ж — — на сигнал

248

Г Л А ВА 12

Ж — К. Теперь программа полностью обучилась ассо­ циациям. В третьей серии ЕРАМ выдает только правиль­ ные ответы, так что эксперимент прекращается.

12.2. Э К С П Е Р И М Е Н Т Ы С ЕРАМ И ВЫВОДЫ

В проведенных экспериментах ЕРАМ обучилась ре­ шать задачи по парной ассоциации бессмысленных слогов, а также научилась «читать». ЕРАМ предлагалось решить такие же задачи с бессмысленными слогами, какие решали испытуемые. В типичной задаче предлагается 12 пар бес­ смысленных слогов. Поведение ЕРАМ количественно и качественно сравнивалось с поведением испытуемых.

ЕРАМ обучилась «читать». Когда она «видит одно из четырех напечатанных слов», она «указывает на соответст­ вующий предмет». Например, она «указывает на предмет лед», если «видит напечатанное слово ЛЕД». ЕРАМ ис­ пользует для этого три сети — алфавитную, фонематиче­ скую и предметную. Задача чтения может быть также названа алфавитно-предметной задачей. В условиях стан­ дартной задачи парной ассоциации ЕРАМ сначала обу­ чается фонематически-предметной задаче, а потом ал- фавитно-фонематической задаче. В фонематически-пред­ метной задаче ЕРАМ обучается «указывать на предмет», когда она «слышит его имя». Если, например, она «слы­ шит сат», то «указывает на предмет сад». Для этого она строит фонематическую сеть и предметную сеть. В табл. 12.3 представлены результаты реального экспе­ римента1 . После того как ЕРАМ выполняет целую серию без ошибок, она переходит к алфавитно-фонематической задаче, аналогичной рассматривавшейся в предыдущем разделе задаче «чтения вслух». В табл. 12.4 описан реальный эксперимент, в котором ЕРАМ облучалась ре­ шению этой алфавитно-фонематической задачи.

Во время обучения решению этой задачи ЕРАМ дост­ раивает фонематическую сеть, которая имелась после обучения решению фонематически-предметной задачи. После выдачи ЕРАМ безошибочной серии в алфавитно-

1 В переводе книги данные соответственным образом изменены применительно к русском языку. — Прим. ред.

П Р О Г Р А М М А Д Л Я В О С П Р И Я Т И Я И

З А П О М И Н А Н И Я (ЕРАМ)

249

Таблица

12.3

ЕРАМ

обучается решению

фонематически-

предметной задачи

 

 

 

Номер

Предложенный

Ответ испытуемого

Сообщаемый

ответ

серии

стимул

(фонема­

(предметный)

(предметный)

 

тический)

 

 

 

I

сат

 

сад

 

 

льот

сад

лед

 

 

сан

сад

сан

 

 

мьач

сад

мяч

 

2

сат

сад

сад

 

 

льот

мяч

лед

 

 

сан

сан

 

 

мьач

мяч

мяч

 

3

мьач

мяч

мяч

 

 

сат

сад

сад

 

 

сан

сан

сан

 

 

льот

лед

 

4

мьач

мяч

мяч

 

 

сат

сад

сад

 

 

льот

лед

лед

 

 

сан

сан

сан

 

фонематической задаче она приступает к задаче чтения. Программа чтения аналогична программе ответов, за исключением того, что в программе чтения дискриминатор используется не два, а три раза. Программа чтения клас­ сифицирует алфавитный стимул в алфавитной сети и на­ ходит фонематический сигнал; классифицирует фонемати­ ческий сигнал фонематической сети и находит предмет­ ный сигнал; классифицирует предметный сигнал в пред­ метной сети и генерирует предметный ответ. После того как ЕРАМ обучилась решению обеих задач — как фоне­ матически-предметной, так и алфавитно-фонематической, она успешно справляется с задачей чтения уже в первой серии.

Что касается выводов, то проведенные с ЕРАМ экспе­ рименты по парной ассоциации и «чтению» способствова­ ли углублению понимания процессов механического за­ поминания и вербального поведения человека и показали, что ЕРАМ (или некоторое расширение программы) может оказаться полезным инструментом, способным оказать

250

 

 

 

Г Л А ВА 12

Таблица

12.4.

ЕРАМ

обучается решению

алфавитно-

фонематической

задачи

 

 

Номер

Предложенный

Ответ испытуемого

Сообщаемый ответ

стимул

серии

(фонематический)

(фонематический)

(алфавитный)

 

 

 

I

САД

 

сат

 

Л Е Д

с а т

л ь о т

 

САН

сат

саи

 

МЯЧ

мьач

2

Л Е Д

льот

 

МЯЧ

мьач

мьач

 

САН

мьач

сан

 

САД

сат

сат

3

Л Е Д

льот

льот

 

МЯЧ

мьач

мьач

 

САН

сан

 

САД

сат

сат

4

Л Е Д

льот

льот

 

САН

сан

сан

 

МЯЧ

мьач

мьач

 

САД

сат

сат

помощь ЭВМ при решении сложных задач. Например, ЕРАМ может оказаться полезной при автоматизации ин­ формационного поиска. В этом случае ЕРАМ могла бы строить динамический расширяющийся индекс по вход­ ным элементам, относящимся к большому числу храня­ щихся в памяти документов. Наличие определенных эле­ ментов в индексе зависит от производившегося в прошлом поиска информации. Фейгенбаум и Саймон интересуются прежде всего выводами, которые имеют отношение к пси­ хологии. Поведение ЕРАМ количественно и до некоторой степени качественно совпадает со многими аспектами по­ ведения человека в аналогичных экспериментальных усло­ виях. Как ЕРАМ, так и испытуемые проявляют забывчи­ вость, колебания, ретроактивное торможение, подвержен­ ность помехам, склонность к обобщению стимулов и от­ ветов. ЕРАМ иногда забывает в ходе обучения хорошо, казалось бы, заученные ответы. При колебании испытуе-

Соседние файлы в папке книги из ГПНТБ