
- •Часть I
- •Раздел I
- •1 . Интроспективное наблюдение:
- •2 . Бихевиористическое наблюдение:
- •I. Общая характеристика двух способов мышления
- •1. Аристотелевские представления
- •2. Физика Галлилея
- •1. Аристотелевские понятия
- •2. Понятийная структура Галилея
- •II. Динамика
- •1. Телеология и физические векторы
- •2. Значение целой ситуации в динамике Аристотеля и Галилея
- •3. Освобождение от исторических склонностей
- •4. Смысл дифференциального процесса
- •5. Методологические следствия
- •1. Идеи Аристотеля: независимость ситуации, инстинкт
- •2. Подлинные трудности и отсутствие закономерности
- •3. Попытки скорректировать себя: «средняя» ситуация
- •4. Начало галилеевского способа мышления
- •Раздел II
- •1. Ментализм против бихевиоризма
- •2. Бихевиоризм и бихевиоризм
- •3. Уотсон: молекулярное определение
- •4. Молярное определение
- •5. Другие сторонники молярного определения
- •7. Целевые и когнитивные детерминанты
- •8. Объективное определение целей поведения
- •9. Объективное определение поведенческого познания
- •10. Организм как целое
- •11. Начальные причины и детерминант поведения
- •12. Резюме
- •1. Эксперименты на латентное научение
- •2. Викарные пробы и ошибки (vte)
- •3. Поиски стимула
- •4. Эксперименты с «гипотезами»
- •5. Опыты с пространственной ориентацией
- •Раздел III
- •1. Психологические районы, границы, силы поля, векторы, валентности и локомоции
- •2. Принцип одновременности и влияние прошлого и будущего
- •3. Как определить свойства поля в данный момент времени
- •4. Психологическое прошлое, настоящее и будущее как части психологического поля в данный момент
- •Раздел IV
- •2. Исследования Charcot и JaneL-
- •4. Этиологическое значение сексуальности. -
- •1. Сознание и бессознательное
- •4. Два рода влечений
- •5. Зависимости я
- •Раздел V
- •1. Происхождение основных понятий или категорий ума
- •2. Почему общество может быть источником логической мысли?
- •3. Каким образом категории выражают социальные явления
- •Раздел VI
- •1. Задача психологического обоснования наук о духе
- •2. Различение объяснительной и описательной психологии
- •3. Объяснительная психология
- •4. Описательная и расчленяющая психология
- •5. Отношение между объяснительной и описательной психологией
- •6. Возможность и условия разрешения задачи описательной психологии
- •7. Структура душевной жизни
- •8. Развитие душевной жизни
- •8. Изучение различий душевной жизни. Индивид
- •Часть II
- •Раздел I
- •Раздел II
- •Раздел III
- •Раздел IV
- •Раздел V
- •1. Личность
- •2. Личность и мир
- •3. Психическое
- •Раздел VI
- •1. Отиошение между субъектом и объектом
- •2. Ассимиляция и аккомодация
- •3. Теория стадий
- •4. Отношения между развитием и обучением
- •5. Оперативный и фигуративный аспекты когнитивных функций
- •7. Уравновешивание и когнитивные структуры
- •8. Логико-математические аспекты структур
- •9. Заключение: от психологии к генетической эпистемологии
- •Раздел VII
- •Раздел VIII
Раздел I
НЕОБИХЕВИОРИЗМ
Халл (Hull) Кларк Леонард (1884—1952) — американский психолог-необи-хевиорист, автор гипотетико-дедуктив-ной теории научения. С 1930 по 1950 г. Халл — ведущий психолог Института исследований человеческих отношений Йельского университета (Jale Institut of Human Relation), в котором он возглавил исследовательскую группу. Испытал влияние учения И.П. Павлова. Ранние исследования проводил в области мышления, способностей (тестирование способностей — 1928), гипноза (гипноз и внушаемость — 1933), механической памяти (математическо-дедуктивная теория механического научения — 1940); в этих работах пытался применить объективные методы и создать формализованный аппарат для объяснения изучаемых процессов.
Исследования, которые явились непосредственным началом гипотетико-дедуктивной системы, относятся к 30-м гг. Первый вариант теории дан в книге «Принципы поведения» (1943). Здесь в 17 постулатах и 17 короллариях к ним математически описываются поведение и феномены научения. Вторая книга— «Существенные черты поведения» (1951) — несколько изменяет, дополняет изложенные принципы. Окончательный вариант концепции «Система поведения» (1952). содержит новые постулаты и распространяется на объяснение новых видов поведения — решение проблем, поведение в пространстве и др. Теория Халла явилась заметным явлением в американской психологии 30—50-х гг. Как отмечает Хилгард в рецензии на книгу 1952 г., Халл создал новый тип психологической системы, являющейся «научной логикой, в которой взаимосвязаны эмпирические данные и рациональные пути обращения с ними» (Psychol. Bulletin, 1954, vol. 51, № 1—6). Последователями Халла являются известные психологи О.Г. Маурер, Н.Е. Миллер, Дж. Доллард, К. Спенс, А. Амсель, Ф. Логан и другие, которые развили теорию научения К. Халла, применили ее к анализу социального поведения, в области психотерапии. Соч.: Principles of Behavior. — N. Y., 1943; A behavior System. — New-Haven, 1952. Лит.: ФрессП., Пиаже Ж. Экспериментальная психология. М., 1973. — Вып. IV. — С. 104—108; Ярошевский М.Г., Анциферова Л.И. Развитие и современное состояние зарубежной психологии.— М., 1974. — С. 243—244; Bower G.H., Hilgard R.E. Hull's Systematic Behavior System. — In: Theories Of Learning. — N. Y., 1975. — P. 558—605.
В данное издание вошла заключительная, XX глава книги «Принципы поведения» («Principles of behavior»). В ней определяются основные постулаты, разъясняются символические обозначения, используемые в теории Хал-ла. Дается схема, обобщенно представляющая зависимости между условиями и результатами поведения.
К. Халл
Принципы ПОВЕДЕНИЯ. Сущность научной теории
Основной задачей науки является выведение закономерностей, которые в максимально возможной степени приближались бы к общим законам. Методы, которыми эта задача успешно решается, могут быть подразделены на эмпирические и теоретические. Эмпирический метод заключается в основном в наблюдении, обычно подкрепленном экспериментом. Теоретический же метод является логическим по своей сути; посредством этого метода, применяя в то же время и метод эмпирический, уровень общности закономерностей может быть выяснен в таких пределах, которые недостижимы посредством только одного эмпирического метода. Особенно это проявляется в тех случаях, когда одновременно кажутся пригодными две или несколько предполагаемых закономерностей. Логический метод позволяет утверждать, какого результата следует ожидать в случае, если одновременно подтверждаются несколько сформулированных принципов; сравнивая теоретические заключения с наблюдаемыми эмпирическими результатами, можно определить, являются ли эти принципы достаточно общими, чтобы объяснить данную ситуацию.
В идеале научная теория представляет собой иерархию логически выведенных положений, соответствующую структуре эмпирически наблюдаемых зависимостей.
Логическая структура есть производная от сравнительно небольшого числа общих принципов — постулатов, рассматриваемых в согласовании с некоторыми необходимыми априорными условиями. Науки о поведении далеко отстали от естественных наук в достижении систематичности, отчасти из-за присущей им сложности, отчасти в силу динамичности поведения как объекта изучения, отчасти вследствие укоренившегося антропоморфизма. Эмпирическое наблюдение, дополненное проницательной догадкой, — вот основной источник общих принципов науки или постулатов. Их формулировки, взятые в различных сочетаниях вместе с релевантными предварительными условиями, порождают выводы или теоремы, с которыми согласно практическому результату можно либо согласиться, либо нет. Те первичные предположения, из которых следуют логические выводы, совпадающие с наблюдаемыми эмпирическими результатами, сохраняются, те же, которые не подтверждается, отбрасываются или модифицируются. И пока идет этот процесс проб и ошибок, растет набор первичных принципов, совместное применение которых наиболее вероятно совпадает с релевантными наблюдениями. Выводы, сделанные из этих сохранившихся постулатов, хотя никогда и не бывают абсолютно точны, все же вполне достоверны. Таков на сегодняшний день статус первичных принципов в физических науках.
Теория поведения и символические конструкторы
Научные теории в основном касаются динамичных ситуаций, т. е. последовательных событий, или условий, которые с течением времени последуют из данных первоначальных событий, или условий. Теоретическое объяснение заключается в манипулировании ограниченным набором символов согласно правилам, выраженным в постулатах (с применением определенных дополнительных правил, которые составляют суть логики) таким образом, чтобы ликвидировать разрыв между предварительными условиями, или состояниями, и последующими. Некоторые символы представляют наблюдаемые и измеряемые элементы ситуаций и их соединения, тогда как другие — лишь предполагаемые промежуточные процессы, недоступные прямому наблюдению. Последние суть теоретические конструкты. Все развитые науки свободно оперируют теоретическими конструктами, а часть даже целыми последовательностями их. Научная ценность логических конструктов состоит в возможности выведения с их помощью верных логических следствий; это в свою очередь абсолютно зависит от каждого конструкта или их цепи, связанных как с предварительными, так и с последующими условиями, или событиями, которые прямо наблюдаемы. Если возможно, они также должны быть измеряемы.
Теория поведения, очевидно, использует ряд символических конструктов, совокупность которых составляет единую цепь. Основные звенья этой цепи представлены на схеме (см. с. 529). В интересах ясности символические конструкты сопровождаются более важными и ревалентными символами, которыми обозначаются соответствующие наблюдаемые условия, или события. Чтобы различать этих два типа символов, символические конструкты обведены кружками. Можно заметить, что символы наблюдаемых явлений ветвятся как в начале цепи, так и в ее конце, там где они должны обеспечивать валидность конструктов.
Организмы как саморегулирующиеся механизмы
Рассматриваемые с точки зрения биологической эво-люции живые организмы являются в большей или мень-шей степени саморегулирующимися механизмами. В данном контексте мы определяем такой механизм как некоторый физический агрегат, поведение которого проявляется в определенных условиях в соответствии.с неизменными правилами и законами. Биологическая природа этих агрегатов такова, что особям, или видам для выживания необходимы определенные оптимальные условия. Когда же эти условия отклоняются от оптиму-ма, равновесие, как правило, может быть восстановлено за счет некоторого действия со стороны организма; ак-тивность такого рода описывается как «приспособительная ». У животных органами, осуществляющими приспособительную активность, являются в основном железы и мышцы. У высших организмов количество, разнообразие и сложность действий, обеспечивающих длительное выживание, огромны. Природа действия, или последовательности действий, направленных нато, чтобы в конкретной ситуации приблизить условия к оптимуму, зависит одновременно (1) от степени дисбаланса или от потребности организма и (2) от характеристик окружающей среды, как внешних, так и внутренних. Поэтому для истинно приспособительного действия необходимы как некоторое состояние, организма, так и соответствующее воздействие среды, которые должны совпасть, чтобы вызвать реакцию эффекторных органов. Первое звено функциональной связи эффекторных органов с потребностями организма и условиями среды составляют рецепторы, преобразующие биологически наиболее важные воздействия среды (S) в нервные импульсы (s). Большинство этих импульсов направляется, к мозгу, который выступает в роли автоматического пульта управления, переадресующего эфферентные импульсы (r) к эффекторам таким образом, чтобы вызвать реакцию (R). В этой связи следует особо отметить две важные закономерности.
Первая из этих закономерностей заключается в том, что после окончания действия стимула (S) на рецептор активность афферентного импульса (s) сохраняется еще несколько секунд, а в определенных условиях — до нескольких минут, правда, интенсивность импульса постепенно убывает. Такой остаточный след стимула биологически чрезвычайно важен, так как он обеспечивает связь эффектора не только с теми явлениями среды, которые непосредственно возникают в данный момент, но и с теми, которые имели место в ближайшем прошлом, что часто имеет исключительное значение для выживания. Таким образом осуществляется ограниченная, временная интеграция. Это положение о влиянии стимула выражено в постулате 1: «При воздействии энергии стимула (S) в рецепторе возникает афферентный. нервный, импульс (s), который распространяется по нервным волокнам к эффекторным органам. В течение продолжающегося действия стимульной энергии (S) этот афферентный импульс (s) достигает максимальной интенсивности, затем постепенно уменьшается. После-прекращения действия стимула (S) на рецептор афферентный импульс (s) продолжает свое действие в течение нескольких секунд, постепенно уменьшаясь до О».
(Формулировка взята из I главы и дана в качестве примера. В дальнейшем формулировки постулатов не приводятся — даются лишь ссылки на их номера. — Примеч. ред.-сост.)
Другая закономерность заключается в том, что импульсы и остаточные следы (s), вызванные различными воздействиями стимульной энергии (S) на рецептор, хотя обычно и довольно близки, но, очевидно, почти никогда не бывают совершенно одинаковы. Такое отсутствие единообразия обусловлено (1) тем фактом, что одновременно несколько рецепторов активируются стимульной энергией, а также (2) «афферентным нервным взаимодействием». Новейшая гипотеза утверждает на этот счет, что импульсы, вызванные в рецепторе, проходя по нервной системе к точке, где сфокусированы вновь приобретенные рецепторно-эффекторные связи, взаимодействуют между собой таким образом, что каждый рецепторный импульс изменяет все остальные в сторону большей или меньшей интенсивности, т. о. s меняется на.s1, s2 или s3 и т. д. в зависимости от конкретной комбинации других разрядов стимульной энергии, воспринимаемых в данный момент (см. схему на с 529). Такое взаимодействие чрезвычайно важно, так как распределение реакций организма на определенные комбинации, или паттерны, стимулов, равно как и на компоненты этих паттернов, очевидно, зависит именно от этого (постулат 2).
Психологические закономерности, согласно которым нервная система обеспечивает приспособление организма на уровне поведения, пока еще окончательно не изучены. В результате этого мы вынуждены оперировать грубыми молярными формулировками, выводимыми из опытов с условными рефлексами и другими экспериментами над поведением. С этой точки зрения оказывается, что в процессе органической эволюции возникли два отдельных, но близко связанных способа эффективной поведенческой адаптации. Один из них следует искать в малоизученных рецеп-торно-эффекторных связях (SUR) на уровне нервного волокна, которые определяют, по крайней мере, приблизительные поведенческие решения в сиюминутных ситуациях, которые встречаются часто, но требуют сравнительно простых реакций (постулат 3). Другой путь эффективного поведения представляет собой, пожалуй, одно из наиболее впечатляющих достижений эволюции: это способность организмов самостоятельно, автоматически приобретать приспособительные рецепторно-эффекторные связи. Овладение ими есть научение.
Научение и проблема подкрепления
Структура элементарного процесса научения, как показали многочисленные эксперименты, очевидно, такова: состояние потребности существует на фоне более или менее сложных рецептурных импульсов, вызываемых действием стимулов из окружающей среды. Этот комплекс обстоятельств активирует разного рода неопределенные приспособительные потенциальные реакции, регулируемые неизученной пока рецеп-торно-эффекторной структурой (SUR), сложившейся в ходе органической эволюции. Сравнительная сила потенциалов этих разнообразных реакций варьирует от одного момента к другому согласно фактору колебания (S°R). Проистекающее отсюда разнообразие неусвоенных потенциальных реакций (SUR), происходящих в данный момент, имеет следствием случайный характер поведения, вызванного данными условиями. Тогда, когда одна из этих случайных реакций или их последовательность приводит к удовлетворению доминирующей в это время потребности, следует косвенный эффект, известный как подкрепление (G, схема). Оно заключается в следующем: (1) усиливаются определенные рецепторно-эффекторные связи, которые в данном случае обеспечили реакцию; (2) проявляется тенденция, согласно которой, все рецепторные импульсы, вызванные в данный момент, образуют новые связи с эффекторами, обусловливая реакцию. Первый из этих эффектов известен как примитивное научение методом проб и ошибок, второй известен как условно-рефлекторное научение. В большинстве случаев оба процесса проявляются одновременно; в действительности оба они, очевидно, лежат в основе одного процесса, незначительно отличаясь лишь тем, что первый начинается с заметной силой, тогда как второй — практически с нуля.
В результате, если аналогичная потребность появляется в подобной ситуации, то стимулы будут активировать те же самые эффекторы быстрее, более опре- деленно и с большей силой, чем в первый раз. Такое
действие, хотя и не всегда безупречное с точки зрения приспособления, со временем несомненно будет вести к редукции потребности скорее, чем случайное реагирование, не являющееся результатом научения (SUR), вызванное иной потребностью и стимульной ситуацией, а также сделает это быстрее и в более полной мере, чем при той же самой потребности и стимульной ситуации в первый раз. Таким образом, усвоение подобных рецепторно-эффекторных связей, как правило, способствует выживанию, т. е. является адаптивным.
Наблюдение и эксперименты показали, что существуют ситуации (особенно для высших организмов), в которых научение возникает вне связи с редукцией первичной потребности. При тщательном изучении таких случаев было выяснено, что агентом подкрепления выступала ситуация, или событие, включающая в себя ряд стимулов, близко и постоянно связанных с редукцией потребности. Такую ситуацию называют вторичным агентом подкрепления, а укрепление рецепторно-эффекторной связи, возникающее вследствие ее действия, называют вторичным подкреплением. Этот принцип имеет огромное значение в поведении высших организмов. Некоторая организация внутри нервной системы, вызванная определенным подкреплением, известна под названием навыка; так как его нельзя непосредственно наблюдать, навык имеет статус символического конструкта. Строго говоря, навык есть функциональная связь между s и r; у нас он пред-cтавлен символом SFR. Благодаря близкой функциональной связи S и s, с одной стороны, и R и r— с другой, символ SHR может многое объяснить; его преимущество состоит в том, что S и R оба относятся к тем условиям, которые в норме открыты для наблюдения. Положение SHR в цепи конструктов в нашей системе представлено на схеме.
И хотя трудно определить количественное значение ненаблюдаемого, различные приблизительные рассуждения позволяют в первом приближении определить силу навыка как простую функцию роста от числа подкреплений. Единицей для изображения силы навыка выбран hab, аббревиатура от «habit» (навык); hab есть 1% от максимального физиологического пре-дела силы навыка в абсолютно оптимальных условиях.
Условия, влияющие на степень возрастания навыка в зависимости от подкрепления
Более внимательное рассмотрение условий подкрепления позволяет заключить, что их существует целый ряд и они варьируют, а эксперименты показали, что степень возрастания навыка (ASHR) в зависимости от подкрепления так или иначе зависит от вариации этих условий. Один из таких факторов касается агента первичного подкрепления. Было показано, что при постоянном качестве величина возрастания силы навыка относительно подкрепления представляет собой отрицательную функцию от количества агента подкрепления, используемого в качестве подкрепления.
Вторым немаловажным фактором в определении значения ASHR является величина интервала времени, между стимулом и реакцией, которая им обусловлена. Ситуация осложняется тем, заканчивает или нет стимул свое воздействие на -рецептор до появления реакции. В целом эксперимент показал, что в случае, когда и стимул, и реакция длятся недолго, величина возрастания силы навыка относительно подкрепления максимальна, когда реакция (и подкрепление) возникает на полсекунды позже стимула, и она представляет собой отрицательную функцию величины, с которой интервал между стимулом и реакцией отклоняется от этого оптимума (в обоих направлениях). В случае, если реакция возникает одновременно с продолжающимся воздействием стимула на рецептор, величина возрастания силы навыка относительно подкрепления представляет собой простую отрицательную функцию времени, в течение которого стимул действует на рецептор с момента появления реакции. Третьим важным фактором ситуации подкрепления является продолжительность времени между появлением реакции и подкреплением (G). Эксперименты показали, что этот «градиент подкрепления» представляет собой отрицательно возрастающую функцию от времени между реакцией и последующим подкреплением. Принципы вторичного подкрепления и градиента подкрепления объясняют целый ряд случаев научения, в которых первичное подкрепление отсрочено от подкрепляемого акта. Ряд экспериментов продемонстриро; вал, что совмещение действия этих двух принципов
производит вторичный феномен, названный, «градиентом цели». Согласно эмпирическим исследованиям он представляет собой уменьшающуюся экспоненту, или отрицательную функцию от времени (t), отделяющую реакцию от первичного подкрепления в пределах от десяти секунд до пяти-шести минут; промежутки свыше шести минут изучены еще недостаточно хорошо, чтобы делать относительно них какие-либо определенные выводы.
Существует еще несколько не вызыващих сомнения условий, влияющих на степень возрастания силы навыка в зависимости от каждого подкрепления. Условия, описанные выше, несомнено являются типичными и, вероятно, наиболее важными.
Генерализация стимула
Продолжим рассмотрение динамических принципов, согласно которым навыки в сочетании с адекватной стимуляцией (S) и драйвом (D) производят реальное поведение. В этой связи отметим, что стимул (5, схема), своими афферентными импульсами (s, схема) часто вы-
зывает реакцию (R), даже когда s и отличается от s или s (рецепторный импульс, первоначально связан-ный с R). Это означает, что когда стимул (S) и реакция (R) объединены в ситуации подкрепления, возникает связь не только с непосредственно подкрепляемыми стимула-м и, но и с целой зоной других потенциальных стимулов, лежащих в данном стимульном континууме, например, S1, S2, S3 и т. д. Этот факт, известный как генерализация стимула, имеет огромное приспособительное значение, так как стимулы редко или почти никогда не повторяются в точности, навыки едва ли могли бы выполнять адап-птивную функцию вне этого принципа.
Генерализация стимула имеет характеристику, которую в общем виде можно представить следующим образом: чем больше физическое отличие S от S, тем слабее сила мобилизуемого им навыка. Говоря более точно, сила генерализованного навыка (SHR) есть линейная функция возрастания от силы навыка в момент под-крепления и отрицательная функция от разницы (d) между S и S , измеренная в различимых пределах. Taким образом, SFR есть теоретический конструкт, свя-занный с конструктом SHR и наблюдаемыми S и S (см. чему).
Очевидно, что генерализация стимула принимает две формы: (1) генерализация качества стимула и (2) генерализация интенсивности стимула, иначе говоря, каждый стимул имеет два измерения генерализации — качество и интенсивность. Оба измерения демонстрируют падение генерализационного градиента, причем качественный градиент изменяется более резко, нежели градиент интенсивности стимула (постулат 5).
Первичная мотивация
Потребность организма не только является важным фактором в формировании навыка, в силу того что редукция потребности и подкрепление взаимосвязаны; она также играет важную роль в детерминации ситуаций, в которых навык будет вызывать действия: силу этих действий, наличие их в отсутствие подкрепления. Это, несомненно, очень важно для приспособления, так как активность, которая приводит к редукции потребности, была бы пустой тратой энергии в том случае, если потребность не существовала и не заставляла бы организм действовать.
Известно, что динамическое действие многих, если не всех, первичных потребностей организма связано с наличием или отсутствием в крови некоторого небольшого количества определенных веществ, таких, как например гормоны. Каким-то образом они связаны с большинством потребностей определенными характеристиками стимулов (SD), интенсивность которых изменяется в зависимости от интенсивности потребности (постулат 6). В этой связи следует указать, что драйв (D) представляет собой логический конструкт, так как его нельзя непосредственно наблюдать, так же как и эффективную силу навыка (SHR). К счастью, наиболее хорошо изученные драйвы, как например голод, жажда и т. п., вполне могут быть выражены как функции объективно наблюдаемых условий, или событий; эти последние представлены на схеме символом cd. Так как мы определили SHR, результат (SER, схема) комбинации определенных функций от ранее определенных значений сам по себе определен.
Когда были количественно изучены бесчисленные факты первичной мотивации, стал напрашиваться вывод о том, что потенциальная возможность возникновения реакции (SER) есть продукт функции от интенсивности драйва, помноженной на функцию от интенсивности навыка. Стимулы драйва (SD) обычно становятся взаимосвязанными с реакцией, которая ассоциируется с редукцией потребности; и, таким образом, он становится интегральным компонентом навыка (SHR).
Состояние (или условие) драйва в крови, очевидно, некоторым образом повышает чувствительность действия всех навыков независимо от того, какие драйвы участвовали в их формировании, до известной степени таким образом, что увеличивает силу опосредованных ими реакций. Характерный стимул, ассоциируемый с каждой потребностью, действуя по определенному сти-мульному образцу, является достаточным для того, чтобы вызвать соответствующую реакцию, которая привела бы скорее к редукции потребности, доминирующей в настоящий момент, чем к редукции других потребностей, которые в данное время близки или равны нулю.
Угашение, торможение и эффективный потенциал реакции
Если реакция неоднократно вызывается при отсутствии связи с редукцией потребности, то способность данной стимульно-мотивационной комбинации вызывать реакцию постепенно уменьшается; это уменьшение называется экспериментальным уташением. Такое прекращение бесполезной активности в высшей степени адаптивно, так как оно предотвращает растрачива-ние энергетических ресурсов организма. Что экспериментальное угашение касается не просто силы навыка — об этом свидетельствует тот факт, что одно усиление noтребности способно возобновить способность стимула вызвать реакцию, которая была угашена. Тщательное изучение многочисленных фактов экспериментального угашения, вероятно, вместе с относящимися к ним феноменами первичной мотивации позволило сформули-ровать гипотезу, согласно которой экспериментальное угашение в известной степени имеет мотивационную природу. Очевидно, что каждый раз проявление реакции вызывает в организме усиление состояния утом-ления за счет выработки определенных веществ, т. е. приводит к образованию условий, определяющих возникновение потребности в отдыхе. Среднее количество такого рода веществ, получаемое при каждой реакции, представлено позитивной функцией возрастания от работы или энергозатраты. (W), совершенной при исполнении действия. Далее предполагается, что эти вещества имеют способность, тормозить влияние S, направленное на возбуждение R; по этой причине данное явление получило название реактивного торможения (IR). Их накопление впоследствии приводит к экспериментальному угасанию, а постепенное вынесение из волокон потоком крови приводит к спонтанному восстановлению.
В случае если реакция сопровождается подкреплением и проявляется через сравнительно большие интервалы времени, а начальная мотивация сохраняется на довольно высоком уровне, то увеличение силы навыка поддерживает потенциал реакции выше порога реакции. Спонтанное рассеивание эффекта торможения, как известно, происходит гораздо быстрее, чем обычная утрата навыка. Из этого проистекает феномен реминисценции, специально изученный в опытах на научение.
Поскольку наличие IR определяет потребность, прекращение активности, вызвавшей потребность, будет инициировать процесс редукции потребности; но поскольку редукция потребности есть критический элемент подкрепления, из этого с известной вероятностью следует молярный принцип: прекращение активности будет — связано в дальнейшем с любым стимулом, который последовательно ассоциирован с этим прекращением. Но тенденция к прекращению акта будет выступать прямым тормозом к исполнению этого акта. Следовательно, включение такого тормозящего стимула в стимульную структуру, остальная часть которой положительно обусловливает ответ, будет приводить к тенденции препятствовать вызыванию ответа; фактически это есть обычный эмпирический тест на условное торможение (SLR, схема).
Согласно приведенной выше точке зрения, что SLR есть отрицательный навык, введение в комплекс стимулов некоторого иного стимула согласно принципу афферентного взаимодействия вызовет растормаживание, т. е. временное прекращение либо полную ликвидацию SLR. Но, допустив, что SLR возникает в процессе накоп-ления 1, мы приходим к выводу, что полное торможение (iR) в конце экспериментального угасания есть отчасти IR, а отчасти — SIR. Поэтому растормаживание будет иметь место, только если IR есть производная от SLR, а спонтанное восстановление будет иметь место, только если iR есть производная от LR; это означает, что ни растормаживание, ни спонтанное восстановление не могут полностью восстановить утраченный потенциал реакции до его первоначального уровня. Из вышесказанного следуют еще и такие выводы: в экспериментах на научение более экономичны разбросанные во времени, нежели массированные повторения; а также при прочих равных условиях организмы, получающие одинаковое подкрепление после двух реакций, одна из которых требует меньших энергозатрат, в конце концов, как показывает практика, выберутменее трудоемкую реакцию. Таков «закон наименьшей работы».
Из вышесказанного неявно вытекает следующее допущение: потенциал реакции, реально ответственный за вызов реакции, т. е. эффективный потенциал реакции {SFR, схема), есть остаток от вычитания полного торможения IR из потенциала реакции SER, т. е. = SER — iR
А поскольку SER и iR взаимосвязаны с объективно наблюдаемыми условиями, то таким же образом SER оказывается взаимосвязанным с ними.
Колебание эффективного потенциала реакции
Следует отметить, что SER редко реализуется полностью, чтобы вызвать некоторое действие. Он, понижаясь, случайно варьирует. Такие флуктуации, очевидно, проис-ходят благодаря малоизученному физиологическому про-цессу, который имеет силу нейтрализовывать потенциа-лы реакций до уровня, варьирующего от одного момента к другому. Поэтому данный процесс назван «колебанием » и представлен символом S°R.. Эффективный потенциал реакции с учетом его колебания называется «моментальным эффективцым потенциалом реакции»; он представлен символом SER. Так как S°R прямо не наблюдаемо, то оно имеет статус символического конструкта; с другой стороны, благодаря своему постоянному значению оно более осязаемо, чем обычные конструкты; таким образом, на схеме оно не обведено кружком. Гипотетические характеристики S°R:
1) оно постоянно активно;
2) оно оказывает подавляющее действие на любой потенциал реакции независимо от того, велик он или мал;
3) величина потенциалов, таким образом, варьирует от одного момента к другому согласно нормальному распределению;
4) степени его влияния на различные потенциалы реакций в один и тот же момент не коррелируют между собой (постулат 10).
Так как колебание постоянно воздействует на потенциалы реакций, его роль в приспособительном поведении очень велика. Вероятно, именно оно ответ-ственно-за целый ряд феноменов, сгруппированных классическими психологами под названием «внимание». Оно также в значительной степени ответственно за тот факт, что в социальных науках необходимы многочисленные наблюдения, прежде чем удастся вывести простые эмпирические законы. Естественные законы в социальных науках должны базироваться на статистических показателях. Это в свою очередь обусловливает интерес к статистическим методам со стороны наук о поведении. Необходимость проведения большого количества наблюдений для выведения эмпирических законов значительно усложнила работу эмпирических исследователей и, вне сомнения, серьезно замедлила развитие наук о поведении.
Порог реагирования и возбуждение реакции
В конечной части цепи поведенческих конструктов с кульминацией в SER, как показано на схеме, находится возбуждение наблюдаемой реакции. В определении функционального отношения SER к различным наблюдаемым явлениям или реакциям мы сталкиваемся с определенными трудностями в связи с тем, что SER само не может быть прямо наблюдаемо. Если бы мы были вполне уверены относительно количественного функционального отношения SER к комбинации предшествующих элементов, то уровень SER можно было бы подсчитать в соответствии с эмпирической ситуацией, а затем вывести уравнения отношения этих значений к соответственным показателям реакций. Именно такие уравнения нужны. Но, к сожалению, предшествующие функциональные отношения еще недостаточно точно изучены.
Однако в типичных случаях простого научения, включающих четыре измеряемых феномена реакции, искомые уравнения легко выражаются равенством, включающим положительно возрастающую (экспонентную) функцию от числа подкреплений (N). Это равенство отчасти подтверждает правильность гипотезы об отношении Nk ShR и NkSeR.. Подтверждение последнего (отношение SER к N) базируется на следующем факте: при теоретическом анализе типичной кривой научения выясняется, что вероятность возбуждения реакции, и это едва ли можно отнести на счет случайности, определяется согласно .вышеприведенному допущению об отношении SWR к N, а также двум дополнительным допущениям, каждое из которых подтверждается независимыми свидетельствами о функции колебания (S°R) и о пороге реакции (SLR) (см. схему). Характеристики функции колебания описаны выше. Более того, концепция порога реакции получила достаточное развитие, так как сравнимые понятия давно были известны в классической психофизике и физиологии. Как уже указывалось, порогреакции (SLR) есть минимальный уровень моментального эффективного потенци-ала реакции (SFR), необходимый для вызова реакции в том случае, когда отсутствуют конкурирующие потенциалы реакций (постулат 11).
Далее, на основе подтвержденной гипотезы об отношении SBR к N, анализируя уравнения применительно к конкретным примерам трех оставшихся типов кривых научения и используя метод остатка, уже довольно про-сто выяснить функциональные отношения SER к феноменам поведения. В результате мы приходим к выводу, что вероятность возбуждения реакции зависит от эффективного потенциала реакции (постулат 12); латентное время реакции находится в негативно ускоряющемся инвертированном отношении (постулат 13); а сопротивление экспериментальному угасанию и амп-литуда реакции (для автоматически вызываемых реакций) представляют собой возрастающие линейные фун-кции от SER (постулаты 14 и 15).
Последняя сложность, касающаяся возбуждения реакции, вызвана тем фактом, что очень часто воздей-ствие элементов стимула на рецептор в конкретный мо-мент может мобилизовать надпороговые потенциалы нескольких различных реакций, частично или полностью несовместимых. В этом случае все, за исключением самого сильного, претерпят общее угасание (постулат 16). Есть также некоторые свидетельства в пользу того, что и доминирующий потенциал будет отчасти блокирован; в этом, видимо, основа наиболее правдо-подобной теории «забывания», используемой ныне.
На этом мы закончим обзор первичных принципов. Все они могут быть представлены в форме уравнений. Это значит, что если известны первоначальные усло-вия5, i R, G, t, t', S, s, cD, W, S°R и SLR, то возможно подсчитать р, S'R, n или А, подставляя соответствующие значения в уравнения, начиная с левой части схемы и продвигаясь к правой.
Динамика стимульных комплексов и паттернов
Несмотря на предполагаемый факт афферентного нервного взаимодействия, афферентные импульсы различных рецепторов во многом сходны, даже при наличии одновременного воздействия других стимуль-ных элементов. Это означает, что каждый компонент стимула, связанный с реакцией, обычно будет управлять потенциалом этой реакции независимо от других параллельных стимулов. Согласно первичному закону научения каждый отдельный рецепторный импульс несет в себе определенный заряд силы навыка, а следовательно, и потенциал реакции. Потенциалы реакций, заключающиеся в рецепторных импульсах, вызванных различными элементами стимульного комплекса, количественно сочетаются подобно тому, как сочетаются различные увеличения силы навыка, т. е. не за счет суммации, а согласно возвратно-поступательному принципу. Таким образом, если два стимульных агрегата, несущих одинаковые заряды потенциала и направленных на одну реакцию, действуют одновременно как стимуль-ный комплекс, то их физиологическая сумма, за исключением эффектов афферентного взаимодействия, будет меньше, чем арифметическая сумма двух потенциалов реакции; точно так же, если действуют два одинаково заряженных стимульных агрегата, то в случае выпадения одного из них останется более половины общего потенциала реакции. В результате (не говоря об эффек-тах афферентного нервного взаимодействия) чем более сложный подкрепленный стимульный комплекс будет повторяться в последующих ситуациях, тем с большей вероятностью он будет вызывать реакцию.
Такой способ действия имеет особое адаптивное значение, так как чем более сложен повторяющийся стимульный комплекс, тем более будет похожа окружающая обстановка на ту, которая впервые вызвала редукцию потребности, и, таким образом, реакция с большей вероятностью вновь приведет к редукции потребности. Здесь мы имеем примитивный механизм грубого подсчета вероятности того, приведет ли данная стимульная ситуация к редукции потребности, если на эту ситуацию будет вызвана реакция.
Этот адаптивный механизм имеет то преимущество, что он пригоден для любой стимульной ситуации, ноной или нет. Другой изученный нами вторичный принцип, определяющий реакции организма на стимульные комплексы, известен как образование паттернов. Он функционирует одновременно с уже описанным принципом суммации, но действие его гораздо медленнее. Тем не менее при наличии достаточного времени, которое требуется для сложного процесса научения, он м ожет оказаться чрезвычайно важным для приспособления. Действительно, во многих ситуациях решение вопроса, последует ли за реакцией подкрепление, за-висит от наличия или отсутствия определенной комбинации обстоятельств, а для организма, следовательно, больше от определенной комбинации или паттерна стимульных элементов, чем от наличия или отсутствия его отдельных компонентов. Таким образом, каждая комбинация стимульных элементов будет в известной степени определять афферентные импульсы, вызываемые каждым стимульным компонентом; любое изменение стимульного комплекса также в известной степени будет изменять афферентные импульсы, выз-ванные оставшимися компонентами комплекса. В процессе нерегулярного выборочного подкрепления и угасания, называемого дифференциальным подкреп-лением, которое характерно для метода проб и ошибок, известного как дискриминационное изучение, высшие организмы могут проявлять одну реакцию, успешно связанную с одной комбинацией стимулов, и совсем иную реакцию, связанную с другой коминацией, вклю-чающей некоторые элементы первой, при условии наличия и других элементов. В основе своей такое различение возможно, потому что афферентный импульс sv вызванный стимульным элементом S;, появившимся одновременно с элементом S2, в известной степени отличается от $3, вызванного тем же элементом S, при одновременном действии элемента S3. Физиологическая суммация нескольких потенциалов реакций, характерных для различных стимульных паттернов, имеющих много или даже большинство общих элементов, может иметь своим результатом реагирование на каждый. Так, каждый из примерно сорока речевых звуков есть особый паттерн, составленный из «основной» физической скорости колебаний и определенной комбинации частот. Каждое из тысяч слов развитых языков состоит из последовательности речевых звуков, пауз т. п. При чтении каждая буква есть сложный зрительный паттерн, каждое слово есть сложный паттерн этих буквенных паттернов, а каждая фраза — последовательность напечатанных словесных паттернов. Действительно, трудно вообразить жизненную ситуацию, не привлекая понятия паттерна. Ограничением для научения в этом случае является то, что когда комплекс стимулов связывается с реакцией, его отдельные компоненты, действуя сами по себе, теряют силу.
Взгляд в будущее
Основной задачей данной работы было выделить и представить первичные — базовые — принципы, или законы поведения, как они представлены на нынешнем этапе развития наук о поведении; к настоящему времени их выделено шестнадцать. Если эти принципы, или постулаты, достоверны, из них возможно будет вывести логическую иерархию вторичных принципов, которые будут существовать параллельно объективно наблюдаемым феноменам поведения высших организмов; такая иерархия будет представлять собой систематическую теорию всех социальных наук.
С прогрессом поведенческих наук некоторые принципы, выдвинутые как первичные, будут признаны ложными и отменены; некоторые перестанут считаться первичными, поскольку выяснится, что они выводимы из других первичных принципов, и они будут отнесены ко вторичным; некоторые будут признаны неправильными и потребуют изменений; наконец, должны быть добавлены новые постулаты. Первичные принципы, представленные ранее, сформулированы с учетом подобных изменений. Во многих случаях жесткая формулировка принципов вызвала сомнения в их валиднос-ти. Надеемся, однако, что четкие формулировки, даже будучи впоследствии признаны неверными, позволят легче и быстрее прийти к правильным формулировкам, чем это сделают расплывчатые утверждения, которые труднее уличить в ошибочности. Основной задачей науки является быстрое и экономичное выявление ее основных .законов. С точки зрения умудренного опытом ученого, не стыдно выдвинуть неверное предположение, ошибочность которого может быть легко доказана; научное открытие есть отчасти процесс проб и ошибок, и этот процесс не может идти без ошибочных, как и без успешных попыток. С другой стороны, использование методологии, с помощью которой невозможно найти однажды сделанную ошибку, умышленное вуалирование возможной ошибки красивыми словами, философским туманом и антропоморфические предупреждения — все это замедляет процесс проб и ошибок и тормозит научный прогресс.
Остается надеяться, что с годами появятся теоретические трактаты по различным аспектам наук о поведении. Первый из них должен, естественно, представить общую теорию индивидуального поведения. Тщательная разработка различных аспектов этих проблем при-ведет к созданию серий теоретических работ, касающихся различных специальных сторон поведения млекопитающих, особенно человеческого поведения. Сюда войдут труды, посвященные теории навыков и их приобретения, коммуникативному символизму речи (семантике), использованию символов в индивидуальном решении задач (включая мышление), экономическим, моральным, эстетическим ценностям, семейному поведению, индивидуальной адаптивной эффективно-сти (интеллекту), формальным образовательным процессам, психогенным расстройствам, социальному контролю и преступности, характеру и личности, культуре и аккультурации, обычаям, законам, юриспруденции, политике и управлению, и многим другим специальным областям.
И как кульминация, в конце концов появится работа, состоящая в основном из математики и математической логики. Там будет приведен перечень понятий и знаков, чьи эквиваленты доступны прямому наблюдению; в силу того что понятия прямо связаны дифференциальным подкреплением с эквивалентами, они будут обладать минимумом двусмысленности. Отсюда с помощью уникального метода символической логики будут синтезированы критические понятия всей системы, а корректные первичные понятия для валидной систематизации не менее важны, чем первичные принципы; таким образом, будет выделен полный набор недвусмысленных терминов. Из этих терминов, или знаков, будут сформулированы точные математические выражения для тех постулатов, или первичных молярных принципов, которые останутся в результате прогресса науки, и для тех, которые будет необходимо ввести; отсюда с помощью математических методов будут выведены теоремы, параллельные всем эмпирическим ответвлениям так называемых социальных наук. Отсюда же будет выведен ряд теорем, касающихся еще не познанных ситуаций; они будут иметь практическое применение и, возможно, повлекут социальные открытия.
Как можно судить из истории, социальным наукам потребуется долгое время, чтобы достигнуть описанного здесь статуса. Тем не менее есть надежда, что последующее столетие явит беспрецедентное развитие в этой области.
Задача систематического развития наук о поведении трудна, на пути к ее решению стоят многие коренные перемены. Исследователь поведения должен не просто разбираться в математике — он должен научиться думать в понятиях уравнений и высшей математики. Прогресс будет заключаться в выведении сотен уравнений, экспериментальном обосновании эмпирических констант, содержащихся в этих уравнениях, в выделении практически значимых единиц, в которых можно выразить составляющие уравнений; в объективном oп- ределении сотен символов, появляющихся в уравнениях, в выведе нии одной за другой тысяч теорем и следствий из первичных определений и уравнений, в проведении тысяч количественных экспериментов и полевых наблюдений, подкрепленных воображением, проницательностью, смелостью проверить одновременно валидность теорем, первичных принципов и понятий, из которых последние выведены; в беспощадном отказе и пересмотре ранее привлекательных принципов и понятий, частично или полностью дискредитированных в процессе эмпирической проверки.
Скиннер (Skinner) Берхаус Фредерик (1904—1990) — американский психолог, развил концепцию радикального бихевиоризма, центром которой является учение об оперантном поведении. В связи с распространением результатов исследования поведения на социальные проблемы получила также название социального бихевиоризма. Окончил Гамильтон-колледж в 1926 г. Получил степень доктора философии в Гарвардском университете (1931). С 1948 г. — профессор Гарвардского университета, член национальной Академии наук. Начал свои работы по объективному исследованию поведения животных в 1930 г. Возникновение понятий «оперантное обусловливание» и «оперантная концепция» относится к 1932—1934 гг. Ее теоретическое оформление составляет содержание книги «Поведение организмов» (1938). Дальнейшее развитие концепции связано с ее распространением на поведение человека («Наука и человеческое поведение», 1953; «Вербальное поведение», 1957). Хотя вербальное поведение Скиннер называет специфически человеческим, отличающимся от физических действий животных и имеющим свои специфические свойства, делается вывод о том, что методы, примененные в экспериментальных исследованиях на животных, «...могут быть распространены и на человека, не подвергаясь при этом существенным модификациям» (Verbal bechavior. —N. Y., 1957. —P. 3). Развиваемые в указанных исследованиях взгляды на природу процесса научения были распространены затем с лабораторных условий на обучение людей и воплотились в концепцию программированного обучения («Наука об учении и искусство обучения», 1954; «Технология обучения», 1968). Начиная с 50-х гг., осуществляется выход методов оперантного бихевиоризма в терапевтическую практику — так называемая терапия действия, или терапия поведения.
Продолжая намеченную уже в исследованиях 30-х гг. стратегию на применение результатов исследований к решению практических задач (обучение — одна из возможных областей такого применения), Скиннер разрабатывает идею управления поведением и создает технологию поведения, целью которой является разрешение социальных про-
блем общества путем модификации поведения человека средствами внешнего контроля («По ту сторону свободы и достоинства», 1971). Технология поведения выступает логическим — и трагическим — завершением натурализации человека в бихевиоризме.
В 70-ё гг. выходят труды, обобщающие прежние идеи: «О бихевиоризме», 1974; «Автобиография» в 2-х т., 1976; «Размышления о бихевиоризме и обществе», 1978. Широко влияние идей Скиннера за рубежом. Однако этот успех объясняется не одними научными достоинствами концепции, которая подвергается сокрушительной критике как в отечественной, так и в зарубежной психологии и оценивается как «довольно скромное распространение закона эффекта Тор-ндайка» (Цит. по: Талызина Н.Ф. Управление процессом усвоения знаний. — М., 1975. — С. 265). Влияние Скиннера выражалось в возникновении новых школ психиатрии, новой социальной практики, новых технологий обучения, ко-торые явились практической реализацией его идей.
Соч.: The Behavior of Organisms. — N. Y., 1938; Science and Human Behavior. — N. Y., 1953; The verbal Behavior. — N.Y., 1957; Beyond Freedom and Dignity. — N. Y., 1972; About Behaviorism. N. Y., 1974.
Лит.: Артыков Д.Р. Некоторые вопросы исторического анализа генезиса психологической концепции. — Вопросы психологии. — 1979, № 5. — С. 55—61; Артыков А.Р., Пис-коппель А.А. Философия радикального бихевиоризма — завершающий этап развития концепции Б.Ф. Скиннера. — Вести. Моск. ун-та. Сер. 14. Психология. — 1981, № 4; Талы-чша Н.Ф. Управление процессом усвоения знаний. — М.,
1975. — С. 258—272; Фейдимен Дж., Фрейгер Р. Личность и личностный рост. — Вып. 3. — М.; Изд-во Российского открытого университета. 1994; и др.
В сборник включена глава V— «Оперантное поведение» — из книги «Наука и человеческое поведение» (Scien-ce and Human Behavior), в которой излагаются основные
понятия концепции оперантного поведения Скиннера.
ОПЕРАНТНОЕ ПОВЕДЕНИЕ
Рефлексы, как условные, так и всякие другие, глав-ным образом связаны с внутренними физиологически-ми процессами в организме. Однако чаще всего нас
интересует такое поведение, которое имеет определенное воздействие на окружающий мир. Оно возникает в результате столкновения человека с необходимостью решать задачи, выдвигаемые жизнью. Кроме того, его специфические характеристики также представляют интерес для теории. Последствия поведения могут играть роль обратной связи для организма. В этом случае они изменяют вероятность осуществления поведения, породившего их. В английском языке много слов, имеющих отношение к данному эффекту, например «поощрение» и «наказание», но ясное представление о нем мы можем получить только в результате проведения эксперимента,
Кривые научения
В 1898 г. Э. Л. Торндайком была предпринята одна из первых серьезных попыток изучить изменения, обусловливаемые последствиями поведения. Его эксперименты возникли на основе дискуссии, которая впоследствии заинтересовала многих ученых. Ч. Дарвин, настаивавший на преемственности видов, подверг сомнению уникальность человека и его способность думать. В печати распространилось большое количество анекдотов, в которых говорилось о проявлении животными «силы разума». Но распространение особенностей, ранее характеризующих только поведение человека на поведение животных, привело к постановке новых вопросов. Указывали ли наблюдаемые факты на психические процессы или эти очевидные проявления мышления могут быть объяснены иначе? В конце концов отпала необходимость в представлении о внутренних мыслительных процессах. Должно было пройти много лет, прежде чем тот самый вопрос о специфичности поведения человека не возник вновь, но эксперименты Торндайка и его объяснение мышления (reasoning) животных явились важным шагом в этом направлении.
Если кошка помещается в ящик, из которого она может выбраться, открыв задвижку, она может проявить много видов поведения, некоторые из которых могут оказаться эффективными. Торндайк установил, что при многоразовом помещении кошки в ящик ус- пешное поведение наступало все быстрее и быстрее, и это продолжалось до тех пор, пока оно не стало предельно простым и быстрым. Кошка решала свою задачу, как разумное человеческое существо, хотя, возможно, и не так быстро. Однако Торндайк не видел за этим «мыслительных процессов» и утверждал, что они ненужны для объяснения. Он описал свои результаты, указав на то, что поведение кошки было «запечатлено» (stamped in), поскольку оно сопровождалось открытием двери.
Тот факт, что поведение запечатлевается или сопровождается определенными последствиями, Торндайк назвал «законом эффекта». В своих экспериментах он установил, что в рамках одной и той же ситуации определенное поведение протекает все более и более
стабильно в отличие от других поведенческих проявлений. «Фиксируя промежутки времени, которые требовались кошке для того, чтобы выбраться из ящика, он построил «кривую научения». Эта ранняя попытка описать поведенческий процесс количественно, аналогично описанию физических и биологических процессов, рассматривалась как важный шаг вперед. Он раскрыл процесс, который развертывался в течение длительного времени и который был доступен для наблюдения. Итак, Торндайк сделал открытие. С тех пор было получено много кривых, которые легли в основу многих психологических работ, посвященных научению.
Однако кривые научения не описывают сущность запечатления. Критерий Торндайка — время, необходимое животному для того, чтобы выбраться из клетки, — был связан с устранением других видов поведения, и его кривая зависела от ряда различных действий, которые могла выполнять кошка в определенном ящике. Форма кривой также зависела от поведения, которое было «успешным», и от того, был ли это редкий или обычный способ поведения в данном ящике. Можно сказать, что кривая научения, построенная таким образом, отражает свойства ящика с задвижкой, а не поведение кошки. Это положение распространяется на многие другие устройства, разработанные для изучения научения. Различные лабиринты, через которые белые крысы и другие животные учатся проходить, «ящики выбора», в которых животные научаются различать свойства, или паттерны стимулов, аппараты, посредством которых представляется последовательность стимулов, подлежащих усвоению при изучении памяти человека, — все они порождают различные кривые научения.
Усредняя многие показатели индивидов, мы можем сгладить эти кривые настолько, насколько хотим. Более того, кривые, полученные в различных условиях, могут иметь определенные общие свойства. Например, при измерении данным способом научение обычно «имеет негативную характеристику убыстрения» — улучшение выполнения наступает все более и более медленно до тех пор, пока оно вовсе не прекращается. Однако из этого не следует, что негативная акселерация характеризует сущность процесса. Предположим по аналогии, что мы наполнили стеклянный сосуд песком и так его перемешали, что песчинки одного и того же размера равномерно распределились внутри него. Если мы слегка встряхнем сосуд, то песчинки перераспределяются. Большие песчинки окажутся наверху, маленькие — внизу. Этот процесс также характеризуется негативной акселерацией. Сначала смесь перераспределяется быстро, но по мере приближения к его завершению процессы в распределении наступают реже и реже. Такая кривая может оказаться совершенно ровной и воспроизводимой, но один лишь этот факт не имеет большого значения. Кривая зависит от определенных процессов взаимодействия песчинок различного размера, от силы сотрясения сосуда и т. д., но в то же самое время она прямо не отражает сами эти процессы.
Кривые научения показывают, как различные виды поведения, порождаемые в сложных ситуациях, отбираются, закрепляются и реорганизуются. Базисный процесс запечатления отдельного акта осуществляет это изменение, но в самом изменении он прямо не отражен.
Оперативное обслуживание
Для понимания сущности закона эффекта Торндайка нам необходимо дать четкое определение понятия «вероятность реакции». Это очень важное понятие, но, к сожалению, очень трудное. При обсуждении поведения человека мы часто апеллируем к тенденциям «расположенности» вести себя определенным образом. Почти в каждой теории поведения используются такие термины, как «потенциал возбуждения», «сила привычки» или «детерминирующая тенденция». Но как мы наблюдаем тенденцию? И как можно ее замерить?
Если бы определенное поведение существовало в двух ипостасях — в одном случае оно всегда бы имеломесто, а в другом — никогда, то мы оказались бы почти в беспомощном состоянии при введении программы функционального анализа. Феномен, имеющий характеристики «все и ничего», имеет только простые формы описания. Гораздо более продуктивным является предположение, что вероятность осуществления реакции последовательно распределяется между этими двумя полюсами «все — ничего». Тогда мы можем рассмотреть переменные, которые в отличие от стимулов порождения (eliciting stimulus), «не являясь причиной данного поведения», делают его наступление более вероятным. Далее мы можем, например, рассмотреть последствия действия нескольких таких переменных.
Распространенные выражения, отражающие вероятностную природу явления, — «тенденция» или «предрасположенность» — характеризуют частоту наступления определенных видов поведения. Мы никогда не наблюдаем вероятность. Мы говорим, что кто-то «обожает бридж», потомучто замечаем, что он часто играетв бридж и часто говорит о нем, «Глубоко интересоваться» музыкой означает много играть, часто слушать музыку и много говорить о музыке. « Неисправимый игрок» много играет в карты. Любитель киносъемок делает снимки, проявляет их и любуется своими собственными снимками и снимками других людей и т. д.
Характеризуя поведение человека с точки зрения его частоты, мы принимаем определенные стандартные условия: он должен быть способен выполнить и повторить определенное действие, при этом другие виды поведения не должны мешать. Например, мы не можем знать, насколько сильна тяга человека к музыке, если ему приходится также заниматься другими вещами. Подойдя к проблеме уточнения научного определения вероятности, мы обнаруживаем, что исходными моментами являются частота и условия, при которых наблюдается то или иное поведение. Мы устраняем или покрайней мере сохраняем в неизменном виде любое условие, которое способствует проявлению конкурирующего с изучаемым нами видом поведения. Животное помещается в отдельный (quiet) ящик, и за его поведением наблюдают с помощью одноканального экрана, или оно регистрируется посредством специальных технических устройств. Эти условия нельзя рассматривать как вакуумную среду, так как животное будет реагировать на свойства ящика многими способами, однако его поведение постепенно достигнет достаточно устойчивого уровня, на котором можно исследовать частоту заданной реакции.
Для изучения процесса, который Торндайк назвал запечатлением, мы должны иметь его «последствие». Это может быть, например, предъявление еды голодному животному. Мы можем предъявлять нашему испытуемому еду в удобном для него месте, на большом подносе, с помощью специального устройства. При первом предъявлении подноса животное, вероятно, будет реагировать на него различными, поведенческими реакциями, которые мешают проявлению изучаемого нами поведения. Постепенно после нескольких кормлений оно без промедления принимает пищу и мы получаем возможность рассматривать это последствие как зависящее от поведения и наблюдать его результат. Мы выбираем относительно простой вид поведения, который свободно и многократно воспроизводим и который легко поддается наблюдению и регистрации. Например, если испытуемым является голубь, то поднятие им головы выше определенного уровня является удобным поведением для изучения. Оно может быть зафиксировано взглядом экспериментатора на шкале, прикрепленной к задней стенке ящика, на фоне которой находится голубь. Сначала мы изучаем естественную высоту поднятия головы голубем и выбираем на шкале отметку, которая достигается им только в отдельных случаях. Фиксируя свой взгляд на шкале, экспериментатор начинает очень быстро открывать поднос, как только голова поднимается выше этой линии. Если эксперимент проводится в соответствии со спецификациями, то получается один и тот же результат: мы наблюдаем быстрое изменение частоты пересечения головой голубя заданной линии. Мы также видим, что голова голубя поднимается на более высокий уровень, и этот факт имеет большое теоретическое значение. Мы можем очень быстро заставить голубя высоко поднимать голову, установив время предъявления пищи. Через одну-две минуты поза голубя изменяется таким образом, что его голова редко опускается ниже линии, которую мы выбрали вначале.
Когда мы демонстрируем процесс запечатления в такой относительно простой форме, мы видим, что некоторые обычные интерпретации эксперимента Торн-дайка избыточны. Выражение «научение путем проб и ошибок», которое часто связывается с законом эффекта, здесь явно неуместно. Мы вкладываем особый смысл в наши наблюдения, когда называем любое поднятие головы «пробой», и нет оснований считать «ошибочным» любое движение, которое не приводит к установленному нами результату. Даже употребление термина «науче-ние» вводит в заблуждение. Утверждение, что «птица научается получать пищу посредством вытягивания шеи», является неадекватным выражением того, что происходит. Говорить, что она приобрела «навык» вытягивать шею — значит просто обращаться к объясни-тельным вымыслам, поскольку единственным доказательством наличия навыка является приобретенная тенденция выполнять действие. Простейшим возможным описанием данного процесса является следующее: мы делаем данный контингент следствий зависимым от оп-ределенных физических свойств поведения (поднятия головы), далее фиксируем, что частота появления этого поведения возрастает. Принято рассматривать любое движение живого существа как реакцию. Это слово заимствовано из исследований, посвященных изучению рефлексов. Оно означает действие, которое наступает в ответ на предшествующее событие — стимул. Но мы можем сделать событие зависимым от поведения без определения предшествующего стимула. Мы не изменяем среду обитания голубя для того, чтобы вызвать поднятие головы. Вероятно, нельзя показать, что любой простой стимул неизменно предшествует этому движе-нию. Такое поведение может оказаться под контролем стимулов, но при этом отсутствуют отношения по типу одно порождает другое». Поэтомутермин «реакция» не вполне адекватен, но он настолько укоренился, что далее мы будем его использовать.
Конечно, нельзя предсказать и проконтролировать реакцию, которая уже произошла. Можно только предсказать, что похожие реакции будут наблюдаться в будущем. Поэтому единицей науки о прогнозировании является не реакция, а класс реакций. Для его описания будет использоваться слово «оперантный». Данный термин показывает, что поведение «воздействует» (operates) на среду, генерируя последствия. Следствия определяют свойства, по которым устанавливается сходство реакций. Он будет использоваться и как прилагательное (операн-тное поведение), и как существительное, обозначающее поведение, определенное данным следствием.
Поднятие голубем головы один раз в определенный момент является реакцией. Это прошлое и его можно рассматривать со всех точек зрения, которые представляют для нас интерес. Поведение, называемое «поднятием головы», которое происходит независимо от опреде- ленных обстоятельств (instances), является оперантным. Его можно описать не как завершенное действие, а как состав действий, определяющийся свойствами высоты, на которую нужно поднять голову. В этом смысле oпe-рант можно определить посредством следствия, характе-ризуемого с помощью физических терминов. «Поднятие головы» («cutoff») на определенную высоту является частью (property) поведения.
Традиционное употребление термина «научение» может быть сохранено для описания перераспределения реакций на классы в сложной ситуации. Терминология, необходимая для описания процесса запечатления, может быть заимствована из теории условных рефлексов И. П. Павлова. Сам Павлов называет все события, которые усиливают поведение «подкреплением» и все возникающие в связи с ним изменения, «обусловливанием». Однако в экспериментах Павлова подкрепление сочетается со стимулом, а при оперантном поведении оно зависит от реакции. Поэтому оперант-ное подкрепление является специальным процессом и нуждается в специальном анализе. В обоих случаях усиление поведения, происходящее в результате подкрепления, называется «обусловливанием». При оперантном обусловливании мы усиливаем оперант, чтобы увеличить вероятность или частоту появления реакции. В условиях павловского, или «респондентного», обусловливания мы просто повышаем величину реакции, вызванную условным стимулом, и сокращаем время между стимулом и реакцией. Мы уже отмечали,- что этими двумя случаями исчерпываются возможности: 1) организм обусловливается, когда подкрепление сопровождает другой стимул, или 2) следует за поведением организма. Любое событие, которое не приводит к одному из этих случаев, не влияет на изменение вероятности реакции. Тогда в эксперименте с голубем еда является тем, что подкрепляет, а ее предъявление, когда реакция «выделяется», является подкреплением. Оперант определяется свойствами, от которых зависит подкрепление — высотой, на которую должна подниматься голова голубя. Изменение частоты поднятия головы на эту высоту есть процесс оперантного обусловливания.
Находясь в состоянии бодрствования, мы постоянно воздействуем на среду, и многие последствия нашего поведения имеют силу подкрепления. Посредством опе-рантного обусловливания среда конструирует базисный репертуар поведения, благодаря которому мы сохраняем равновесие, ходим, играем в спортивные игры, пользуемся инструментами, говорим, пишем, гребем, управляем автомобилем и самолетом. Мы можем оказаться не готовыми к изменению в среде, например появлению нового автомобиля, нового друга, новых интересов, к смене работы и местожительства, но мы обычно быстро приспосабливаемся к новой обстановке, приобретая новые реакции и утрачивая старые. <...> Оперантное подкрепление не только структурирует репертуар поведения. Оно улучшает продуктивность поведения и еще долгое время сохраняет его после того, как его усвоение или продуктивность теряют свою значимость.
Количественные свойства
Совсем не просто получить кривую научения. Мы не можем полностью изолировать оперант и устранить все случайные помехи. Можно было бы построить кривую и показать, как частота поднятия головы на определенную высоту изменяется в зависимости от времени или количества подкреплений, но дело в том, что общий эффект больше. Происходит смещение в более крупной схеме поведения, и для того чтобы его полностью описать, необходимо проследить все движения головой. Даже в этом случае мы не исчерпаем всей проблемы. Высота поднятия головы была выбрана произвольно, и эффект подкрепления зависит от нее. Если подкрепить высоту, которая достигается редко, изменение в схеме будет гораздо больше, чем в случае, когда выбирается высота, на которую голубь обычно поднимает голову. Для адекватного объяснения необходимо получить набор кривых, описывающих все случаи. Если заставить голубя поднимать голову все выше и выше, появляется еще один произвольный элемент, так как можно использовать различные графики подкрепления. Каждый график дает свою кривую, и картину можно считать исчерпывающей, только если будут использованы все графики подкрепления.
Мы не можем обойти эти проблемы, выбрав реакцию, которая более строго определяется свойствами среды, например открытие двери. Определенный механический индикатор поведения, разумеется, предпочтительнее, поскольку, например, он позволяет организовать постоянное представление подкрепления. Можно регистрировать высоту поднятия голубем головы с помощью фотоэлемента, но легче выбрать такую реакцию, которая производит изменение в среде и которую легче регистрировать. Если птица научается нажимать на небольшой рычаг, находящийся на стене экспериментального ящика, можно сконструировать рычаг таким образом, чтобы он замыкал электрическую цепь, что позволит предъявлять поднос с пищей и регистрировать реакции. Думается, что такая реакция отличается от реакции поднятия головы тем, что она имеет характерна стику «все или ничего». Но ниже будет видно, что «реакция», которая не так произвольна, как реакция поднятия головы, не определяется механическими свойствами движения «нажатия на рычаг».
Нет необходимости иметь совершенное экспериментальное устройство для того, чтобы получить важные количественные данные об оперантном обусловливании. Мы уже можем оценивать много факторов. Важность обратной связи ясна. Организм можно стимулировать последствием его поведения, если имеет место обусловливание. Например, при обучении шевелить ушами необходимо знать, когда уши двигаются, если мы хотим подкреплять двигательные реакции. При переучивании больного пользоваться частично парализованной конеч-ностью можно с помощью специальных приспособлений или другого человека усиливать обратную связь при слабых движениях. Глухонемой научается говорить, только
если он поХучает обратную связь о своем поведении, что можно сравнить со стимуляцией, которую он получает от других говорящих людей. Одной из функций педагога является обеспечение произвольных (иногда ложных) последствий с целью получения обратной связи. Обусловливание также зависит от вида, количества и момента предъявления подкрепления, а также от многих других факторов.
Отдельное подкрепление может иметь значительный эффект. При благоприятных условиях один какой-нибудь резкий шаг может привести к увеличению частоты появления реакции в дальнейшем. В обычных сучаях такое значительное увеличение наблюдается уже после одного подкрепления, и дальнейший дополнительный прирост величины продолжается по мере предъявления последующих подкреплений. Это наблюдение ни в коей мере нельзя объяснить мгновенным изменением в сторону максимальной вероятности, по-скольку не выделен оперант в чистом виде. Увеличение частоты можно интерпретировать с точки зрения других поведенческих характеристик ситуации. Тот факт, что обусловливание организма может быть быстрым у животных такого «низкогоуровня развития», как крысы и голуби, приводит к интересным выводам. Различия в том, что обычно называют интеллектом, до некоторой степени объясняются различиями в скорости научения. Но не может существовать более быстрого научения, чем мгновенное увеличение вероятности реакции. Следовательно, специфичность человеческого поведения определяется какими-то другими факторами.
Управление (control) оперантным поведением
Экспериментальная процедура оперантного обусловливания не сложна. Создается контингент подкрепления и предъявляется организму в течение определенного периода времени. Затем на основе этого объясняется частота возникновения реакции. Что было сделано в направлении предсказания и управления поведением в будущем? Какие переменные заставляют нас предсказывать, будет или не будет реагировать организм? Какими переменными нужно управлять, чтобы заставить организм реагировать? Мы экспериментируем с голодным голубем. Это означает, что голубь лишался пищи в течение определенного периода времени или.до тех пор, пока он немного не терялв весе. В противоположность тому, что можно было бы ожидать, экспериментальные исследования показали, что сила эффекта пищевого подкрепления может не зависеть от количества пищи. Но наблюдается, что частота реакций, которая является результатом подкрепления, зависит от степени депривации. Даже если мы научили голубя вытягивать шею, он не будет этого делать, если он не голоден. Таким образом, имеется еще один способ контроля за его поведением: для того чтобы заставить голубя вытягивать шею, необходимо лишить его пищи. Выбранный оперант прибавляется ко всему тому, что будет делать голодный голубь. Контроль за реакцией объединился с контролем за лишением животного пищи. Оперант может также контролироваться с помо- щью внешнего стимула, являющегося еще одной пере-менной величиной, которую можно использовать для предсказания поведения и контроля за ним. Тем не менее следует отметить, что обе эти переменные мож-но вывести из самого оперантного под крепления.
Оперативное угашение
Когда подкрепление больше не поступает, реакция становится все менее и менее частой; этот процесс получил название « оперантного угашения». Если задержать подачу пищи, голубь перестанет поднимать голову. В общем, когда мы выполняем поведение, которое больше «не приносит нам никакой выгоды», мы утрачиваем тенденцию повторять его. Если мы потеряли авторучку, мы все реже и реже направляем руку в кар-ман, в котором она хранилась. Если нам не отвечают на телефонные звонки, то в конце концов мы перестаем звонить. Если пианино расстраивается, то мы все реже и реже на нем играем. Если звук нашего радиоприемника стал слишком громким или передачи стали хуже, мы перестаем его слушать.
Поскольку оперантное угашение протекает гораздо медленнее, чем оперантное обусловливание, постольку наблюдать за ним гораздо проще. При благоприятных условиях получаются плавные кривые, показывающие, что скорость реакций медленно уменьшается, возможно, в течение нескольких часов. Кривые раскрывают свойства, которые нельзя получить из наблюдения. У нас «может сложиться впечатление», что организм реагирует реже и реже, но за характером изменения можно проследить только при регистрации поведения. Кривые показывают, что угашение есть довольно однородный процесс, который определяет силу поведения.
При определенных условиях на кривую оказывают влияние эмоциональные реакции. Отсутствие подкрепления приводит не только к угашению операнта. Оно вызывает также реакцию фрустрации, или ярости. Голубь, который не получил подкрепления, отворачивает-
ся от рычага, воркует, хлопает крыльями и демонстрирует другие виды эмоционального поведения. Человек также демонстрирует подобные реакции. Ребенок, у которого велосипед не двигается с места, когда он нажимает на педали, перестает их крутить. Взрослый, который находит ящик письменного стола запертым, скоро перестает дергать ручку, но он может колотить по столу и браниться или может проявлять другие признаки гне-ва. Точно так же как ребенок вновь вернется к велосипеду, а взрослый — к ящику стола, птица вновь повернется к рычагу, когда эмоциональная реакция угаснет. Могут наблюдаться и другие явления эмоционального характера. В таких условиях кривая угашения характеризуется циклическими колебаниями, поскольку эмоциональные реакции появляются, исчезают и вновь появ-лются. Если каким-либо способом удается устранить эмоцию, кривая принимает более простую форму.
Поведение, которое наблюдается во время угашения, является результатом обусловливания, которое ему предшествовало, и в свете этого кривая угашения дает
еще одну меру эффекта подкрепления. Если было подкреплено всего лишь несколько реакций, угашение происходит быстро. Большое количество подкреплений приводит к длительному сохранению реакции. Силу сопротивления угашению нельзя предсказать по вероятности реакции, наблюдаемой в каждый отдельный момент. Необходимо знать историю подкрепления. Например, если мы получили подкрепление в виде великолепно приготовленной пищи в новом ресторане, невкусно приготовленная пища может «свести на нет» хорошее впечатление от этого ресторана; но если мы питались в ресторане качественной пищей в течение многих лет, то тогда, при прочих равных условиях, нам надо будет несколько раз принять невкусную пищу, прежде чем мы утратим склонность постоянно питаться в нем.
Между количеством подкрепленных реакций и количеством реакций, возникающих при угашении, нет простых связей. Сила сопротивления угашению в режиме прерывистого подкрепления может быть гораздо больше силы сопротивления угашению в случае, когда то же количество подкреплений дается за каждую реакцию. Таким образом, если мы только один раз случайно подкрепим ребенка за хорошее поведение, то оно при отсутствии подкрепления будет сохраняться дольше, чем в том случае, когда мы подкрепляем каждое правильное выполнение.
Этот вывод имеет практическую значимость в тех случаях, когда ценные виды подкреплений ограничены. Подобного рода проблемы возникают в области образования, промышленности, экономики и пр. В условиях некоторых режимов прерывистого подкрепления голубь может произвести 10 000 поведенческих реакций, прежде чем полностью завершится процесс угашения.
Угашение является эффективным способом устранения операнта из организма. Его не следует путать с другими процедурами, созданными для получения того же эффекта. В настоящее время предпочтение отдается наказанию, которое включаете себя различные процессы, и эффективность которого вызывает сомнения. С угаше-нием часто путают забывание. При забывании эффект обусловливания утрачивается просто по мере прохожде-ния определенного времени, в то время как угашение требует, чтобы реакция возобновлялась без подкрепле-ния. Обычно забывание наступает не быстро; большие кривые угашения были получены через шесть лет после того, как реакции голубей были подкреплены последний раз. Шесть лет составляют больше половины жизни голубей. В этот период времени голуби жили в таких условия х, в которых реакция не могла быть подкреплена. В поведении человека реакции научения, порожденные относительно определенными условиями, часто сохраняют-ся без использования на протяжении половины жизни человека. Утверждение, что ранний опыт определяет личность зрелого организма, предполагает, что эффект
оперантного обусловливания долгосрочен. Таким обра-зом, если из-за раннего опыта, полученного в детстве, мужчина женится на женщине, которая напоминает его мать, то это говорит о том, что эффект определенных подкреплений должен сохраняться долгое время. Большинство случаев забывания включают в себя оперантное по-ведение при контроле определенных стимулов, и их нельзя подвергнуть адекватному анализу до обсуждения проблемы контроля.
Эффект угашения. Условия процесса протекания угашения более или менее известны, однако сущность его часто понимают неправильно. Экстремальное угашение иногда называют «abulia». Определение этого
феномена как «отсутствие воли» мало что дает, поскольку отсутствие или наличие воли выводится из, наличия или отсутствия поведения. Однако термин представляет-
ся полезным, поскольку он предполагает, что поведение отсутствует по определенной причине, и мы можем провести то же самое различение другим способом. Поведение является сильным или слабым из-за действия многих различных переменных, и задача науки о поведении заключается в том, чтобы их выявлять и классифицировать. Каждый случай мы определяем в терминах переменных величин. Условия, которые возникают в результате длительного угашения, по лежащим на поверхности признакам напоминают инактивность, возникающую в результате действия других причин. Различия этих случаев надо искать в истории организма.
Целеустремленный писатель, отправляющий издателям одну рукопись за другой, когда все они были отвергнуты, может в конце концов заявить, что «он не может больше написать ни одного слова». Частично он парализован тем, что его «зажимают», но все-таки он продолжает настаивать на том, что он «хочет писать», и мы можем согласиться с ним и квалифицируем это так: чрезвычайно низкая вероятность реакции определяется угашением.
Однако другие переменные все еще сохраняют свое действие и если бы угашение не произошло, они бы дали высокую вероятность достижения.
Необходимо обратиться к условиям, при которых небольшая сила операнта является результатом угаше-ния. Некоторые формы психотерапии являются системами подкрепления, созданными для восстановления поведения, которое было утрачено в процессе угашения. Терапевт может сам давать подкрепление или он организует такие условия жизни, которые будут подкреплять поведение. В терапии профессионального продвижения, например, терапевты способствуют тому, чтобы пациент начал осуществлять простые формы поведения, мгновенно и сравнительно постоянно подкрепляемые. Объяснения, что такая терапия помогает пациенту потому, что дает ему чувство «достижения» или «укрепляет его нравственную сферу», «формирует его интересы» или предотвращает его от «разочарования», не дают никаких преимуществ. Такая терминология просто увеличивает объем объяснительных фикций. Человек, который действительно вовлечен в данный вид активности, проявляет не интерес, а демонстрирует эффект подкрепления. Мы не даем человеку «чувство достижения», а подкрепляем определенное его действие. Разочароваться — просто означает утратить возможность реагировать из-за отсутствия подкрепления. Наша проблема состоит лишь в том, чтобы объяснить вероятность реакции в терминах процесса подкрепления и угашения.
Какие события являются подкрепляющими?
Имея дело с людьми в жизни, клинике и лаборатории, мы должны знать, каков подкрепляющий эффект какого-либо специфического события. Мы часто замечаем, насколько наше собственное поведение подкрепляется одним и тем же событием. Нередко подобного рода практика уводит нас в сторону; тем не менее существует общепринятое мнение, что подкрепления можно определять в отрыве от рассмотрения их воздействий на определенный организм. Однако в соответствии с нашим использованием этого термина единственной определяющей характеристикой-подкрепляющего стимула является то, что он подкрепляет.
Для того чтобы сказать, подкрепляет ли в определеных условиях, необходимо провести прямое испытание. Мы наблюдаем за частотой выбранной реакции, затем делаем событие зависимым от нее и следим за изменениями, происходящими в его частоте. Если изменения имеют место, то тогда мы рассматриваем данное событие как подкрепляющее организм в данных условиях. В классифицировании событий на основе их эффектов нет ничего тавтологичного; используемый критерий является как эмпирическим, так и объективным. Однако он стал бы тавтологичным, если затем мы стали бы утверждать, что данное событие усиливает оперант, потому что оно подкрепляет. Мы достигаем определенных успехов, когда нам удается угадать подкрепляющее событие только в результате «грубого» наблюдения. Так как мы испытали подкрепляющий эффект стимула на себе, мы допускаем, что он будет оказывать то же воздействие и на других. Мы достигаем успеха только тогда, когда рассматриваем себя как организм, подвергаемый изучению, и корректно наблюдаем за собственным поведением.
Можно выделить два типа событий, обладающих эффектом подкрепления. Некоторые подкрепления представляют собой предъявление стимулов или добавление чего-то, например воды, еды или возможности сексуального контакта в ситуацию. Они называются
положительными подкреплениями. Другой тип подкрепляемых событий состоит в устранении чего-либо, напри-мер сильного шума, яркого света, холода, жары или
электрического шока из ситуации. Это — отрицательное подкрепление. В обоих случаях сохраняется один и тот же эффект подкрепления — вероятность реакции повышается. Мы не можем обойтись без этого различения, просто указав на то, что в негативной ситуации подкрепляет отсутствие яркого света, сильного шума и т. д., поскольку воздействие оказывает именно отсутствие чего-либо после его презентации, и это еще один способ выражения того, что стимул устранен. Различия между двумя случаями станут яснее, когда мы рассмотрим случаи с презентацией негативного подкрепления, или случаи с устранением позитивного подкрепления. Их последствия мы называем наказанием. В условиях практического применения оперантно-го обусловливания часто бывает необходимо наблюдать за событиями, оказывающими подкрепляющее воздействие на данного индивида. В любой области, важной характеристикой которой является поведение, — образовании, управлении, семье, здравоохранении, промышленности, искусстве, литературе и т. д. — мы постоянно изменяем вероятности реакции с помощью их подкрепления. Промышленник, который хочет, чтобы его рабочие работали постоянно и без прогулов, должен заботиться о соответствующем подкреплении их поведения, и не только с помощью заработной платы, но также и с помощью подходящих условий работы. Девушка, которая хочет еще раз встретиться с молодым человеком, должна быть уверена, что поведение ее друга, связанное с назначением свидания и желанием сдержать свое слово, получило адекватное подкрепление. Для того чтобы обучить ребенка читать или петь, или играть на музыкальном инструменте, необходимо разработать программу педагогических подкреплений, в соответствии с которой правильные реакции должны постоянно «оцениваться». Если пациенту необходимо еще раз обратиться к врачу за консультацией, то последний должен быть уверен в том, что данное поведение пациента получило соответствующее подкрепление. Мы оцениваем силу подкрепляющих событий, когда пытаемся установить, что «человек выбирает в жизни». Какие следствия определяют репертуар его поведения и относительную частоту реакций, входящих в него ? Кое-что об этом говорят нам реакции на различные темы, обсуждаемые в разговоре, но его обычное поведение является еще лучшим ориентиром. Мы делаем вывод о значимых видах подкрепления на основании проявления им интересов к какому-то писателю, освещающему определенные проблемы, к магазинам или музеям, в которых представлены определенные предметы, к друзьям, проявляющим определенные виды поведения, к ресторанам, в которых подают определенную пищу и т. д. «Интерес» соответствует вероятности, являющейся результатом, по крайней мере частично, последствий поведения «проявления интереса». Мы можем быть почти уверены в значимости подкрепления, если наблюдаем за тем, как начинается и протекает поведение по мере чередующегося предъявления и удержания подкрепления, так как тогда изменение вероятности, очевидно, будет в меньшей степени определяться случайным изменением какого-то другого вида. Поведение, которое ассоциируется с дружбой с каким-либо человеком, изменяется, поскольку этот человек изменяет поставляемые им подкрепления.
Если мы пронаблюдаем за подобными изменения-м и, то сможем составить вполне определенное мнение о том, «что означает эта дружба» или «что наш испытуемый видит в своем друге».
Данная процедура наблюдения может быть усовер-шенствована с целью ее применения в клинических и лабораторных исследованиях. Можно составить набор картинок, предоставив испытуемому возможность просмотреть их и при этом записав время разглядывания каждой из них. Поведение «разглядывания картинки» подкрепляется тем, что видится в ней. Рассматривание одной картинки может иметь больший эффект подкрепления, чем рассматривание другой картинки и, время, затрачиваемое на рассматривание картинок, также будет варьировать. Эта информация может быть применена в тех случаях, когда возникает необходимость по какой-либо причине подкрепить или устранить по-веденческие-реакции нашего испытуемого.
Литературу, живопись и эстраду можно рассматри-ватъ как хорошо продуманные подкрепления. Так или иначе приобретение книг, билетов на представления и выставки произведений искусства зависит от того, яв-ляются ли эти книги, пьесы, концерты или картины подкреплениями. Часто художник ограничивает себя поисками того, что является подкреплением для него» самого. Когда он действует таким образом, в его работе "отражается его собственная индивидуальность», и тогда только случайно (как мера универсальности) его книга или пьеса или музыка, или картина оказывают подкрепляющее воздействие на других. Поскольку ком-мерческий успех имеет большое значение, постольку с его помощью можно непосредственно изучать поведение других людей.
Для выяснения того, что является подкреплением для данного человека, мы не можем ограничиться простым вопросом к нему о том, что его подкрепляет. Его ответ может представлять определенную ценность, но его ни в коем случае нельзя считать надежным. Подкрепляющие связи не всегда очевидны для человека.
Часто только в ретроспективе тенденции человека вести себя определенным образом рассматриваются как результат определенных последствий, и отношения могут совсем не репрезентироваться субъекту, даже если они очевидны для других людей.
Конечно, существуют большие различия между индивидами в отношении событий, которые имеют силу подкрепления. Различия между видами настолько велики, что едва ли они могут представлять интерес; очевидно, что-то, что подкрепляет лошадь, необязательно подкрепляет собаку или человека. Среди представителей вида большие различия могут объясняться не столько наследственностью, но и историей жизни индивида, обстоятельства которой могут быть прослежены. Тот факт, что организм наследует способность получать подкрепления в виде определенных событий, не может использоваться для предсказания неиспытанного, стимула. Также и отношения между подкрепляющим событием и депривацией или любым другим условием организима не наделяют подкрепляющее событие никакими определенными физическими качествами. Особенно невероятно, чтобы событие, которое приобрело силу подкрепления, выделилось бы каким-то определенным образом. Тем не менее такие события являются важными видами подкрепления.
Условные подкрепления
Презентируемый при оперантном подкреплении стимул может быть соединен с другим стимулом, представленным в респондентном обусловливании. В гл. 4 мы рассмотрели условия приобретения способности вызывать реакцию; здесь остановимся на феномене подкрепления. Хотя подкрепление имеет другую стимульную функцию, процесс, возникающий при сочетании стимулов, представляется таким же. Если Голодному животному часто предъявлять пищу на подносе, то пустой поднос вызывает выделение слюны. В определенной степени пустой поднос также будет подкреплять оперант.
Можно еще проще продемонстрировать условное подкрепление на примере стимулов, которые легче контролировать. Если каждый раз, давая пищу голодному голубю, мы будем включать свет, то свет постепенно станет условным подкреплением. Он может использо-
ваться для обусловливания операнта так же, как используется пища. Нам уже кое-что известно о том, как свет приобретает это свойство: чем чаще свет сочетается с пищей, тем большую силу как подкрепление он приобретает; нельзя предъявлять пищу вслед за светом через большие промежутки времени; сила подкрепления быстро утрачивается, когда пища не предъявляется. Все это вытекает из наших знаний о стимульном обусловливании. Условные подкрепления часто являются продуктом естественных контингентов. Обычно пища или вода получаются только после того, как организм выполнил «предшествующее» поведение — после того, как он воздействовал на среду, чтобы создать возможность для того, чтобы поесть и попить. Поэтому стимулы, порожденные этим «предшествующим» поведением, становятся подкреплениями. Таким образом, прежде чем мы сможем успешно перенести пищу с тарелки к себе в рот, необходимо приблизиться к тарелке, и любое поведение, которое приближает нас ктарелке, автоматически подкрепляется. Следовательно, поддерживается сила «предшествующего» поведения. Это имеет большое значение, поскольку только незначительная часть поведения сразу подкрепляется пищей, водой, сексуальным контактом или другими событиями биологической важности. Хотя характерной особенностью человеческого поведения является то, что важные подкрепления могут быть эффективными при отсрочке на большие промежутки времени, это объясняется, по-видимому, тем, что промежуточные события становятся условными подкреплениями. Когда человек в октябре укрепляет на окнах своего дома вторые рамы, потому что в результате аналогичного поведения в октябре прошлого года в январе в доме было тепло, нам необходимо определить, как заполняется промежуток между поведением в октябре и его эффектом в январе. Среди условных подкреплений, ответст-венных за силу этого поведения, есть определенные вербальные последствия, исходящие от самого человека или его соседей. Иногда бывает важно оставить ряд событий между действием и конечным важным подкреплением для того, чтобы осуществлять контроль за поведением в практических целях. В сфере образования, промышленности, психотерапии и др. мы сталкиваемся с различными методиками, разработанными для создания соответствующих условных подкреплений. Обеспечение непосредственных эффективных последствий тогда, когда конечные последствия отсрочены, должно «улуч-шатьмораль», «усиливать интерес», «предотвращать появление чувства неуверенности» или корректировать условия низкой оперантной силы, которые мы называем «abulia», и т. д. Конкретизируя это положение, можно сказать, что оно побуждает студентов учиться, лиц, нанятых на работу, приходить в учреждения, больных принимать посильное участие в общественной жизни и т. д.
Обобщенные (generalized) подкрепления. Условное подкрепление обобщается (is generalized), когда оно сочетается более чем с одним первичным подкреплением. Генерализованное подкрепление оказывается полезным потому, что состояние организма в данный момент необязательно является значимым. Оперантная сила, генерализованная посредством только одного подкрепления, наблюдается при создании соответствующего условия депривации: когда мы подкрепляем пищей, мы получаем возможность управлять голодным животным. Но если условное подкрепление сочетается с подкреплениями, соответствующими многим условиям, тогда по крайней мере одно из них, соответствующее состоянию депривации, должно будет оказать влияние на последующую ситуацию. Поэтому реакция должна будет произойти. Например, когда мы подкрепляем деньгами, организуемое нами управление относительно независимо от кратковременных депривации. Создается один вид обобщенного подкрепления, потому что многие первичные подкрепления получаются только после предъявленных преобразований физической среды.
В различных ситуациях одна форма «предшествующего» поведения может вести за собой различные виды подкреплений. Непосредственная стимуляция на основе такого поведения становится обобщенным подкреплением. Мы автоматически получаем подкрепление, независимо от любой определенной депривации, когда мы успешно осуществляем контроль за физическим миром. Этим объясняется наша тенденция увлекаться профессиональным мастерством, художественным творчеством и такими видами спорта, как игра в кегли, биллиард и теннис.
Однако возможны ситуации, при которых некоторые эффекты подкрепления «сенсорной обратной связи» не обусловливаются. Оказывается, что ребенок подкрепляется стимуляцией, идущей из среды, за которой не следует первичное подкрепление, например действие детской погремушки. Способность получать подкрепление таким образом могла возникнуть в эволюционном процессе, и она, возможно, аналогична подкреплению, которое мы получаем, просто «организуя мир соответствующим образом». Любой организм, который подкрепляется успешным взаимодействием со средой, несмотря на последствия в-каждый момент, окажется в более благоприятных условиях, когда последуют значимые последствия.
Когда поведение подкрепляется другими людьми, появляется несколько важных генерализованных подкреплений, например внимание. Всем известны случаи, когда ребенок плохо ведет себя «только для того, чтобы привлечь к себе внимание». Внимание людей подкрепляет, потому что оно является необходимым условием других подкреплений, исходящих от них. Вообще, только те люди, которые внимательны к нам, подкрепляют наше поведение. Внимание со стороны людей, которые прежде всего обычно являются источниками подкрепления — родителей, учителя или любимого человека, — служит особенно хорошим обобщенным подкреплением и формирует особенно сильное поведение «получения внимания». Специфичность многих вербальных реакций состоит в том, что они привлекают .внимание, например «смотри», «пойми», а также произнесение имени чело-века. Другими характерными формами поведения, кото-рые можно назвать сильными, потому что они требуют внимания, являются симуляция болезни, раздражен-ность и броскость (самореклама).
Часто внимания бывает недостаточно. Другой чело-век может подкрепить только ту часть поведения данного человека, которое он одобряет, и, следователь-но, любой признак его одобрения по праву становится подкрепляющим. Поведение, которое вызывает улыбку, или вербальную реакцию «Правильно», «Хорошо», или любую другую похвалу, подкрепляет. Мы пользуемся этим обобщенным подкреплением для формиро-вания поведения других людей, особенно в сфере образования. Например, мы обучаем детей и взрослых говорить правильно, произнося «Правильно», когда они дают правильную поведенческую реакцию.
Еще более сильным генерализованным подкреплением является аффектация. Она может быть прежде всего связана с сексуальным контактом как первичным подкреплением, но когда тот, кто вызывает аффектацию, также вводит другие виды подкрепления, эффект генерализуется.
Трудно дать определение внимания, одобрения и аффекта и также трудно наблюдать за ними и измерять их. Они являются не вещами, а аспектами поведения других. Их неуловимые физические параметры представляют трудность не только для ученого, который должен изучать их, но также и для индивида, которого они подкрепляют. Если мы не можем легко обнаруживать, что человек обращает внимание на нас, одобряет наше поведение или что мы привлекательны для него, тогда наше поведение не будет последовательно подкрепляться. Поэтому оно может оказаться слабым, может иметь тенденцию протекать в несоответствующее время и т. д. Мы не знаем, что делать для того, чтобы «привлечь к себе внимание», «вызвать любовь», или «когда это делать». Ребенок, борясь за внимание, влюбленный — за проявления любви, художник — за одобрение его произведений, демонстрируют стойкое поведение, которое является только результатом прерывистого подкрепления.
Другим генерализованным подкреплением является подчиненность других людей. Когда человек бывает вынужден давать различные подкрепления, то любое указание на его подчиненность становится подкреплением. Задиристого человека всегда подкрепляют признаки трусости, а представителей правящего класса — признаки уважения. Престиж и уважение являются генерализованными подкреплениями только постольку, поскольку они гарантируют, что другие люди будут действовать определенным образом. То, что наличие своего собственного образа действия подкрепляет, можно показать на примере поведения тех людей, которые управляют ради того, чтобы управлять. Физические признаки покорности обычно не бывают столь неуловимыми, как свойства внимания, одобрения и любви. Задиристый человек может настаивать на проявлении четких признаков признания его доминирования, а ритуальные обычаи могут подчеркивать уважение.
Источники обобщенных подкреплений легко забываются, и они рассматриваются как подкрепления имеющие якобы самостоятельную силу. Мы говорим о потребности во внимании, одобрении или аффекте, о «потребности в доминировании» и «любви к деньгам», как будто бы они являются первичными условиями депривации. Но способность к подкреплению с помощью подобных средств едва ли может развиться за короткий промежуток времени, в течение которого преобладают необходимые условия. Внимание, аффект, одобрение и подчинение, по-видимому, существовали в человеческом обществе только короткий промежуток времени в процессе эволюции. Более того, они не представляют собой-фиксированные формы стимуляции, поскольку зависят от особенностей склада определенных групп. Поскольку аффектация главным образом связана с сексуальной сферой, постольку она может быть связана с условием первичной депривации, которая в определенной мере независима от истории жизни человека, но признаки «удовольствия», которые приобретают силу подкрепления- благодаря их связи с сексуальным контактом или с другими-подкреплениями, едва ли могут обладать эффектом подкрепления по генетическим причинам. Символы появились еще позднее, и редко высказывается мнение, что потребность в них врождена. Обычно мы можем наблюдать за процессом, в котором ребенок начинает получать подкрепление в форме денег. Однако часто «любовь к деньгам» кажется независимой от «потребности в одобрении», но если мы более детально рассмотрим эффективность этих генерализованных подкреплений, у нас окажется столько же оснований для признания врожденной потребности к деньгам, как и для признания врожденной потребности во внимании, удовольствии или доминировании.
Обычно генерализованные подкрепления оказываются эффективными, даже если первичные подкрепления, на которых они основываются, больше их не сопровождают. Мы играем в игры, требующие определенных навыков ради них самих. Аффекты не всегда вызываются сексуальным подкреплением. Подчиненность других людей подкрепляет, даже если мы не используем ее. Эффект подкрепления деньгами жадного человека может оказаться настолько сильным, что он может обречь себя на голод, чтобы не лишиться их. Эти факты, поддающиеся наблюдению, должны занять надлежащее место при построении террий и изучении практики. Они не означают, что обобщенные подкрепления представляют собой нечто большее, чем физические свойства стимулов, наблюдаемые в каждом случае, или что существуют какие-то нефизические данности, которые необходимо принимать во внимание.
Почему подкрепление подкрепляет?
Закон эффекта не является теорией. Это просто правило, объясняющее усиление поведения. Когда мы подкрепляем реакцию и наблюдаем за. изменениями ее частоты, можно легко описать то, что произошло, в объективных терминах. Но при объяснении того, почему это произошло, необходимо обратиться к теории. Почему подкрепление подкрепляет? Одна из теорий утверждает, что организм повторяет реакцию, потому что он находит, что его следствия «приятны» или «приносят удовлетворение». Но в каком смысле это является объяснением для естественной науки? Такие характеристики, как «приятный» или «приносящий удовлетворение», вероятно, не относятся к физическим свойствам того, что подкрепляет, поскольку физическая наука не использует ни эти термины, ни какие-либо другие их эквиваленты. Термины должны характеризовать определенное воздействие на организм, но можно ли его определить таким образом, чтобы оно было пригодным для объяснения подкрепления?
Иногда полагают, что вещь является приятной, если индивид стремится к ней или сохраняет ее, и она считается неприятной, если индивид избегает или отвергает ее. Сделано много попыток найти объективное определение, но все они уязвимы для критики: определяемое поведение может быть просто еще одним продуктом эффекта подкрепления. Утверждение, что стимул приятен, потому что организм стремится приблизиться к нему или удержать его, может быть еще одним способом выражения того, что стимул подкре- пил поведение «приближения» или «удержания». Вместо того чтобы определять эффект подкрепления с точки зрения его воздействия на поведение в общем, мы просто определили известный нам вид поведения, который почти с неизбежностью подкреплялся и, следовательно, в общем является пригодным в качестве индикатора силы подкрепления. Если продолжать утверждать, что стимул подкрепляет потому, что он приятен, тогда то, что выдвигается как объяснение, включающее два эффекта, в действительности является излишним описанием одного из них.
Альтернативный подход к описанию характеристик «приятный» и «неприятный» (или «приносящий удовлетворение» и «раздражающий») заключается в том, что испытуемого спрашивают, что он ощущает, когда имеет дело с определенными событиями. Это предполагает, что подкрепление имеет два эффекта: усиливает поведение и порождает «чувства» и что одно является функцией другого. Но функциональные отношения можно рассмотреть и в другой плоскости. Когда человек сообщает, что событие приятно, он может просто иметь в виду, что это такое событие, которое подкрепляет его или по отношению к которому он обнаруживает в себе тенденцию стремиться, двигаться, так как оно подкрепляет такое движение. Далее мы увидим, что человек мог бы и не приобретать вербальные реакции, указывающие на его ощущение удовольствия, если бы подобный феномен не имел бы места. В любом случае сам испытуемый не получает преимуществ, фиксируя таким образом свои наблюдения. Субъективные суждения об удовольствии или удовлетворении, порождаемые стимулами, как правило, ненадежны и неустойчивы. Как подчеркивается в теории бессознательного, мы не можем давать самоотчет о всех событиях, кото-рые проявляют себя как подкрепляющие нас, или мы можем сообщить о том, что вступает в прямое противоречие с объективными наблюдениями; также мы можем назвать неприятным событие, которое в действительности подкрепляет. Примеры такой аномалии варьируют от мазохизма до мученичества.
Иногда утверждают, что подкрепление оказываете эффективным потому, что оно редуцирует состояние депривации. В данном случае имеет место по крайней мере побочный эффект, который не следует путать с самим подкреплением. Очевидно, что депривация имеет большое значение для оперантного обусловливания. В наших экспериментах мы имеем дело с голодным голубем и по-другому не можем продемонстрировать оперантное обусловливание. Чем голоднее птица, тем чаще она реагирует в результате подкрепления. Но, несмотря на эту связь, неправильно было бы считать, что подкрепление всегда редуцирует депривацию. Обусловливание может наступать прежде любого значительного изменения в депривации, измеряемой другими способами.
Связь между насыщением и подкреплением следует искать в процессе эволюции. Едва ли можно оставить без внимания тот факт, что первичные подкрепления играют огромную биологическую роль. Пища, вода, сексуальный контакт и избегание боли явно связаны с благополучием организма. Индивид, который подкрепляется такими событиями, приобретает в высшей степени эффективное поведение. Также биологически значимым является то обстоятельство, согласно которому поведение, порождаемое определенным подкреплением, с большей вероятностью появляется в состоянии депривации. Таким образом, важным является не только то, что любое поведение, которое приводит к приему пищи, должно стать важной частью поведенческого репертуара, но и то, что это поведение оказывается особенно сильным, когда организм голоден. Эти две особенности организма, по-видимому, определяют то, что организм может подкрепляться специфическими способами и что результат будет наблюдаться в релевантных условиях депривации.
Некоторые формы стимуляции получают положительное подкрепление, хотя они не вызывают поведения, имеющего биологическое значение. Ребенок подкрепляется не только пищей, но и звоном колокольчика или блеском яркого предмета. Поведение, которое постоянно следует за этими стимулами, характеризуется увеличением вероятности. Трудно, а может быть и невозможно проследить эти эффекты подкрепления в истории обусловливания. Позднее мы можем обнаружить, что того же самого индивида подкрепляют звучание оркестра или красочный спектакль. В данном случае еще труднее убе- диться в том, что эффект подкрепления не обусловлен.
Однако можно утверждать, что способность получить подкрепление из среды с помощью любой обратной связи была бы биологическим достижением, поскольку она готовила бы организм к успешному управлению средой, прежде чем сформируется данное состояние депривации. Когда организм порождает тактильную обратную связь, например, ощущение текстуры материала или поверхности скульптуры, обусловливание обычно рассматривается как результат сексуального подкрепления даже тогда, когда стимулируемая область по функции не является первично-сексуальной. В этой связи хотелось бы предположить, что другие формы стимуляции, продуцированные поведением, точно так же связаны с биологически значимыми событиями.
Когда среда изменяется, тогда способность получать подкрепление данным событием с биологической точки зрения может рассматриваться как недостаток. Сахар является очень обильным подкреплением для большинства представителей человеческого рода, о чем свидетельствует огромное количество прилавков для продажи сладостей. В этом отношении его эффект гораздо превосходит биологическую потребность в нем в наши дни.
Этого не было до того, как сахар стал выращиваться и производиться в большом количестве. Несколько сот лет тому назад сильный подкрепляющий эффект сахара, вероятно, был оправдан. Среда изменилась, но генетические возможности организма остались на пре-жнем уровне. Секс является еще одним примером. В настоящее время сильный эффект сексуального контакта не является преимуществом организма, но нам нет необходимости возвращаться на много лет назад, для того чтобы обнаружить условия голода и эпидемий, при которых сила сексуального подкрепления была оправдана. Объяснение силы подкрепления биологией орга-низма можно продолжать до тех пор, пока мы будем говорить о том, почему то или иное событие подкрепля-ет. Для функционального анализа такое объяснение, вероятно, ничего не даст, так как оно не дает никаких способов идентификации подкрепляющих стимулов, прежде чем мы не испытаем его подкрепляющего воздействия на организм. Следовательно, мы должны довольствоваться объяснением с точки зрения воздействий стимулов на поведение.
Непредвиденные обстоятельства и «суеверное» поведение
Утверждалось, что эксперименты Торндайка нетипичны для процесса научения, поскольку кошка не может «видеть связей» между движением задвижки и «выходом из ящика». Но в оперантном обусловливании фиксирование связей не является существенным моментом. Как во время, так и после обусловливания человек часто рассказывает о связи своего поведения с окружающей его средой. Его отчет может оказаться пригодным для научного объяснения, и его реакция на его собственное поведение может даже оказаться важным связующим звеном в определенных сложных процессах. Но в простых процессах оперантного обусловливания такие отчеты или реакции не требуются. Это объясняется тем, что человек может оказаться неспособным описать контингенты подкрепления, которые имели явно выраженный эффект.
Также отсутствует необходимость в каких-либо перманентных связях между реакцией и ее подкреплением.
Мы делаем прием пищи зависимым от реакции голубя, организуя механические и электрические связи. За пределами лаборатории ситуации, в которых возникают связи между поведением и его следствием, определяются различными физическими системами. Но это никак не влияет на организм, и в этом никакой необходимости нет. Что касается самого организма, то единственно важное свойство контингента подкрепления — в его временном характере. Подкрепление следует за реакцией. Каким образом это происходит, значения не имеет.
Мы должны допустить, что презентация подкрепления всегда что-то подкрепляет, поскольку она неизбежно совпадает с каким-либо поведением. Мы знаем, что уже одно подкрепление может иметь значительный эффект. Если устанавливается только случайная связь между реакцией и появлением стимула, поведение называется «суеверным». Мы можем показать это на примере с голубем, аккумулируя эффект нескольких случайных обстоятельств. Предположим, что мы будем давать голубю небольшое количество еды каждые пятнадцать секунд, независимо от того, что он делает. Когда пища предъяв-
ляется первый раз, он выполняет какие-то поведенческие реакции — если только он не будет стоять спокойно — и произойдет обусловливание. Тогда более вероятно, что при предъявлении пищи снова будет наблюдаться то же самое поведение. Если это произойдет, то оперант будет еще более усилен. Если этого не произойдет, то будетусилено какое-то другое поведение. Обычно данное поведение достигает частоты, с которой оно подкрепляется. В дальнейшем оно становится постоянной частью репертуара птицы, даже если пища предъявлялась в такое время, которое не связано с поведением птицы. Видимые реакции, которые были установлены таким образом, включают резкие наклоны головы, переступание с ноги на ногу, наклоны и шарканье ногами, повороты вокруг своей оси, неестественную по-. ходку и наклоны головы. В дальнейшем топография поведения может сместиться на другие подкрепления, поскольку легкие изменения в форме реакции могут совпадать с приемом пищи.
При продуцировании «суеверного» поведения важное значение имеют интервалы, через которые подается пища. За шестьдесят секунд эффект подкрепления утрачивается в значительной мере, прежде чем появляется другой, и вероятность появления другого поведение больше. Следовательно, вероятность появления «суеверного» поведения меньше, хотя оно может иметь место, если эксперимент выполняется на протяжении длительного времени. Через пятнадцать секунд обычно эффект бывает почти, мгновенным. Когда «суеверная» реакция устанавливается, она будет сохраняться, даже если она будет подкрепляться изредка.
Голубь не является исключением. Поведение людей также во многом «суеверно». Только небольшая часть поведения, усиливаемая непредвиденными обстоятельствами, становится ритуалом, который мы называем «суеверием», однако сам принцип сохраняется в силе. Предположим, что, прогуливаясь по парку, вы находите десять долларов (и предположим, что это событие имеет для вас значительный подкрепляющий эффект). То, что мы делали в момент, когда мы нашли деньги, подкрепляется. Конечно, трудно привести строгие доказательства, но весьма вероятно, что мы вновь пойдем на прогулку именно в тот же парк или в парк, похожий на этот, и более нероятно, что мы будем смотреть именно на то место, где были найдены деньги, и т. д. Это поведение будет варьироваться в зависимости от состояния депривации, которому релевантны деньги. Его не следует называть «суеверным», но оно порождается ситуацией, которая редко оказывается «функциональной».
Некоторые ситуации, которые продуцируют «суеверное» поведение, не являются абсолютно случайными. Иногда за реакцией следует следствие, которое тем не менее ее не «продуцирует». Это можно лучше всего показать на примерах с таким типом стимула, который подкрепляет после его устранения. Прекращение кратковременной стимуляции такого вида может подкреплять поведение, порождаемое его началом. Когда появляется неприятный стимул, организм приходит в состояние активности; стимул прекращает свое действие, и это подкрепляет определенную часть поведения. Определенные заболевания, хромота, аллергия таковы, что любые меры, лредпринятые для того, чтобы вылечить их, вероятно, будут подкреплять, когда состояние улучшится. Необязательно, чтобы данная мера была актуально связана с лечением. Ритуалы, используемые в ненаучной, народной медицине, вероятно, можно объяснить с точки зрения этой характеристики многих форм заболеваний.
В «суеверном» оперантном поведении, как и в условных «суеверных» рефлексах, процесс обусловливания терпит неудачу. Обусловливание дает организму большие преимущества, вооружая его средствами поведения, которое позволяет ему действовать в новых условиях, однако не существует способов предотвращения усвоения неэффективных приемов случайного поведения. Любопытно, что эта трудность, вероятно, возрастала по мере развития обусловливания в процессе эволюции. Если, например, для изменения вероятности реакции всегда требовалось три подкрепления, «суеверное» поведение было бы невероятным. Только потому что организм достиг такого уровня, на котором уже один контингент приносит значительные изменения поведения, они могут совпадать.
В человеческом обществе «суеверные» ритуалы включают в себя вербальные формулы и передаются как часть культуры. В этом смысле они отличаются от простого эффекта оперантного подкрепления. Но, вероятно, их источником является один и тот же процесс, и их, должно быть, поддерживают случайные условия, которые имеют такой же паттерн.
Цели, намерения и другие конечные причины поведения
Неправильно говорить, что оперантное подкрепление «усиливает» реакцию, которая предшествует ему. Реакция уже произошла и не может измениться. Изменению подвергается будущая вероятность реакции одного и того же класса. Именно оперант как класс поведения, а не реакция как определенный случай подвергается обусловливанию. Следовательно, отсутствуют нарушения фундаментальных принципов науки, которые исключают «конечные причины». Но этот принцип нарушается, когда начинают утверждать, что поведение находится под контролем «мотивов» или «целей», которых организм еще не достиг, Или «намерений», которых он . еще не выполнил. Утверждения, В которых используются такие слова, как «мотив», или «цель», обычно сводятся к утверждениям об оперант-ном обусловливании, и необходимо внести лишь небольшое изменение, для того чтобы ввести их в русло естественной науки. Вместо того чтобы говорить, что человек ведет себя соответствующим образом потому, что есть следствия, которые должны следовать за его поведением, мы просто говорим, что он ведет себя так потому, что имеются следствия, которые следовали за похожим поведением в прошлом. Это, конечно, закон эффекта, или оперантное обусловливание.
Иногда утверждают, что данную реакцию нельзя полностью описать до тех пор, пока не будут рассмотрены ее цели как ее «текущее» свойство. Но что имеется в виду под словом «описать»? Если мы пронаблюдаем за человеком, идущим по улице, мы сможем описать это событие на языке физической науки. Если затем мы добавим, что его цель состояла в том, чтобы опустить письмо, дополнит ли это то, что было выражено в первом высказывании? Вероятно, ответ будет положительным, так как человек может идти по улице «по многим причинам» и в каждом случае физический способ передвижения останется одним и тем же. Однако различительную грань необходимо проводить не по линии пове
дения, а по линии переменных величин, от которых поведение зависит функционально. Цель является свойством не самого поведения, а является способом обращения к контролирующим переменным. Если мы составляем наше описание после того, как мы увидели, что человек опустил свое письмо в почтовый ящик и повернул обратно, мы приписываем ему цель события, которое заставило его идти по улице. Это событие придает «смысл» его выполнению не посредством расширения описания как такового, а посредством указания на независимую переменную, функцией которого оно могло бы быть. Мы не можем увидеть его цель, не увидев, что он опустил письмо, если только прежде мы не наблюдали подобного поведения и подобных следствий. В тех случаях, когда мы это делаем, мы пользуемся данным термином просто для предсказания того, что в данной ситуации им будет опущено письмо.
Также и наш испытуемый не может видеть свою цель, не соотносясь с похожими событиями. Если мы спросим его, почему он идет по улице или-какова его цель, и он ответит: «Я иду, чтобы опустить письмо», то мы не узнаем ничего нового о его поведении, кроме нескольких возможных причин. Конечно, сам испытуемый может находиться в преимущественном положении, описывая эти переменные, поскольку он находится в постоянном контакте со своим поведением на протяжении; многих лет. Следовательно, его утверждение относится к тому же классу, что и утверждения других людей, которые несколько раз наблюдали за его поведением. Он просто делает возможное предсказание с точки зрения своего опыта с самим с собой. Более того, он может ошибаться. Он может сообщить о том, что собирается отправить письмо, и, действительно, он может «нести в руке неотправленное письмо и опустить его в конце улицы, но мы все-таки можем показать, что его поведение определяется тем фактом, что в прошлом он находился в таких ситуациях, когда он имел дело с человеком, значимость которого для него связана с такой прогулкой. Он может не осознавать эту цель в том смысле, что он не способен сказать, что его поведение определяется именно этой причиной. Тот факт, что оперантное поведение «направлено на будущее», вводит в заблуждение. Например, рассмотрим случай,
когда «что-либо ищется». В каком смысле это «что-либо», которое еще не было найдено, релевантно поведению? Предположим, что мы научаем голубя клевать пятно на стенке ящика и после формирования операн-та устраняем пятно. Птица подойдет к привычному для нее месту около стены. Она поднимет голову, направит взгляд в привычном направлении и даже возможно, что она произведет слабое клевательное движение. До тех пор пока процесс уташения не продвинется очень далеко, она будет возвращаться на то же самое место и демонстрировать те же поведенческие реакции. Можно ли говорить, что голубь ищет пятно? Должны ли мы При объяснении поведения принимать во внимание поиск пятна?
Интерпретация этого поведения с позиций операн-тного обусловливания не представляет большого труда. Поскольку визуальная стимуляция, исходящая от пятна, обычно предшествовала приему пищи, пятно стало условным подкреплением. Оно усиливает поведение поиска в данном направлении с различных положений. Хотя мы пытались обусловливать только реакцию клевания, в действительности мы усиливали много различных видов «предшествующего» поведения, которые заставляли птицу принять положение, из которого она ищет пятно и клюет его. Эти реакции продолжают появляться даже тогда, когда мы убираем пятно вплоть до наступления затухания. Пятно, которое ищется, является таким пятном, которое в прошлом было неотсроченным подкреплением поискового поведения. В общем, поиск чего-либо включает в себя порождение реакций, которые в прошлом произвели «нечто» как следствие.
Аналогичная интерпретация применима к поведению человека. Когда мы видим, что человек передвигается по. комнате, открывает ящик письменного стола, смотрит на что-то, находящееся под журналами и т. д., Можно совершенно объективно описать его поведение: «Сейчас он находится в определенной части комнаты; большим и указательным пальцами правой руки он держит книгу; он поднимает книгу и наклоняет свою голову так, чтобы можно было видеть любой объект, находящийся иод книгой». Можно также проинтерпретировать его поведение или «придать ему смысл»: он ищет что-то, или, если быть более конкретным, он ищет очки. То, что мы добавляем, является не дальнейшим описанием его поведения, а суждением о некоторых переменных, определяющих его. Здесь нет ни текущей цели, ни мотива, ни намерения, которые должны быть приняты во внимание. То же самое будет иметь место, даже если мы спросим его о том, что он делает, и он ответит: «Я ищу свои очки». Это не дальнейшее описание его поведения, а это описание переменных, функцией которых является его поведение, оно эквивалентно высказываниям: «Я потерял очки», «Я прекращу делать то, что я делаю, когда найду мои очки», или «Когда я это делал в прошлом, я находил мои очки?» Эти выражения могут показаться не вполне конкретными, однако это происходит потому, что высказывания, включающие цели и намерения, являются аббревиатурами.
Очень часто приписывание цели поведению используется как еще один способ описания биологической адаптации. Это положение уже обсуждалось, однако можно добавить следующее. Как в оперантном обусловливании, так и в эволюционном отборе поведенческих характеристик следствия изменяют будущую вероятность. Рефлексы и другие врожденные паттерны поведения развиваются, потому что они увеличивают вероятность выживания вида. Операнты укрепляются, потому что за ними следуют важные следствия в жизни индивидов. По той же самой причине оба процесса порождают вопрос о цели, и в обоих случаях обращение к конечной причине может быть аналогичным образом отвергнуто. Паук не владеет тщательно отработанным репертуаром поведения, с помощью которого он плетет паутину, потому что она дает ему возможность ловить пищу, благодаря которой он выживает. Он владеет схожим поведением, потому что в прошлом такое же поведение пауков давало им возможность ловить пищу, которая необходима для выживания.. В эволюции поведению «плетения паутины» соответствовала серия событий. Мы не правы, когда говорим, что видим «цель» плести паутину, наблюдая похожие события в жизни индивида.
Миллер (G. Miller) Джордж (род. в 1920 г.) — американский психолог, профессор Гарвардского университета. Известен своими работами по экспериментальному изучению речевой коммуникации и исследованиями общих психологических проблем.
Некоторые из его важнейших трудов: Psychology. The Science of Mental Life. Penguin books. — 1967; The psychology jf communication. 1967; (bei Me. Neill D.). Psycholinguistics. — In: The Handbook of Social Psychol. — 1969. — Vol. 3; Language and Perception, 1976. Галантер (Galanter) Юджин (род. в 1924 г.) — американский психолог, профессор Пенсильванского университета. Основные исследования в области применения теории информации в психологии: Contemporary psychophysics. — In: Brown R., Galanter E., Hess E. H., Mandler G. New directions in psychology, 1962 vol. 1. N. Y.; The direct measurement of unitity and subjective probabilty. — Amer. Journ. of Psychol. — 1962. — Vol. 75; Textbook of Elementary Psychology. — 1966.
Прибрам (Pribram) Карл (род. в 1919 г.) — американский нейропсихолог, профессор Стэнфордского университета, видный представитель американской нейропсихологии, автор ряда книг и многочисленных статей по широкому кругу проблем. Написанная им совместно с Дж. Миллером и Ю. Га-Аантером книга «Планы и структура поведения» переведена на русский язык в 1965 г. Также была издана на русском языке его книга «Языки мозга» (1975).
В данное издание включены отрывки из I и II глав книги « Планы и структура поведения» (М., 1965. —С. 26—34,40—54).
Здесь поведение описывается как сложный акт, выключающий фазы пробы (Test) и операционную (Operate) и регулируемый знаниями, накопленными в прошлом опыте организма (авторы называют их Образами) и программой, обеспечивающей последовательность операций (называется здесь Планом).
ПЛАНЫ И СТРУКТУРА ПОВЕДЕНИЯ
Задача заключается в том, чтобы дать описание того, как внутреннее представление организма о его Вселенной контролирует его деятельность. Если мы рассмотрим, какова эта деятельность у нормального животного, то мы будем поражены тем, в какой степени она организуется в определенные системы. Большинство психологов утверждают, что эти системы деятельности определяются иерархией целей, но в настоящее время не это нас интересует. Мы хотим привлечь внимание к тому факту, что такая организованность действительно существует. Структура является таким же важным свойством поведения, как и восприятия. Однако структуры поведения имеют тенденцию быть главным образом развертывающимися во времени; именно последовательность движения плавно развивается в то время, как живое существо бегает, плавает, летает, разговаривает или занимается чем-либо еще. Поэтому мы должны обеспечить способ, при помощи которого мы сможем зафиксировать познавательное представление в виде соответствующей схемы деятельности. Но как же нам расчленить эту находящуюся в движении схему деятельности на поддающиеся анализу части?
Трудности при анализе деятельности животного возникают не от недостатка методов, а от их чрезмерного изобилия. Мы можем описать действие как последовательность сокращений мышц или как последовательность движений конечностей и других частей тела, как последовательность целенапрвленных действий или даже более крупных комплексов. В соответствии с теорией Толмена большинство психологов отличают мелкие единицы поведения от крупных, называя мелкие «молекулярными», а крупные — «мо- лярными». Всякому, кто спрашивает, какая из этих единиц имеет надлежащий объем для использования
при описании поведения, говорят, что законы поведения кажутся более очевидными при использовании молярных единиц, но добавляют, что ему придется установить на основании собственного опыта и наблюдений, насколько «молярными» должны быть используемые единицы.
Однако довольно ясно следующее: сложность заключается в том, что молярные единицы должны состоять из молекулярных единиц, а это означает, что Надлежащее описание поведения должно делаться одновременно на всех уровнях. Иначе говоря, мы пытаемся описать процесс, который организуется на нескольких различных уровнях, и сочетание элементов на одном уровне может быть указано только в том случае, если мы укажем элементы следующего, высшего, или более молярного уровня описания. Например, молярная схема поведения X состоит из двух частей —А и В. Таким образом, Х=АВ. Но А в свою очередь состоит из двух частей — а и Ь, а В состоит из трех — с, d и е. Следовательно, Х=АВ= abcde, и мы можем описать этот сегмент поведения на любом из указанных трех уров-ней. Дело, однако, в том, что мы не хотим избрать один уровень и доказывать, что он почему-то лучше других: полное описание должно включать все уровни. Иными словами, структурные свойства поведения будут поте-ряны, если мы установим только, например, abcde: тог- да (ab) (cde) можно спутать с (abc) (de), которые могут представлять собой совершенно различные вещи.
Несомненно, этот вид организации поведения наи-более очевиден в словесном поведении человека. Отдельные фонемы организуются в морфемы, морфемы объединяются, чтобы составить фразы; фразы в соот-ветствующей последовательности дают предложение, а ряд предложений образуют высказывание. Полное описание высказывания включает все перечисленные нами уровни.
Примером двусмысленности, которая является ре-зультатом ситуации, когда не все уровни известны, может служить следующее предложение: «They are flying planes». Последовательность фонем может остаться не-изменной, но это предложение можно проанализировать двояко, как (They) (are flying) (planes) и (They are) (flying planes), получив два совершенно разных высказывания: (а) «Они водят самолеты»; «Это — летящие самолеты»1.
Психологи редко проявляли нежелание признавать существование таких молярных единиц, как «слова» или даже «значения», когда они касались словесного поведения, несмотря на то, что фактические реакции, доступные для восприятия, представляют собой всего лишь ряды звуков, акустические представления предполагаемых фонем. Такое же признание молярных единиц в несловесном поведении требует подобного описания, охватывающего все уровни. Однако, к сожалению, психолог обычно описывает поведение или какой-либо аспект поведения на одном-един-ственном уровне и предоставляет своим коллегам вывести при помощи собственного здравого смысла, что произошло на других уровнях. Тщательная регистрация каждого сокращения мышц, даже если бы кто-нибудь отважился попытаться это сделать, все же оказалась бы недостаточной, так как она не содержала бы структурных черт, которые характеризуют молярные единицы. Эти структурные черты должны вводиться на основе теории поведения. Наши теории поведения в этом смысле всегда оставались туманными и интуитивными. (Довольно странно представить себе, что, хотя бихевиоризм существует полвека, этот аспект проблемы описания поведения почти никогда не учитывался и, уж конечно, не был разрешен.)
1 Традиционный метод анализа предложения служит прототипом того вида описания поведения, которого мы требуем. Хомский в гл. IV своей монографии «Синтаксические структуры» (Chomsky N. Syntactic Structures) дает формальное представление о такого рода описании, называемом лингвистами «конституэнтным анализом». Мы обсудим предлагаемый Хом-ским метод описания словесного поведения более детально в главе X. Предположение, что лингвистический анализ дает модель для описания всех видов поведения, конечно, не является новостью: оно часто выдвигалось как лингвистами, так и психологами. Например, психолог Джон Б. Кэрролл в «Исследовании языка» (Carrol J.B. The Study of Language. — Cambridge, 1953) отмечает, что из лингвистической теории мы заимствуем представление об «иерархии единиц— от элементарных единиц, подобных отличительной черте фонемы, до крупных единиц типа предложения. Можно предположить, что отрезки поведения любого типа могут быть организованы до некоторой степени таким же образом» (Р. 106).
В тех счастливых случаях, когда мы находим адекватные описания поведения — которые мы почти всегда встречаем у лингвистов и этологов, — совершенно очевидно, что поведение организуется одновременно на нескольких уровнях, характеризующихся разной степенью сложности. Говоря об этом факте, мы будем именовать его «иерархической организацией поведения»2. Эта иерархия может быть изображена различными способами. Иерархическая схема обычно принимает форму дерева, ответвления которого указывают в последовательном порядке все меньшие единицы. Иначе иерархия может быть представлена в виде контура:
Можно рассматривать иерархию и как ряд перечней: X — это перечень, содержащий два пункта —АиВ; А — перечень, содержащий два пункта — а и b;В — пере-
2 Многим психологам знакомо мнение, что поведение врганизуется иерархически, потому что они помнят, как Кларк Хвлл употреблял термин «генеалогическая иерархия». Поэтому мы спешим отметить, что то, как использовал термин «иерар-хия» Халл и как используем его теперь мы, не имеет почти ничего общего. Мы говорим об иерархии уровней описания. Халл говорит о систематизации альтернативных (взаимозаме-няемых, взаимозамещаемых) реакций соответственно их силе. См,, например, работу: Hull C.L. The Concept of the Habit-family Hierarchy and Maze Learning. — Psychol. Rev. № 41. — 1934. — P, 33—54, 134—152). Ближе к духу настоящего обсуждения стоит система эпизодов поведения, использованная Роджером Бар-кором и Гербертом Райтом в труде «Средний Запад и его дети» (Barker R., G. Wright. Midwest and Its Children.) для описания Малярного поведения детей в их естественном окружении. Труд Варкера и Райта является заслуживающим внимания» исключением из нашего утверждения, что психологи не пытались описать структурные черты поведения.
чень, содержащий три пункта — с, d, e3. Наконец, иерархию можно рассматривать как ряд правил, на основании которых происходят допустимые замены: там, где встречается X, мы можем заменить его АВ; А можно заменить ab и т. д.4 Каждый из этих способов изображения иерархии имеет в особых условиях свои преимущества.
Теперь, если принять иерархическую систему организации поведения за единственно правильную, пришло время выделить несколько терминов для специальных целей настоящего обсуждения. Так как определения представляют собой трудное чтение, мы постараемся сократить наш список до минимума.
План. Всякое полное описание поведения должно быть пригодным для того, чтобы служить перечнем инструкций, т. е. оно должно обладать характерными чертами плана, который может руководить описываемым действием. Однако, когда мы говорим о Плане на страницах данной книги, этот термин будет относиться к иерархии инструкций, и если это слово будет начинаться с заглавной буквы, то это будет указывать, что оно употребляется в этом специальном значении. Итак, План — это всякий иерархически построенный процесс в организме, способный контролировать порядок, в котором должна совершаться какая-либо последовательность операций.
Для организма План в основном представляет собой то же самое, что и программа для математической машины, в особенности если эта программа имеет иерархический характер, описанный выше. Ньюэлл, Шоу и Саймон очень четко и систематично применяли иерархическую структуру перечней в своей работе над «языками для обработки информации», которые применяются при программировании для скоростных цифровых математических машин в случаях моделирования человеческих процессов мышления. Их успех
3 Формы изображения в виде дерева и контура — древние и хорошо знакомые формы, но использование формы перечней кажется нам относительно новым. Впервые мы познакомились с ним в труде Ньюэлла, Шоу и Саймона по моделированию познавательных процессов при помощи счетно-вычислительных устройств. См.: Newell A., Simon H.A. The Logic Theory Machine: A Complex Information Processing System «IRE Transactions on Information Theory». — 1956. — Vol. 1—2. — № 3. — P. 61—79; Proceeding of the Western Joint Computer Conference. Los Angeles, February.— 1957.— P. 230—240.
в этом отношении, который, по нашему мнению, является очень значительным и многообещающим, подтверждает правильность гипотезы, что иерархическая структура является основной формой организации при решении задач человеком. Поэтому мы с полным основанием полагаем, что в дальнейшем термин «План» может быть всюду заменен термином «программа». Тем не менее сведение Планов «только к программам все еще является научной гипотезой и требует дальнейшей проверки. Поэтому пока мы скорее избежим путаницы, если будем рассматривать программу математической машины, моделирующей некоторые черты поведения организма, как теорию о Плане организма, порождающем поведение»5.
Кроме того, мы будем также использовать термин «План» для обозначения грубого наброска какой-то последовательности действий, просто ряда основных тематических заголовков наряду с полностью детализированной спецификацией каждой отдельной операции6.
Стратегия и тактика. Понятие об иерархической Организации поведения было дано ранее, а также указывались различия между молярными и молекулярными единицами анализа. Теперь, однако, нам хотелось
5 Следует четко осознавать, как указывают Ньюэлл, Шоу и Саймон, что уподобление последовательности операций, совершенных организмом, хорошо программируемой работе счетной машины резко отличается от уподобления счетной ма-шине, мозгу или электрических реле синапсам и т. д. Ньюэлл, Шоу Дж., Саймон Г. Элементы теории решения задач. См. работу: Newell A., Shaw J.C., Simon H.A. Elements of a Theory of Human Problem Solving.— Psychol. Rev.— 1958.— № 65.— P, 151—166; Herbert A., Simon H.A:, Newell A. Models. Their Uses tnd Limitations. — In: White L. D. (ed.). The State of the Social Iclences. — Chicago, 1956. — P. 66—83.
в Ньюэлл, Шоу и Саймон также пользовались термином «План» для обозначения общей стратегии, до того как были разработаны детали, но они подчеркивают отличие такого Плана ВТ программы, которая . дает возможность счетной машине использовать планирование как один из технических приемов решения задачи. См.: Newell A., Shaw J. С, Simon И, A. A Report en a General Problem Solving Programm. — In: Proceedings of the International Conference on Information Processing.— Paris, 1959. Другие исследователи употребляют термин «машина» в столь широком смысле, что он включает в себя и План, и инструмент, i помощью которого этот план осуществляется. См.: Minsky M.L. I ItMirlstic Aspects of the Artifical Intelligence Problem, Group Report 14 55. Lincoln Labor., Massachus. Inst. of Technology, 1956.
бы расширить нашу терминологию. Мы покажем, что молярные единицы представляют собой стратегию поведения, молекулярные единицы — тактику.
Выполнение. Мы говорим, что живое существо выполняет данный План, в то время как на деле этот План контролирует последовательность операций, которые оно выполняет. Когда организм выполняет План, он делает это шаг за шагом, завершая одну его часть и затем переходя к следующей. Выполнение Плана не обязательно должно выражаться во внешнем действии — в особенности у человека; можно, по-видимому, считать справедливым, что наряду с Планами, руководящими действиями, существуют Планы для сбора или переработки информации. Хотя это фактически не является необходимым, мы интуитивно предполагаем, что одновременно может выполняться только один План, хотя возможно довольно быстрое чередование Планов. Организм может хранить много других Планов, кроме выполняемого им в данный момент.
Образ. Образ — это все накопленные и организованные знания организма о себе самом и о, мире, в котором он существует. Конечно, Образ заключает в себе нечто гораздо большее, чем картины. Употребляя этот термин, мы имеем в виду в основном тот же вид представления, которого требовали другие сторонники познавательной теории. Оно включает все, что приобрел организм, — его оценки наряду с фактами, — организованное при помощи тех понятий, образов или отношений, которые он смог выработать.
В ходе продолжительных дебатов авторы настоящей книги пользовались большим количеством других терминов для уточнения термина «План», но эта терминология не будет приведена здесь. Новые термины будут вводиться и разрабатываться по мере надобности в ходе последующего обсуждения. В настоящее же время мы дали достаточное количество определений, чтобы иметь возможность сказать, что центральной проблемой этой книги является исследование отношений между Образом и Планом.
Может показаться, что это утверждение означает резкое разделение Образа и Плана, так что имело бы смысл задать вопрос: «Входит ли такой-то процесс исключительно в План или исключительно в Образ? » Из нижеприводимых соображений должно стать ясным,
что эти две точки зрения не могут быть использованы для классификации процессов по двум взаимоисклю- чающим категориям: План может быть заучен и стать тем самым частью Образа.
Формулировки Планов должны у человека включать часть Образа, поскольку то, что человек в состоянии выполнить данные Планы, должно являться частью его Образа о самом себе. Знания должны быть включены в План, поскольку В противном случае План не может служить основой для руководства поведением. Следовательно, Образы могут составлять часть Плана. Можно внести изменения в Образы только путем выполнения Планов по сбору, накоплению и переработке информации.
Можно внести изменения в Планы только на основе информации, почерпнутой из Образов.
Преобразование описаний в инструкции представляет собой у человека простую словесную процедуру.
Те психологи, которые привыкли считать своей задачей исследование взаимоотношений между стимулом И реакцией, склонны рассматривать работу, подобную Нашей, параллельным образом — как исследование взаимоотношений между субъективным стимулом и субъективной реакцией. Если бы все, что мы должны сказать, можно было свести к этому, то едва аи нам понадобилось бы писать для этого книгу. Стимул и реакция — это психологические понятия, заимствованные из анализа рефлексов. Но мы отказались от классической концепции о рефлекторной дуге как основной схеме организации всего поведения и поэтому не ощущаем необходимости переносить классическое разделение стимула и реакции в область Образов и Планов. Предположение, что План представляет собой замаскированную реакцию на ка-кой-то внутренний Образ стимула, приводит только к попытке уподобить объективные концепции их субъективным эквивалентам и оставляет рефлекторную дугу по-прежнему хотя и довольно призрачным, но все же хозяином всего механизма мышления. Едва ли нам удастся свергнуть старого хозяина без помощи нового, по-этому далее нам предстоит задача найти ему преемника.
...Нервный механизм, участвующий в рефлекторном акте, не может быть изображен как простая рефлекторная дуга... В рефлекторном акте участвует значительно более сложная форма регуляции чем та, которую предполагает теория рефлекторной дуги. Единственное требование, предъявляемое к стимулу в классической цепи элементов, выражается в критерии пороговых интенсивностей для каждого из элементов.. Если внешний раздражитель достаточно силен, чтобы быть выше порога на всем протяжении рефлекторной дуги, он сможет вызвать реакцию ... Однако порог является лишь одной из многих различных сторон, в отношении которых может быть опробовано воздействие. Более того, ответ эффекторных аппаратов зависит от результатов такого опробования, и его наиболее правильно рассматривать как попытку изменить получаемые результаты. Действие возбуждается «несоответствием» между состоянием организма и состоянием, которое опробуется. Действие сохраняется до тех пор, пока несоответствие (т. е. проксимальный стимул) не устраняется. Общий характер рефлекторного акта, таким образом, заключается в опробовании воздействующей энергии определенными критериями, установленными в организме, в возникновении реакции, если результат пробы показывает наличие несоответствия (рассогласования) и в продолжении реакции до тех пор, пока это несоответствие не исчезает... Следовательно, существует «обратная связь», идущая от результата действия к фазе опробования; мы обнаруживаем здесь возвратную петлю. Простейший вид схемы, представляющей эту концепцию рефлекторного действия в противоположность классической рефлекторной дуге, будет выглядеть примерно следующим образом (рис. 1).
Рис. 1. Единица Т—О—Т—Е (Test—Operate—Test—Exist)
...Мы будем использовать представление о Т—О— Т—Е как общее описание процессов, участвующих в регуляции . В самой простой форме схема Т—О—Т—Е лишь утверждает, что операции, выполняемые организмом, постоянно регулируются результатами различных проб.
Авторы настоящей книги считают, что система Т------
О—Т—Е, включающая важное понятие обратной связи, является как объяснением поведения, так и объяснением рефлекторного акта, принципиально отличным от объяснения, предлагаемого принципом рефлекторной дуги. Следовательно, традиционные понятия стимула и реакции должны быть определены по-новому, чтобы соответствовать своему новому контексту. Стимул и реакция должны рассматриваться как фазы организованного, координированного акта. Мы суммируем указанные представления следующим образом: «Стимул является той фазой формирующейся координации, которая представляет условия, необходимые для достижения успешного результата; реакция является той фазой этой же формирующейся координации, которая дает возможность достигнуть соответствия этим условиям и служит инструментом в достижении успешной координации. Поэтому они являются строго соответствующими друг другу и совпадающими во времени»7.
Ввиду того что стимули реакция соответствуют друг другу и совпадают во «времени, процесс действия раздражителя следует рассматривать не как предшествующий реакции, а скорее как ведущий ее к успешному устранению несоответствия. Иначе говоря, стимул и реакция должны рассматриваться как элементы обратной связи.
Необходимость какого-то вида обратной связи при описании поведения хорошо видна большинству сторонников рефлекторной теории, но они вводят ее особым путем. Например, они обычно говорят о некоторых Следствиях рефлекторного акта, таких, как усиление ИЛИ подкрепление рефлекса, — такой подкрепляющий результат действия является четким примером обрат-Ной связи. Подкрепление, однако, является особым видом обратного воздействия, которое не следует отож-
7 Эта цитата взята из статьи: Dewey J. The Reflex Arc Concept In Piychology. Эта статья ввиду мудрости и глубины понимания имеет такое же значение, какое она имела в 1896 г.
дествлять с обратной связью, включенной в систему Т—О—Т—Е. Их различия таковы: (1) подкрепляющая обратная связь должна усиливать что-то, в то время как обратная связь в схеме Т—О—Т—Е осуществляет акт сличения; (2) подкрепляющая обратная связь рассматривается как определенный раздражитель (наприпример, пища), в то время как обратная связь в Т—О—Т—Е может быть раздражителем или информацией (например, инструкцией); (3) подкрепляющая обратная связь часто рассматривается как фактор, «снижающий потребность» организма, в то время как обратная связь в Т—О—Т—Е не имеет подобного значения.
Когда процесс Т—О—Т—Е завершен — операция выполнена, проба дала удовлетворительные результаты, реакция завершена, — организм может достичь более благоприятного состояния. Возможно, правильно, что система Т—О—Т—Е, которая успешно завершается в данной ситуации, имеет тенденцию повторяться с возрастающей вероятностью, хотя такая связь не является обязательной. Поэтому возможно обсуждать Т—О—Т—Е в терминах подкрепления. Тем не менее Т— О—Т—Е включает значительно более общее представление об обратной связи. Понятие подкрепления представляет важный шаг вперед от рефлекторной дуги к петле обратной связи, однако в теории поведения нужны еще более смелые шаги, чтобы продвинуться за пределы описания простых экспериментов по выработке условных рефлексов.
Возможно, окажется необходимым внести изменения в основной тип Т—О—Т—Е как гипотезу, поэтому в целях настоящего обсуждения мы будем продолжать, рассматривать схему, изображенную на рис. 1, скорее-как гипотезу, чем факт. Однако важность значения этой гипотезы для общих положений нашей книги не должна быть упущена. Она представляет собой описание в сжатой форме связи между Образом и действием, которое мы выполняем. Т—О—Т—Е представляет собой основную схему, в которую укладываются наши Планы; фаза «опробования» Т—О—Т—Е включает определение того, какие знания необходимы для сравнения, а операционная фаза представляет собой то, что организм делает в соответствии с этим. Последнее часто может включать открытые, видимые действия. Каким же образом План связывает представления (Образ) организма о самом себе и окружающем его мире с действиями, реакциями, поведением, которые организм производит?
Посмотрим, что мы должны сделать для того, чтобы распространить эту идею на некоторые важные проблемы. Одно из первых затруднений, не слишком большое, — это определить более точно, что мы подразумеваем под «несоответствием» (рассогласованием), которое выявляется на стадии первоначальных проб. Почему бы нам не говорить о наличии простого различия, а не «рассогласования»? Ответ не является глубоким: мы просто не хотим заниматься описанием системы Т—О—Т—Е в случаях, когда организм улавливает различие и когда он не улавливает таких различий. Ко-Гда схема Т—О—Т—Е используется для описания сервомеханизмов, например, очень важно разграничить «положительную» и «отрицательную» обратную связь, но, ввиду того, что мы прежде всего интересуемся обратной связью при регуляции, такие вопросы не являются существенными. Вряд ли стоит рассматривать все эти варианты как различные элементы анализа, оче-видно, проще рассматривать их все как примеры более общего типа механизма, «чувствительного к несоответствию»8.
Второе затруднение — несколько более серьезное — заключается в вопросе, каким образом из системы Т— О—Т—Е мы можем прийти к целой иерархической Структуре поведения, на важность которой мы указывали в главе I. Как можно примирить два понятия — обрат-ная связь и иерархия? Один из методов комбинирования Компонентов обратной связи в иерархию был описан Д.М. Маккеем9, который предположил, что последствия операционной фазы в одном компоненте представляют собой стимул для действия сличающего механизма второго компонента; согласно предположению Маккея, су-
• Понятие механизма, «чувствительного к несоответствию», нежится авторам связанным с концепцией «познавательного диссонанса» Фестингера, но мы не пытаемся исследовать или развить эту возможную связь.
ществует ряд таких компонентов обратной связи, каждый из которых представляет более высокий уровень абстракции от внешней действительности. Хотя схема Маккея является очень остроумной, мы вынуждены признать, что несколько иной метод построения иерархии будет лучше служить целям психологического описания. Центральное положение метода, принятого на этих страницах, заключается в том, что операционные компоненты схемы Т—О—Т—Е сами могут быть элементами этой схемы. Иначе говоря, схема Т—О—Т—Е включает как стратегические, так и тактические элементы поведения. Таким образом, операционная фаза системы Т—О—Т—Е более высокого порядка может сама состоять из цепи других подобных . же систем, а каждая из последних в свою очередь может содержать вновь ряды таких же подчиненных единиц и т. д. Поскольку этот метод применения одной и той же схемы описания для высших, стратегических элементов и для низших, тактических элементов может вызвать недоразумения при первом знакомстве, мы рассмотрим соответствующий пример.
Р. С. Вудвортс показал, что часто акты поведения состоят из двух стадий 10. Вудвортс называет их «двухфазными двигательными актами». Первая фаза является подготовительной, или мобилизующей; вторая — результативной, или удовлетворяющей. Чтобы прыгнуть, вы прежде всего сгибаете бедра и колени, а затем с силой разгибаете их, сгибание подготавливает к прыжку. Чтобы взять предмет, сначала вы разжимаете кисть, а затем сжимаете ею предмет. Нужно открыть рот, прежде чем откусить кусок хлеба, нужно отвести руку назад, прежде чем ударить, и т. д. Указанные две фазы — это совершенно различные движения, хотя они, несомненно, выполняются как единое действие. Если раздражение адекватно, для того чтобы вызвать движения, прежде всего надо осуществить подготовительный процесс проб, а когда он завершается, возникают условия для осуществления результативной системы проб и соответствующее действие выполняется. Многие из этих двухфазных планов являются повторяющимися: завершение второй фазы в свою очередь создает стимулы, показывающие, что вновь возможно осуществление первой фазы, так что устанавливается чередование двух фаз, как это происходит при ходьбе, беге, жевании, питье, подметании; шитье и т. д.
Мы хотим особо подчеркнуть формирование «двухфазной» системы Т—О—Т—Е, состоящей из двух более простых элементов. Рассмотрим в качестве примера забивание гвоздя.
В качестве выполнения плана забивание гвоздя, конечно, имеет две фазы: подъем молотка и удар по гвоздю. Мы можем изобразить это в виде дерева или иерархии, как на рис. 2. Однако, если нам потребуются детали, изображение забивания гвоздя на рис. 2 как простой комбинации, содержащей два элемента, несомненно, является слишком упрощенным. Оно не говорит нам, например, как долго продолжается забива-ние. Что здесь является поводом к прекращению действия? Для этой цели мы должны выделить фазу проб, как на рис. 3. Схема на рис. 3 должна показать, что, когда, система Т—О—Т—Е, которую мы называем «забиванием», регулируется, удары молотком продолжаются до тех пор, пока шляпка гвоздя не сравнивается с той поверхностью, в которую мы его забива-ем. Когда проверка показывает, что гвоздь вбит, регуляция переносится на другие элементы. Однако теперь мы, очевидно, потеряли представление об
иерархической структуре. Иерархия восстанавливается, когда мы глядим на прямоугольник с надписью «Молоток», так как там мы обнаруживаем две системы Т—О—Т—Е, каждую со своей собственной пробой, как показано на рис. 4. Когда две такие системы, объединенные на рис. 4, включаются в операционную фазу на рис. 3, результатом является иерархический План забивания гвоздей, который показан на рис. 5.
Если это описание забивания гвоздя является правильным, мы должны ожидать, что последовательность событий будет разворачиваться следующим образом:
Сверка положения гвоздя (шляпка торчит) —Сверка положения молотка (молоток опущен) — Подъем молотка —Сверка положения молотка (молоток поднят.) — Удар по гвоздю — Проба молотка (молоток опущен) — Сверка положения гвоздя (шляпка торчит) — Сверка положения молотка.
Рис. 4. Пунктирная линия показывает, как две простые схемы Т—О—Т—Е объединяются, образуя определенную фазу более сложной системы, изображенной ранее на рис. 3
И так далее, пока проба гвоздя не покажет, что его шляпка сравнялась с поверхностью; в этот момент регуляция переносится в другое место. Таким образом, система Т—О—Т—Е достаточно легко раскладывается на координированную последовательность проб и действий, хотя лежащая в ее основе структура, организующая и координирующая поведение, сама по себе является иерархической, а не просто последовательной.
Рис. 5. Иерархический План забивания гвоздей
Может показаться не вполне разумным анализиро-вать движения, участвующие в забивании гвоздей подобным образом. Однако лучше забавлять читателя, чем запутывать его. Эти схемы лишь иллюстрация того, как Несколько простых систем Т—О—Т—Е, каждая со своей петлей «проба — операция — проба» (Test — Operate—Test), могут быть включены в операционную фазу более сложной системы с собственными аналогичными связями. Без такого объясняющего примера могло бы быть неясно, как эти кольца, замкнутые в более сложные системы колец, могут образовывать иерархии. Более сложные Планы—Вудвортс называет их «полифазными двигательными элементами» — могут быть подобным же образом описаны как системы Т—О—Т— E1 построенные из субпланов, которые сами являются подобными же системами. Птица может взлететь, сделать несколько взмахов крыльями, полететь парящим полетом, прекратить взмахи крыльями, выпрямить ко-нечности и приземлиться на них. Все действие возникает как единое целое, регулируется единым Планом, составленным, однако, из нескольких фаз, каждая из которых имеет свой собственный План, который в свою очередь может состоять из субпланов и т. д.
Обратите внимание на то, что именно операционная фаза этой системы раскладывается на ряд других подобных же систем. Если бы мы захотели сохранить, схему Т—О—Т—Е в том виде, как она показана на рис. 1, мы не смогли бы использовать ее для построения более сложных проб11. Таким образом, адекватные пробы расцениваются как сравнительно фиксированные; изменчивой и сложной может быть лишь операционная фаза. Конечно, операционная фаза может состоять из ряда подобных же систем, она может также завершаться эфферентной активностью12. Если мы рассмотрим комплексные Планы — иерархии описанных систем, в которых операция одной системы рама является рядом подчиненных систем, — то станут очевидными некоторые общие особенности таких систем.
Иерархическая структура, лежащая в основе поведения, должна быть просто описана на языке счетно-решающих устройств, разработанном Ньюэллом, Шоу и Саймоном.
11 Причина, по которой система Т—О—Т—Е на рис. 1 может быть расширена только за счет своей операционной фазы, чисто формальна и может быть показана посредством простого расчета. С пробой на рис. 1 связаны четыре стрелки: две стрелки связаны с Операцией и две стрелки связаны с Т—О—Т—Е в целом. Поэтому, если эта система с двумя стрелками используется для формирования компонента другой подобной же системы, образуемый ею компонент должен быть Операцией с ее двумя стрелками, а не Пробой с четырьмя стрелками. Однако возможно, что жесткие ограничения, подобные этим, являются, вероятно, нереальными, оправданными только в целях дидактического упрощения. Всякий, кто изучал иерархически организованные программы, составленные Ньюэллом, Шоу, Саймоном для моделирования процесса решения задач человеком, может понять, как в действительности примитивны и неразработаны иерархии подобных систем Т—О—Т—Е.
12 Если мы примем всерьез предлагаемую схему Т—О— Т—Е, система может быть легко представлена в в,иде петель. Например, если все субпробы при расширении операционной фазы применимы, но основная проба оказалась несостоятельной, возникает петля. Для того чтобы избежать петель, мы .должны утверждать, что основная проба ведет к разъяснению субпроб. При более реальномрешении проблемы мы принимаем возникновение петель как сигнал о том, что План оказался неуспешным в достижении результата, на который была направлена основная проба. Следует далее найти механизмы обнаружения и ликвидации таких петель.
Планирование может рассматриваться как составление перечня проб, которые следует произвести. Когда у нас есть отчетливый Образ желаемого результата, мы можем использовать для его создания условия, которые мы должны опробовать, и, будучи организованы в нужной последовательности, эти пробы составляют в грубых чертах стратегию возможного Плана. (Возможно, более понятно можно сказать, что условия, которые мы должны опробовать, являются Образом желаемого результата).
Операционная фаза может содержать как пробы, так и операции. Поэтому выполнение Плана любой сложности должно включать значительно больше проб, чем действий. Эта конструктивная особенность ответственна за общее снижение количества информации, которое наблюдается, когда человеческое существо рассматривается как коммуникационный канал.
У низших животных можно видеть, что структура их поведения в естественных условиях формируется более или менее случайно, под воздействиями окружающей среды, только человек тешит себя иллюзиями, что он является хозяином своей судьбы. Иначе говоря, обстановка поставляет раздражители, которые «высвобождают» следующую стадию деятельности животно-го. Это в известном отношении философский вопрос — в какой мере мы верим в Планы, которые лежат где-то вне нервной системы. Поэтому, вероятно, мы скажем только, что низшие животные кажутся обладающими больше тактикой, чем стратегией.
По мере продвижения вверх по эволюционной лест-нице мы обнаруживаем на уровне млекопитающих возрастание сложности проб, которые животное может» произвести. Только у человека мы наблюдаем способность создавать символы и манипулировать ими, и, когда эта способность используется для того, чтобы символически обозначать всю схему действия, для него» становится возможным пользоваться языком, чтобы перестраивать порядок символов и формировать новые Планы. У нас есть все основания считать, что речевые возможности человека интимно связаны с его способностью планировать. А вследствие того что человеческие Планы так часто носит словесный характер, они могут сообщаться, что представляет собой факт огромной важности в эволюции на-шего приспособления друг к другу.