Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Galperin_P_Ya__Zhdan_A_L__Istoria_psikhologii.doc
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
8.8 Mб
Скачать

Раздел I

НЕОБИХЕВИОРИЗМ

Халл (Hull) Кларк Леонард (1884—1952) — американский психолог-необи-хевиорист, автор гипотетико-дедуктив-ной теории научения. С 1930 по 1950 г. Халл — ведущий психолог Института исследований человеческих отношений Йельского университета (Jale Institut of Human Relation), в котором он возгла­вил исследовательскую группу. Испы­тал влияние учения И.П. Павлова. Ран­ние исследования проводил в облас­ти мышления, способностей (тес­тирование способностей — 1928), гип­ноза (гипноз и внушаемость — 1933), механической памя­ти (математическо-дедуктивная теория механического научения — 1940); в этих работах пытался применить объективные методы и создать формализованный аппарат для объяснения изучаемых процессов.

Исследования, которые явились непосредственным на­чалом гипотетико-дедуктивной системы, относятся к 30-м гг. Первый вариант теории дан в книге «Принципы поведе­ния» (1943). Здесь в 17 постулатах и 17 короллариях к ним математически описываются поведение и феномены науче­ния. Вторая книга— «Существенные черты поведения» (1951) — несколько изменяет, дополняет изложенные прин­ципы. Окончательный вариант концепции «Система поведе­ния» (1952). содержит новые постулаты и распространяется на объяснение новых видов поведения — решение проблем, поведение в пространстве и др. Теория Халла явилась замет­ным явлением в американской психологии 30—50-х гг. Как отмечает Хилгард в рецензии на книгу 1952 г., Халл создал новый тип психологической системы, являющейся «научной логикой, в которой взаимосвязаны эмпирические данные и рациональные пути обращения с ними» (Psychol. Bulletin, 1954, vol. 51, № 1—6). Последователями Халла являются известные психологи О.Г. Маурер, Н.Е. Миллер, Дж. Доллард, К. Спенс, А. Амсель, Ф. Логан и другие, которые развили теорию научения К. Халла, применили ее к анализу социаль­ного поведения, в области психотерапии. Соч.: Principles of Behavior. — N. Y., 1943; A behavior System. — New-Haven, 1952. Лит.: ФрессП., Пиаже Ж. Экспериментальная психоло­гия. М., 1973. — Вып. IV. — С. 104—108; Ярошевский М.Г., Анциферова Л.И. Развитие и современное состояние зару­бежной психологии.— М., 1974. — С. 243—244; Bower G.H., Hilgard R.E. Hull's Systematic Behavior System. — In: Theories Of Learning. — N. Y., 1975. — P. 558—605.

В данное издание вошла заключительная, XX глава книги «Принципы поведения» («Principles of behavior»). В ней определяются основные постулаты, разъясняются символические обозначения, используемые в теории Хал-ла. Дается схема, обобщенно представляющая зависимос­ти между условиями и результатами поведения.

К. Халл

Принципы ПОВЕДЕНИЯ. Сущность научной теории

Основной задачей науки является выведение закономер­ностей, которые в максимально возможной степени при­ближались бы к общим законам. Методы, которыми эта задача успешно решается, могут быть подразделены на эмпирические и теоретические. Эмпирический метод заключается в основном в наблюдении, обычно подкрепленном экспериментом. Теоретический же метод является логическим по своей сути; посредством этого метода, применяя в то же время и метод эмпирический, уровень общности законо­мерностей может быть выяснен в таких пределах, которые недостижимы посредством только одного эмпирического метода. Особенно это проявляется в тех случаях, когда одновременно кажутся пригодными две или несколько пред­полагаемых закономерностей. Логический метод позволяет утверждать, какого результата следует ожидать в случае, если одновременно подтверждаются несколько сформулированных принципов; сравнивая теоретические заключения с наблюдаемыми эмпирическими результатами, можно оп­ределить, являются ли эти принципы достаточно общими, чтобы объяснить данную ситуацию.

В идеале научная теория представляет собой иерархию логически выведенных положений, соответствую­щую структуре эмпирически наблюдаемых зависимостей.

Логическая структура есть производная от сравнительно небольшого числа общих принципов — постулатов, рас­сматриваемых в согласовании с некоторыми необходи­мыми априорными условиями. Науки о поведении далеко отстали от естественных наук в достижении систематич­ности, отчасти из-за присущей им сложности, отчасти в силу динамичности поведения как объекта изучения, от­части вследствие укоренившегося антропоморфизма. Эм­пирическое наблюдение, дополненное проницательной догадкой, — вот основной источник общих принципов науки или постулатов. Их формулировки, взятые в раз­личных сочетаниях вместе с релевантными предваритель­ными условиями, порождают выводы или теоремы, с ко­торыми согласно практическому результату можно либо согласиться, либо нет. Те первичные предположения, из которых следуют логические выводы, совпадающие с на­блюдаемыми эмпирическими результатами, сохраняют­ся, те же, которые не подтверждается, отбрасываются или модифицируются. И пока идет этот процесс проб и оши­бок, растет набор первичных принципов, совместное при­менение которых наиболее вероятно совпадает с реле­вантными наблюдениями. Выводы, сделанные из этих сохранившихся постулатов, хотя никогда и не бывают аб­солютно точны, все же вполне достоверны. Таков на се­годняшний день статус первичных принципов в физичес­ких науках.

Теория поведения и символические конструкторы

Научные теории в основном касаются динамичных ситуаций, т. е. последовательных событий, или условий, которые с течением времени последуют из данных первоначальных событий, или условий. Теоретическое объяснение заключается в манипулировании ограни­ченным набором символов согласно правилам, выра­женным в постулатах (с применением определенных дополнительных правил, которые составляют суть логики) таким образом, чтобы ликвидировать разрыв между предварительными условиями, или состояниями, и последующими. Некоторые символы представля­ют наблюдаемые и измеряемые элементы ситуаций и их соединения, тогда как другие — лишь предполагаемые промежуточные процессы, недоступные прямому наблюдению. Последние суть теоретические конструкты. Все развитые науки свободно оперируют теорети­ческими конструктами, а часть даже целыми последовательностями их. Научная ценность логических кон­структов состоит в возможности выведения с их помощью верных логических следствий; это в свою очередь абсолютно зависит от каждого конструкта или их цепи, связанных как с предварительными, так и с последующими условиями, или событиями, которые прямо наблюдаемы. Если возможно, они также должны быть измеряемы.

Теория поведения, очевидно, использует ряд симво­лических конструктов, совокупность которых состав­ляет единую цепь. Основные звенья этой цепи пред­ставлены на схеме (см. с. 529). В интересах ясности символические конструкты сопровождаются более важными и ревалентными символами, которыми обозначаются соответствующие наблюдаемые условия, или события. Чтобы различать этих два типа символов, символические конструкты обведены кружками. Можно заметить, что символы наблюдаемых явлений ветвятся как в начале цепи, так и в ее конце, там где они должны обеспечивать валидность конструктов.

Организмы как саморегулирующиеся механизмы

Рассматриваемые с точки зрения биологической эво-люции живые организмы являются в большей или мень-шей степени саморегулирующимися механизмами. В данном контексте мы определяем такой механизм как некоторый физический агрегат, поведение которого проявляется в определенных условиях в соответствии.с неизменными правилами и законами. Биологическая природа этих агрегатов такова, что особям, или видам для выживания необходимы определенные оптимальные условия. Когда же эти условия отклоняются от оптиму-ма, равновесие, как правило, может быть восстановлено за счет некоторого действия со стороны организма; ак-тивность такого рода описывается как «приспособитель­ная ». У животных органами, осуществляющими приспособительную активность, являются в основном железы и мышцы. У высших организмов количество, разнообразие и сложность действий, обеспечивающих длительное выживание, огромны. Природа действия, или последовательности действий, направленных нато, чтобы в конкретной ситуации приблизить условия к оптимуму, за­висит одновременно (1) от степени дисбаланса или от потребности организма и (2) от характеристик окружа­ющей среды, как внешних, так и внутренних. Поэтому для истинно приспособительного действия необходимы как некоторое состояние, организма, так и соответствую­щее воздействие среды, которые должны совпасть, что­бы вызвать реакцию эффекторных органов. Первое звено функциональной связи эффекторных органов с по­требностями организма и условиями среды составляют рецепторы, преобразующие биологически наиболее важные воздействия среды (S) в нервные импульсы (s). Большинство этих импульсов направляется, к мозгу, ко­торый выступает в роли автоматического пульта управ­ления, переадресующего эфферентные импульсы (r) к эффекторам таким образом, чтобы вызвать реакцию (R). В этой связи следует особо отметить две важные законо­мерности.

Первая из этих закономерностей заключается в том, что после окончания действия стимула (S) на рецептор активность афферентного импульса (s) сохраняется еще несколько секунд, а в определенных условиях — до нескольких минут, правда, интенсивность импульса постепенно убывает. Такой остаточный след стимула биологически чрезвычайно важен, так как он обеспечи­вает связь эффектора не только с теми явлениями сре­ды, которые непосредственно возникают в данный мо­мент, но и с теми, которые имели место в ближайшем прошлом, что часто имеет исключительное значение для выживания. Таким образом осуществляется ограничен­ная, временная интеграция. Это положение о влиянии стимула выражено в постулате 1: «При воздействии энергии стимула (S) в рецепторе возникает афферентный. нервный, импульс (s), который распространяется по нервным волокнам к эффекторным органам. В тече­ние продолжающегося действия стимульной энергии (S) этот афферентный импульс (s) достигает максимальной интенсивности, затем постепенно уменьшается. После-прекращения действия стимула (S) на рецептор аффе­рентный импульс (s) продолжает свое действие в течение нескольких секунд, постепенно уменьшаясь до О».

(Формулировка взята из I главы и дана в качестве примера. В дальнейшем формулировки постулатов не приводятся — даются лишь ссылки на их номера. — Примеч. ред.-сост.)

Другая закономерность заключается в том, что им­пульсы и остаточные следы (s), вызванные различны­ми воздействиями стимульной энергии (S) на рецептор, хотя обычно и довольно близки, но, очевидно, почти никогда не бывают совершенно одинаковы. Такое от­сутствие единообразия обусловлено (1) тем фактом, что одновременно несколько рецепторов активируются стимульной энергией, а также (2) «афферентным нерв­ным взаимодействием». Новейшая гипотеза утвержда­ет на этот счет, что импульсы, вызванные в рецепторе, проходя по нервной системе к точке, где сфокусирова­ны вновь приобретенные рецепторно-эффекторные связи, взаимодействуют между собой таким образом, что каждый рецепторный импульс изменяет все осталь­ные в сторону большей или меньшей интенсивности, т. о. s меняется на.s1, s2 или s3 и т. д. в зависимости от кон­кретной комбинации других разрядов стимульной энер­гии, воспринимаемых в данный момент (см. схему на с 529). Такое взаимодействие чрезвычайно важно, так как распределение реакций организма на определен­ные комбинации, или паттерны, стимулов, равно как и на компоненты этих паттернов, очевидно, зависит имен­но от этого (постулат 2).

Психологические закономерности, согласно кото­рым нервная система обеспечивает приспособление организма на уровне поведения, пока еще окончательно не изучены. В результате этого мы вынуждены опе­рировать грубыми молярными формулировками, вы­водимыми из опытов с условными рефлексами и другими экспериментами над поведением. С этой точки зрения оказывается, что в процессе органической эволюции возникли два отдельных, но близко связанных способа эффективной поведенческой адаптации. Один из них следует искать в малоизученных рецеп-торно-эффекторных связях (SUR) на уровне нервного волокна, которые определяют, по крайней мере, приблизительные поведенческие решения в сиюминутных ситуациях, которые встречаются часто, но требуют сравнительно простых реакций (постулат 3). Другой путь эффективного поведения представляет собой, пожалуй, одно из наиболее впечатляющих достижений эволюции: это способность организмов самостоятель­но, автоматически приобретать приспособительные рецепторно-эффекторные связи. Овладение ими есть научение.

Научение и проблема подкрепления

Структура элементарного процесса научения, как показали многочисленные эксперименты, очевидно, такова: состояние потребности существует на фоне более или менее сложных рецептурных импульсов, вызываемых действием стимулов из окружающей сре­ды. Этот комплекс обстоятельств активирует разного рода неопределенные приспособительные потенциаль­ные реакции, регулируемые неизученной пока рецеп-торно-эффекторной структурой (SUR), сложившейся в ходе органической эволюции. Сравнительная сила потенциалов этих разнообразных реакций варьирует от одного момента к другому согласно фактору колеба­ния (S°R). Проистекающее отсюда разнообразие неус­военных потенциальных реакций (SUR), происходящих в данный момент, имеет следствием случайный харак­тер поведения, вызванного данными условиями. Тогда, когда одна из этих случайных реакций или их последо­вательность приводит к удовлетворению доминирую­щей в это время потребности, следует косвенный эф­фект, известный как подкрепление (G, схема). Оно заключается в следующем: (1) усиливаются определен­ные рецепторно-эффекторные связи, которые в данном случае обеспечили реакцию; (2) проявляется тенденция, согласно которой, все рецепторные импульсы, вызван­ные в данный момент, образуют новые связи с эффек­торами, обусловливая реакцию. Первый из этих эффек­тов известен как примитивное научение методом проб и ошибок, второй известен как условно-рефлекторное научение. В большинстве случаев оба процесса прояв­ляются одновременно; в действительности оба они, оче­видно, лежат в основе одного процесса, незначительно отличаясь лишь тем, что первый начинается с заметной силой, тогда как второй — практически с нуля.

В результате, если аналогичная потребность появ­ляется в подобной ситуации, то стимулы будут активи­ровать те же самые эффекторы быстрее, более опре- деленно и с большей силой, чем в первый раз. Такое

действие, хотя и не всегда безупречное с точки зрения приспособления, со временем несомненно будет вести к редукции потребности скорее, чем случайное реагиро­вание, не являющееся результатом научения (SUR), выз­ванное иной потребностью и стимульной ситуацией, а также сделает это быстрее и в более полной мере, чем при той же самой потребности и стимульной ситуации в первый раз. Таким образом, усвоение подобных рецепторно-эффекторных связей, как правило, способствует выживанию, т. е. является адаптивным.

Наблюдение и эксперименты показали, что суще­ствуют ситуации (особенно для высших организмов), в которых научение возникает вне связи с редукцией первичной потребности. При тщательном изучении таких случаев было выяснено, что агентом подкрепле­ния выступала ситуация, или событие, включающая в себя ряд стимулов, близко и постоянно связанных с редукцией потребности. Такую ситуацию называют вторичным агентом подкрепления, а укрепление рецепторно-эффекторной связи, возникающее вследствие ее действия, называют вторичным подкреплением. Этот принцип имеет огромное значение в поведении выс­ших организмов. Некоторая организация внутри не­рвной системы, вызванная определенным подкрепле­нием, известна под названием навыка; так как его нельзя непосредственно наблюдать, навык имеет ста­тус символического конструкта. Строго говоря, навык есть функциональная связь между s и r; у нас он пред-cтавлен символом SFR. Благодаря близкой функциональ­ной связи S и s, с одной стороны, и R и r— с другой, символ SHR может многое объяснить; его преимущество состоит в том, что S и R оба относятся к тем условиям, которые в норме открыты для наблюдения. Положение SHR в цепи конструктов в нашей системе представлено на схеме.

И хотя трудно определить количественное значе­ние ненаблюдаемого, различные приблизительные рассуждения позволяют в первом приближении опре­делить силу навыка как простую функцию роста от числа подкреплений. Единицей для изображения силы навыка выбран hab, аббревиатура от «habit» (навык); hab есть 1% от максимального физиологического пре-дела силы навыка в абсолютно оптимальных условиях.

Условия, влияющие на степень возрастания навыка в зависимости от подкрепления

Более внимательное рассмотрение условий под­крепления позволяет заключить, что их существует целый ряд и они варьируют, а эксперименты показали, что степень возрастания навыка (ASHR) в зависимости от подкрепления так или иначе зависит от вариации этих условий. Один из таких факторов касается агента первичного подкрепления. Было показано, что при постоянном качестве величина возрастания силы на­выка относительно подкрепления представляет собой отрицательную функцию от количества агента подкреп­ления, используемого в качестве подкрепления.

Вторым немаловажным фактором в определении значения ASHR является величина интервала времени, между стимулом и реакцией, которая им обусловлена. Ситуация осложняется тем, заканчивает или нет стимул свое воздействие на -рецептор до появления реакции. В целом эксперимент показал, что в случае, когда и сти­мул, и реакция длятся недолго, величина возрастания силы навыка относительно подкрепления максимальна, когда реакция (и подкрепление) возникает на полсекун­ды позже стимула, и она представляет собой отрицатель­ную функцию величины, с которой интервал между сти­мулом и реакцией отклоняется от этого оптимума (в обоих направлениях). В случае, если реакция возникает одно­временно с продолжающимся воздействием стимула на рецептор, величина возрастания силы навыка относи­тельно подкрепления представляет собой простую от­рицательную функцию времени, в течение которого стимул действует на рецептор с момента появления реакции. Третьим важным фактором ситуации подкреп­ления является продолжительность времени между по­явлением реакции и подкреплением (G). Эксперименты показали, что этот «градиент подкрепления» представ­ляет собой отрицательно возрастающую функцию от времени между реакцией и последующим подкрепле­нием. Принципы вторичного подкрепления и градиента подкрепления объясняют целый ряд случаев научения, в которых первичное подкрепление отсрочено от под­крепляемого акта. Ряд экспериментов продемонстриро; вал, что совмещение действия этих двух принципов

производит вторичный феномен, названный, «градиентом цели». Согласно эмпирическим исследованиям он пред­ставляет собой уменьшающуюся экспоненту, или отри­цательную функцию от времени (t), отделяющую реак­цию от первичного подкрепления в пределах от десяти секунд до пяти-шести минут; промежутки свыше шести минут изучены еще недостаточно хорошо, чтобы делать относительно них какие-либо определенные выводы.

Существует еще несколько не вызыващих сомне­ния условий, влияющих на степень возрастания силы навыка в зависимости от каждого подкрепления. Условия, описанные выше, несомнено являются типичны­ми и, вероятно, наиболее важными.

Генерализация стимула

Продолжим рассмотрение динамических принци­пов, согласно которым навыки в сочетании с адекватной стимуляцией (S) и драйвом (D) производят реальное поведение. В этой связи отметим, что стимул (5, схема), своими афферентными импульсами (s, схема) часто вы-

зывает реакцию (R), даже когда s и отличается от s или s (рецепторный импульс, первоначально связан-ный с R). Это означает, что когда стимул (S) и реакция (R) объединены в ситуации подкрепления, возникает связь не только с непосредственно подкрепляемыми стимула-м и, но и с целой зоной других потенциальных стимулов, лежащих в данном стимульном континууме, например, S1, S2, S3 и т. д. Этот факт, известный как генерализация стимула, имеет огромное приспособительное значение, так как стимулы редко или почти никогда не повторяются в точности, навыки едва ли могли бы выполнять адап-птивную функцию вне этого принципа.

Генерализация стимула имеет характеристику, которую в общем виде можно представить следующим образом: чем больше физическое отличие S от S, тем слабее сила мобилизуемого им навыка. Говоря более точно, сила генерализованного навыка (SHR) есть линей­ная функция возрастания от силы навыка в момент под-крепления и отрицательная функция от разницы (d) между S и S , измеренная в различимых пределах. Ta­ким образом, SFR есть теоретический конструкт, свя-занный с конструктом SHR и наблюдаемыми S и S (см. чему).

Очевидно, что генерализация стимула принимает две формы: (1) генерализация качества стимула и (2) генерализация интенсивности стимула, иначе говоря, каждый стимул имеет два измерения генерализации — качество и интенсивность. Оба измерения демонстри­руют падение генерализационного градиента, причем качественный градиент изменяется более резко, неже­ли градиент интенсивности стимула (постулат 5).

Первичная мотивация

Потребность организма не только является важным фактором в формировании навыка, в силу того что редукция потребности и подкрепление взаимосвязаны; она также играет важную роль в детерминации ситуа­ций, в которых навык будет вызывать действия: силу этих действий, наличие их в отсутствие подкрепления. Это, несомненно, очень важно для приспособления, так как активность, которая приводит к редукции потреб­ности, была бы пустой тратой энергии в том случае, если потребность не существовала и не заставляла бы орга­низм действовать.

Известно, что динамическое действие многих, если не всех, первичных потребностей организма связано с наличием или отсутствием в крови некоторого неболь­шого количества определенных веществ, таких, как например гормоны. Каким-то образом они связаны с большинством потребностей определенными характе­ристиками стимулов (SD), интенсивность которых изме­няется в зависимости от интенсивности потребности (постулат 6). В этой связи следует указать, что драйв (D) представляет собой логический конструкт, так как его нельзя непосредственно наблюдать, так же как и эф­фективную силу навыка (SHR). К счастью, наиболее хорошо изученные драйвы, как например голод, жаж­да и т. п., вполне могут быть выражены как функции объективно наблюдаемых условий, или событий; эти последние представлены на схеме символом cd. Так как мы определили SHR, результат (SER, схема) комбинации определенных функций от ранее определенных значе­ний сам по себе определен.

Когда были количественно изучены бесчисленные факты первичной мотивации, стал напрашиваться вывод о том, что потенциальная возможность возникновения реакции (SER) есть продукт функции от интенсив­ности драйва, помноженной на функцию от интенсив­ности навыка. Стимулы драйва (SD) обычно становятся взаимосвязанными с реакцией, которая ассоциирует­ся с редукцией потребности; и, таким образом, он ста­новится интегральным компонентом навыка (SHR).

Состояние (или условие) драйва в крови, очевидно, некоторым образом повышает чувствительность дейст­вия всех навыков независимо от того, какие драйвы участвовали в их формировании, до известной степени таким образом, что увеличивает силу опосредованных ими реакций. Характерный стимул, ассоциируемый с каждой потребностью, действуя по определенному сти-мульному образцу, является достаточным для того, что­бы вызвать соответствующую реакцию, которая при­вела бы скорее к редукции потребности, доминирующей в настоящий момент, чем к редукции других потребно­стей, которые в данное время близки или равны нулю.

Угашение, торможение и эффективный потенциал реакции

Если реакция неоднократно вызывается при отсут­ствии связи с редукцией потребности, то способность данной стимульно-мотивационной комбинации вызывать реакцию постепенно уменьшается; это уменьшение называется экспериментальным уташением. Такое прекращение бесполезной активности в высшей степени адаптивно, так как оно предотвращает растрачива-ние энергетических ресурсов организма. Что экспери­ментальное угашение касается не просто силы навыка — об этом свидетельствует тот факт, что одно усиление no­требности способно возобновить способность стимула вызвать реакцию, которая была угашена. Тщательное изучение многочисленных фактов экспериментального угашения, вероятно, вместе с относящимися к ним фе­номенами первичной мотивации позволило сформули-ровать гипотезу, согласно которой экспериментальное угашение в известной степени имеет мотивационную природу. Очевидно, что каждый раз проявление реак­ции вызывает в организме усиление состояния утом-ления за счет выработки определенных веществ, т. е. приводит к образованию условий, определяющих возникновение потребности в отдыхе. Среднее количество такого рода веществ, получаемое при каждой реакции, представлено позитивной функцией возрастания от работы или энергозатраты. (W), совершенной при испол­нении действия. Далее предполагается, что эти вещества имеют способность, тормозить влияние S, направленное на возбуждение R; по этой причине данное явление по­лучило название реактивного торможения (IR). Их накоп­ление впоследствии приводит к экспериментальному угасанию, а постепенное вынесение из волокон потоком крови приводит к спонтанному восстановлению.

В случае если реакция сопровождается подкрепле­нием и проявляется через сравнительно большие интер­валы времени, а начальная мотивация сохраняется на довольно высоком уровне, то увеличение силы навыка поддерживает потенциал реакции выше порога реак­ции. Спонтанное рассеивание эффекта торможения, как известно, происходит гораздо быстрее, чем обыч­ная утрата навыка. Из этого проистекает феномен реминисценции, специально изученный в опытах на научение.

Поскольку наличие IR определяет потребность, пре­кращение активности, вызвавшей потребность, будет инициировать процесс редукции потребности; но по­скольку редукция потребности есть критический эле­мент подкрепления, из этого с известной вероятностью следует молярный принцип: прекращение активности будет — связано в дальнейшем с любым стимулом, ко­торый последовательно ассоциирован с этим прекра­щением. Но тенденция к прекращению акта будет вы­ступать прямым тормозом к исполнению этого акта. Следовательно, включение такого тормозящего стиму­ла в стимульную структуру, остальная часть которой положительно обусловливает ответ, будет приводить к тенденции препятствовать вызыванию ответа; факти­чески это есть обычный эмпирический тест на услов­ное торможение (SLR, схема).

Согласно приведенной выше точке зрения, что SLR есть отрицательный навык, введение в комплекс стиму­лов некоторого иного стимула согласно принципу аф­ферентного взаимодействия вызовет растормаживание, т. е. временное прекращение либо полную ликвидацию SLR. Но, допустив, что SLR возникает в процессе накоп-ления 1, мы приходим к выводу, что полное торможение (iR) в конце экспериментального угасания есть от­части IR, а отчасти — SIR. Поэтому растормаживание будет иметь место, только если IR есть производная от SLR, а спонтанное восстановление будет иметь место, только если iR есть производная от LR; это означает, что ни растормаживание, ни спонтанное восстановление не могут полностью восстановить утраченный потен­циал реакции до его первоначального уровня. Из вышесказанного следуют еще и такие выводы: в экспе­риментах на научение более экономичны разбросан­ные во времени, нежели массированные повторения; а также при прочих равных условиях организмы, полу­чающие одинаковое подкрепление после двух реакций, одна из которых требует меньших энергозатрат, в конце концов, как показывает практика, выберутменее трудо­емкую реакцию. Таков «закон наименьшей работы».

Из вышесказанного неявно вытекает следующее допущение: потенциал реакции, реально ответственный за вызов реакции, т. е. эффективный потенциал реак­ции {SFR, схема), есть остаток от вычитания полного тор­можения IR из потенциала реакции SER, т. е. = SERiR

А поскольку SER и iR взаимосвязаны с объективно наблюдаемыми условиями, то таким же образом SER оказывается взаимосвязанным с ними.

Колебание эффективного потенциала реакции

Следует отметить, что SER редко реализуется полностью, чтобы вызвать некоторое действие. Он, понижаясь, случайно варьирует. Такие флуктуации, очевидно, проис-ходят благодаря малоизученному физиологическому про-цессу, который имеет силу нейтрализовывать потенциа-лы реакций до уровня, варьирующего от одного момента к другому. Поэтому данный процесс назван «колебани­ем » и представлен символом S°R.. Эффективный потен­циал реакции с учетом его колебания называется «мо­ментальным эффективцым потенциалом реакции»; он представлен символом SER. Так как S°R прямо не наблю­даемо, то оно имеет статус символического конструкта; с другой стороны, благодаря своему постоянному значению оно более осязаемо, чем обычные конструкты; таким образом, на схеме оно не обведено кружком. Гипотетические характеристики S°R:

1) оно постоянно активно;

2) оно оказывает подавляющее действие на любой потенциал реакции независимо от того, велик он или мал;

3) величина потенциалов, таким образом, варьиру­ет от одного момента к другому согласно нормальному распределению;

4) степени его влияния на различные потенциалы реакций в один и тот же момент не коррелируют между собой (постулат 10).

Так как колебание постоянно воздействует на потенциалы реакций, его роль в приспособительном поведении очень велика. Вероятно, именно оно ответ-ственно-за целый ряд феноменов, сгруппированных классическими психологами под названием «внима­ние». Оно также в значительной степени ответствен­но за тот факт, что в социальных науках необходимы многочисленные наблюдения, прежде чем удастся вы­вести простые эмпирические законы. Естественные законы в социальных науках должны базироваться на статистических показателях. Это в свою очередь обус­ловливает интерес к статистическим методам со сто­роны наук о поведении. Необходимость проведения большого количества наблюдений для выведения эм­пирических законов значительно усложнила работу эмпирических исследователей и, вне сомнения, серь­езно замедлила развитие наук о поведении.

Порог реагирования и возбуждение реакции

В конечной части цепи поведенческих конструктов с кульминацией в SER, как показано на схеме, находится возбуждение наблюдаемой реакции. В определении функционального отношения SER к различным наблю­даемым явлениям или реакциям мы сталкиваемся с оп­ределенными трудностями в связи с тем, что SER само не может быть прямо наблюдаемо. Если бы мы были вполне уверены относительно количественного функциональ­ного отношения SER к комбинации предшествующих эле­ментов, то уровень SER можно было бы подсчитать в со­ответствии с эмпирической ситуацией, а затем вывести уравнения отношения этих значений к соответственным показателям реакций. Именно такие уравнения нужны. Но, к сожалению, предшествующие функциональные отношения еще недостаточно точно изучены.

Однако в типичных случаях простого научения, вклю­чающих четыре измеряемых феномена реакции, искомые уравнения легко выражаются равенством, включающим положительно возрастающую (экспонентную) функцию от числа подкреплений (N). Это равенство отчасти под­тверждает правильность гипотезы об отношении Nk ShR и NkSeR.. Подтверждение последнего (отношение SER к N) базируется на следующем факте: при теоретическом анализе типичной кривой научения выясняется, что ве­роятность возбуждения реакции, и это едва ли можно отнести на счет случайности, определяется согласно .вы­шеприведенному допущению об отношении SWR к N, а также двум дополнительным допущениям, каждое из которых подтверждается независимыми свидетельства­ми о функции колебания (S°R) и о пороге реакции (SLR) (см. схему). Характеристики функции колебания описаны выше. Более того, концепция порога реакции получи­ла достаточное развитие, так как сравнимые понятия давно были известны в классической психофизике и физиоло­гии. Как уже указывалось, порогреакции (SLR) есть мини­мальный уровень моментального эффективного потенци-ала реакции (SFR), необходимый для вызова реакции в том случае, когда отсутствуют конкурирующие потенциалы реакций (постулат 11).

Далее, на основе подтвержденной гипотезы об отношении SBR к N, анализируя уравнения применительно к конкретным примерам трех оставшихся типов кривых научения и используя метод остатка, уже довольно про-сто выяснить функциональные отношения SER к феноменам поведения. В результате мы приходим к выво­ду, что вероятность возбуждения реакции зависит от эффективного потенциала реакции (постулат 12); ла­тентное время реакции находится в негативно уско­ряющемся инвертированном отношении (постулат 13); а сопротивление экспериментальному угасанию и амп-литуда реакции (для автоматически вызываемых реак­ций) представляют собой возрастающие линейные фун-кции от SER (постулаты 14 и 15).

Последняя сложность, касающаяся возбуждения реакции, вызвана тем фактом, что очень часто воздей-ствие элементов стимула на рецептор в конкретный мо-мент может мобилизовать надпороговые потенциалы нескольких различных реакций, частично или полностью несовместимых. В этом случае все, за исключени­ем самого сильного, претерпят общее угасание (посту­лат 16). Есть также некоторые свидетельства в пользу того, что и доминирующий потенциал будет отчасти блокирован; в этом, видимо, основа наиболее правдо-подобной теории «забывания», используемой ныне.

На этом мы закончим обзор первичных принципов. Все они могут быть представлены в форме уравнений. Это значит, что если известны первоначальные усло-вия5, i R, G, t, t', S, s, cD, W, S°R и SLR, то возможно под­считать р, S'R, n или А, подставляя соответствующие зна­чения в уравнения, начиная с левой части схемы и продвигаясь к правой.

Динамика стимульных комплексов и паттернов

Несмотря на предполагаемый факт афферентного нервного взаимодействия, афферентные импульсы различных рецепторов во многом сходны, даже при наличии одновременного воздействия других стимуль-ных элементов. Это означает, что каждый компонент стимула, связанный с реакцией, обычно будет управлять потенциалом этой реакции независимо от других парал­лельных стимулов. Согласно первичному закону науче­ния каждый отдельный рецепторный импульс несет в себе определенный заряд силы навыка, а следова­тельно, и потенциал реакции. Потенциалы реакций, заключающиеся в рецепторных импульсах, вызванных различными элементами стимульного комплекса, коли­чественно сочетаются подобно тому, как сочетаются различные увеличения силы навыка, т. е. не за счет суммации, а согласно возвратно-поступательному принци­пу. Таким образом, если два стимульных агрегата, несу­щих одинаковые заряды потенциала и направленных на одну реакцию, действуют одновременно как стимуль-ный комплекс, то их физиологическая сумма, за исклю­чением эффектов афферентного взаимодействия, будет меньше, чем арифметическая сумма двух потенциалов реакции; точно так же, если действуют два одинаково заряженных стимульных агрегата, то в случае выпаде­ния одного из них останется более половины общего потенциала реакции. В результате (не говоря об эффек-тах афферентного нервного взаимодействия) чем более сложный подкрепленный стимульный комплекс будет повторяться в последующих ситуациях, тем с большей вероятностью он будет вызывать реакцию.

Такой способ действия имеет особое адаптивное зна­чение, так как чем более сложен повторяющийся сти­мульный комплекс, тем более будет похожа окружающая обстановка на ту, которая впервые вызвала редукцию потребности, и, таким образом, реакция с большей веро­ятностью вновь приведет к редукции потребности. Здесь мы имеем примитивный механизм грубого подсчета ве­роятности того, приведет ли данная стимульная ситуация к редукции потребности, если на эту ситуацию будет вызвана реакция.

Этот адаптивный механизм имеет то преимущество, что он пригоден для любой стимульной ситуации, но­ной или нет. Другой изученный нами вторичный прин­цип, определяющий реакции организма на стимульные комплексы, известен как образование паттернов. Он функционирует одновременно с уже описанным прин­ципом суммации, но действие его гораздо медленнее. Тем не менее при наличии достаточного времени, кото­рое требуется для сложного процесса научения, он м ожет оказаться чрезвычайно важным для приспособ­ления. Действительно, во многих ситуациях решение вопроса, последует ли за реакцией подкрепление, за-висит от наличия или отсутствия определенной комби­нации обстоятельств, а для организма, следовательно, больше от определенной комбинации или паттерна стимульных элементов, чем от наличия или отсутствия его отдельных компонентов. Таким образом, каждая комбинация стимульных элементов будет в известной степени определять афферентные импульсы, вызыва­емые каждым стимульным компонентом; любое из­менение стимульного комплекса также в известной степени будет изменять афферентные импульсы, выз-ванные оставшимися компонентами комплекса. В про­цессе нерегулярного выборочного подкрепления и угасания, называемого дифференциальным подкреп-лением, которое характерно для метода проб и ошибок, известного как дискриминационное изучение, высшие организмы могут проявлять одну реакцию, успешно связанную с одной комбинацией стимулов, и совсем иную реакцию, связанную с другой коминацией, вклю-чающей некоторые элементы первой, при условии наличия и других элементов. В основе своей такое разли­чение возможно, потому что афферентный импульс sv вызванный стимульным элементом S;, появившимся одновременно с элементом S2, в известной степени от­личается от $3, вызванного тем же элементом S, при од­новременном действии элемента S3. Физиологическая суммация нескольких потенциалов реакций, характер­ных для различных стимульных паттернов, имеющих много или даже большинство общих элементов, может иметь своим результатом реагирование на каждый. Так, каждый из примерно сорока речевых звуков есть осо­бый паттерн, составленный из «основной» физической скорости колебаний и определенной комбинации час­тот. Каждое из тысяч слов развитых языков состоит из последовательности речевых звуков, пауз т. п. При чте­нии каждая буква есть сложный зрительный паттерн, каждое слово есть сложный паттерн этих буквенных паттернов, а каждая фраза — последовательность на­печатанных словесных паттернов. Действительно, труд­но вообразить жизненную ситуацию, не привлекая понятия паттерна. Ограничением для научения в этом случае является то, что когда комплекс стимулов связы­вается с реакцией, его отдельные компоненты, действуя сами по себе, теряют силу.

Взгляд в будущее

Основной задачей данной работы было выделить и представить первичные — базовые — принципы, или законы поведения, как они представлены на нынешнем этапе развития наук о поведении; к настоящему време­ни их выделено шестнадцать. Если эти принципы, или постулаты, достоверны, из них возможно будет вывес­ти логическую иерархию вторичных принципов, кото­рые будут существовать параллельно объективно на­блюдаемым феноменам поведения высших организмов; такая иерархия будет представлять собой системати­ческую теорию всех социальных наук.

С прогрессом поведенческих наук некоторые прин­ципы, выдвинутые как первичные, будут признаны лож­ными и отменены; некоторые перестанут считаться пер­вичными, поскольку выяснится, что они выводимы из других первичных принципов, и они будут отнесены ко вторичным; некоторые будут признаны неправильными и потребуют изменений; наконец, должны быть добавлены новые постулаты. Первичные принципы, представленные ранее, сформулированы с учетом по­добных изменений. Во многих случаях жесткая форму­лировка принципов вызвала сомнения в их валиднос-ти. Надеемся, однако, что четкие формулировки, даже будучи впоследствии признаны неверными, позволят легче и быстрее прийти к правильным формулировкам, чем это сделают расплывчатые утверждения, которые труднее уличить в ошибочности. Основной задачей науки является быстрое и экономичное выявление ее основных .законов. С точки зрения умудренного опы­том ученого, не стыдно выдвинуть неверное предполо­жение, ошибочность которого может быть легко дока­зана; научное открытие есть отчасти процесс проб и ошибок, и этот процесс не может идти без ошибочных, как и без успешных попыток. С другой стороны, исполь­зование методологии, с помощью которой невозможно найти однажды сделанную ошибку, умышленное вуа­лирование возможной ошибки красивыми словами, философским туманом и антропоморфические предупреждения — все это замедляет процесс проб и ошибок и тормозит научный прогресс.

Остается надеяться, что с годами появятся теорети­ческие трактаты по различным аспектам наук о поведе­нии. Первый из них должен, естественно, представить общую теорию индивидуального поведения. Тщатель­ная разработка различных аспектов этих проблем при-ведет к созданию серий теоретических работ, касаю­щихся различных специальных сторон поведения млекопитающих, особенно человеческого поведения. Сюда войдут труды, посвященные теории навыков и их приобретения, коммуникативному символизму речи (семантике), использованию символов в индивидуаль­ном решении задач (включая мышление), экономичес­ким, моральным, эстетическим ценностям, семейному поведению, индивидуальной адаптивной эффективно-сти (интеллекту), формальным образовательным про­цессам, психогенным расстройствам, социальному контролю и преступности, характеру и личности, куль­туре и аккультурации, обычаям, законам, юриспруден­ции, политике и управлению, и многим другим специ­альным областям.

И как кульминация, в конце концов появится рабо­та, состоящая в основном из математики и математиче­ской логики. Там будет приведен перечень понятий и знаков, чьи эквиваленты доступны прямому наблюде­нию; в силу того что понятия прямо связаны дифферен­циальным подкреплением с эквивалентами, они будут обладать минимумом двусмысленности. Отсюда с по­мощью уникального метода символической логики бу­дут синтезированы критические понятия всей систе­мы, а корректные первичные понятия для валидной систематизации не менее важны, чем первичные прин­ципы; таким образом, будет выделен полный набор недвусмысленных терминов. Из этих терминов, или знаков, будут сформулированы точные математические выражения для тех постулатов, или первичных моляр­ных принципов, которые останутся в результате про­гресса науки, и для тех, которые будет необходимо вве­сти; отсюда с помощью математических методов будут выведены теоремы, параллельные всем эмпирическим ответвлениям так называемых социальных наук. Отсю­да же будет выведен ряд теорем, касающихся еще не познанных ситуаций; они будут иметь практическое при­менение и, возможно, повлекут социальные открытия.

Как можно судить из истории, социальным наукам потребуется долгое время, чтобы достигнуть описанно­го здесь статуса. Тем не менее есть надежда, что после­дующее столетие явит беспрецедентное развитие в этой области.

Задача систематического развития наук о поведе­нии трудна, на пути к ее решению стоят многие корен­ные перемены. Исследователь поведения должен не просто разбираться в математике — он должен научить­ся думать в понятиях уравнений и высшей математики. Прогресс будет заключаться в выведении сотен уравне­ний, экспериментальном обосновании эмпирических констант, содержащихся в этих уравнениях, в выделе­нии практически значимых единиц, в которых можно выразить составляющие уравнений; в объективном oп- ределении сотен символов, появляющихся в уравнениях, в выведе нии одной за другой тысяч теорем и следствий из первичных определений и уравнений, в проведении тысяч количественных экспериментов и полевых наблюдений, подкрепленных воображением, проницательностью, смелостью проверить одновременно валидность теорем, первичных принципов и понятий, из которых последние выведены; в беспощадном отказе и пересмот­ре ранее привлекательных принципов и понятий, час­тично или полностью дискредитированных в процессе эмпирической проверки.

Скиннер (Skinner) Берхаус Фреде­рик (1904—1990) — американский пси­холог, развил концепцию радикально­го бихевиоризма, центром которой является учение об оперантном пове­дении. В связи с распространением ре­зультатов исследования поведения на социальные проблемы получила также название социального бихевиоризма. Окончил Гамильтон-колледж в 1926 г. Получил степень доктора фи­лософии в Гарвардском университете (1931). С 1948 г. — профессор Гарвардского университета, член нацио­нальной Академии наук. Начал свои работы по объек­тивному исследованию поведения животных в 1930 г. Воз­никновение понятий «оперантное обусловливание» и «оперантная концепция» относится к 1932—1934 гг. Ее теоретическое оформление составляет содержание книги «Поведение организмов» (1938). Дальнейшее развитие кон­цепции связано с ее распространением на поведение чело­века («Наука и человеческое поведение», 1953; «Вербаль­ное поведение», 1957). Хотя вербальное поведение Скиннер называет специфически человеческим, отличающимся от физических действий животных и имеющим свои специ­фические свойства, делается вывод о том, что методы, при­мененные в экспериментальных исследованиях на живот­ных, «...могут быть распространены и на человека, не подвергаясь при этом существенным модификациям» (Verbal bechavior. —N. Y., 1957. —P. 3). Развиваемые в ука­занных исследованиях взгляды на природу процесса науче­ния были распространены затем с лабораторных условий на обучение людей и воплотились в концепцию программи­рованного обучения («Наука об учении и искусство обуче­ния», 1954; «Технология обучения», 1968). Начиная с 50-х гг., осуществляется выход методов оперантного бихевио­ризма в терапевтическую практику — так называемая тера­пия действия, или терапия поведения.

Продолжая намеченную уже в исследованиях 30-х гг. стратегию на применение результатов исследований к ре­шению практических задач (обучение — одна из возмож­ных областей такого применения), Скиннер разрабатывает идею управления поведением и создает технологию поведе­ния, целью которой является разрешение социальных про-

блем общества путем модификации поведения человека средствами внешнего контроля («По ту сторону свободы и достоинства», 1971). Технология поведения выступает логи­ческим — и трагическим — завершением натурализации человека в бихевиоризме.

В 70-ё гг. выходят труды, обобщающие прежние идеи: «О бихевиоризме», 1974; «Автобиография» в 2-х т., 1976; «Размышления о бихевиоризме и обществе», 1978. Широко влияние идей Скиннера за рубежом. Однако этот успех объясняется не одними научными достоинствами концепции, которая подвергается сокрушительной критике как в отече­ственной, так и в зарубежной психологии и оценивается как «довольно скромное распространение закона эффекта Тор-ндайка» (Цит. по: Талызина Н.Ф. Управление процессом усвоения знаний. — М., 1975. — С. 265). Влияние Скиннера выражалось в возникновении новых школ психиатрии, но­вой социальной практики, новых технологий обучения, ко-торые явились практической реализацией его идей.

Соч.: The Behavior of Organisms. — N. Y., 1938; Science and Human Behavior. — N. Y., 1953; The verbal Behavior. — N.Y., 1957; Beyond Freedom and Dignity. — N. Y., 1972; About Behaviorism. N. Y., 1974.

Лит.: Артыков Д.Р. Некоторые вопросы исторического анализа генезиса психологической концепции. — Вопросы психологии. — 1979, № 5. — С. 55—61; Артыков А.Р., Пис-коппель А.А. Философия радикального бихевиоризма — завершающий этап развития концепции Б.Ф. Скиннера. — Вести. Моск. ун-та. Сер. 14. Психология. — 1981, № 4; Талы-чша Н.Ф. Управление процессом усвоения знаний. — М.,

1975. — С. 258—272; Фейдимен Дж., Фрейгер Р. Личность и личностный рост. — Вып. 3. — М.; Изд-во Российского от­крытого университета. 1994; и др.

В сборник включена глава V— «Оперантное поведе­ние» — из книги «Наука и человеческое поведение» (Scien-ce and Human Behavior), в которой излагаются основные

понятия концепции оперантного поведения Скиннера.

ОПЕРАНТНОЕ ПОВЕДЕНИЕ

Рефлексы, как условные, так и всякие другие, глав-ным образом связаны с внутренними физиологически-ми процессами в организме. Однако чаще всего нас

интересует такое поведение, которое имеет определен­ное воздействие на окружающий мир. Оно возникает в результате столкновения человека с необходимостью решать задачи, выдвигаемые жизнью. Кроме того, его специфические характеристики также представляют интерес для теории. Последствия поведения могут иг­рать роль обратной связи для организма. В этом случае они изменяют вероятность осуществления поведения, породившего их. В английском языке много слов, име­ющих отношение к данному эффекту, например «по­ощрение» и «наказание», но ясное представление о нем мы можем получить только в результате проведения эксперимента,

Кривые научения

В 1898 г. Э. Л. Торндайком была предпринята одна из первых серьезных попыток изучить изменения, обусловливаемые последствиями поведения. Его экс­перименты возникли на основе дискуссии, которая впоследствии заинтересовала многих ученых. Ч. Дар­вин, настаивавший на преемственности видов, подверг сомнению уникальность человека и его способность думать. В печати распространилось большое количе­ство анекдотов, в которых говорилось о проявлении животными «силы разума». Но распространение осо­бенностей, ранее характеризующих только поведение человека на поведение животных, привело к постанов­ке новых вопросов. Указывали ли наблюдаемые факты на психические процессы или эти очевидные проявле­ния мышления могут быть объяснены иначе? В конце концов отпала необходимость в представлении о внут­ренних мыслительных процессах. Должно было прой­ти много лет, прежде чем тот самый вопрос о специ­фичности поведения человека не возник вновь, но эксперименты Торндайка и его объяснение мышления (reasoning) животных явились важным шагом в этом направлении.

Если кошка помещается в ящик, из которого она может выбраться, открыв задвижку, она может про­явить много видов поведения, некоторые из которых могут оказаться эффективными. Торндайк установил, что при многоразовом помещении кошки в ящик ус- пешное поведение наступало все быстрее и быстрее, и это продолжалось до тех пор, пока оно не стало пре­дельно простым и быстрым. Кошка решала свою зада­чу, как разумное человеческое существо, хотя, возмож­но, и не так быстро. Однако Торндайк не видел за этим «мыслительных процессов» и утверждал, что они не­нужны для объяснения. Он описал свои результаты, указав на то, что поведение кошки было «запечатлено» (stamped in), поскольку оно сопровождалось открыти­ем двери.

Тот факт, что поведение запечатлевается или со­провождается определенными последствиями, Торн­дайк назвал «законом эффекта». В своих эксперимен­тах он установил, что в рамках одной и той же ситуации определенное поведение протекает все более и более

стабильно в отличие от других поведенческих проявлений. «Фиксируя промежутки времени, которые требовались кошке для того, чтобы выбраться из ящика, он построил «кривую научения». Эта ранняя попытка описать поведенческий процесс количественно, аналогич­но описанию физических и биологических процессов, рассматривалась как важный шаг вперед. Он раскрыл процесс, который развертывался в течение длительного времени и который был доступен для наблюдения. Итак, Торндайк сделал открытие. С тех пор было получено много кривых, которые легли в основу многих психологических работ, посвященных научению.

Однако кривые научения не описывают сущность запечатления. Критерий Торндайка — время, необходимое животному для того, чтобы выбраться из клетки, — был связан с устранением других видов поведения, и его кривая зависела от ряда различных действий, кото­рые могла выполнять кошка в определенном ящике. Форма кривой также зависела от поведения, которое было «успешным», и от того, был ли это редкий или обычный способ поведения в данном ящике. Можно сказать, что кривая научения, построенная таким образом, отражает свойства ящика с задвижкой, а не поведение кошки. Это положение распространяется на многие другие устройства, разработанные для изучения научения. Различные лабиринты, через которые белые крысы и другие животные учатся проходить, «ящики выбора», в которых животные научаются различать свойства, или паттерны стимулов, аппараты, посредством которых представляется последовательность стимулов, подлежащих усвоению при изучении памяти человека, — все они порождают различные кривые научения.

Усредняя многие показатели индивидов, мы можем сгладить эти кривые настолько, насколько хотим. Бо­лее того, кривые, полученные в различных условиях, могут иметь определенные общие свойства. Например, при измерении данным способом научение обычно «имеет негативную характеристику убыстрения» — улучшение выполнения наступает все более и более медленно до тех пор, пока оно вовсе не прекращается. Однако из этого не следует, что негативная акселера­ция характеризует сущность процесса. Предположим по аналогии, что мы наполнили стеклянный сосуд пес­ком и так его перемешали, что песчинки одного и того же размера равномерно распределились внутри него. Если мы слегка встряхнем сосуд, то песчинки перерас­пределяются. Большие песчинки окажутся наверху, маленькие — внизу. Этот процесс также характеризу­ется негативной акселерацией. Сначала смесь перерас­пределяется быстро, но по мере приближения к его завершению процессы в распределении наступают реже и реже. Такая кривая может оказаться совершен­но ровной и воспроизводимой, но один лишь этот факт не имеет большого значения. Кривая зависит от опре­деленных процессов взаимодействия песчинок различ­ного размера, от силы сотрясения сосуда и т. д., но в то же самое время она прямо не отражает сами эти про­цессы.

Кривые научения показывают, как различные виды поведения, порождаемые в сложных ситуациях, отби­раются, закрепляются и реорганизуются. Базисный процесс запечатления отдельного акта осуществляет это изменение, но в самом изменении он прямо не от­ражен.

Оперативное обслуживание

Для понимания сущности закона эффекта Торндайка нам необходимо дать четкое определение понятия «вероятность реакции». Это очень важное понятие, но, к сожалению, очень трудное. При обсуждении поведения человека мы часто апеллируем к тенденциям «расположенности» вести себя определенным образом. Почти в каждой теории поведения используются такие термины, как «потенциал возбуждения», «сила привыч­ки» или «детерминирующая тенденция». Но как мы наблюдаем тенденцию? И как можно ее замерить?

Если бы определенное поведение существовало в двух ипостасях — в одном случае оно всегда бы имеломесто, а в другом — никогда, то мы оказались бы почти в беспомощном состоянии при введении программы функционального анализа. Феномен, имеющий характе­ристики «все и ничего», имеет только простые формы описания. Гораздо более продуктивным является предположение, что вероятность осуществления реакции по­следовательно распределяется между этими двумя по­люсами «все — ничего». Тогда мы можем рассмотреть переменные, которые в отличие от стимулов порожде­ния (eliciting stimulus), «не являясь причиной данного поведения», делают его наступление более вероятным. Далее мы можем, например, рассмотреть последствия действия нескольких таких переменных.

Распространенные выражения, отражающие вероятностную природу явления, — «тенденция» или «предрас­положенность» — характеризуют частоту наступле­ния определенных видов поведения. Мы никогда не наблюдаем вероятность. Мы говорим, что кто-то «обожает бридж», потомучто замечаем, что он часто играетв бридж и часто говорит о нем, «Глубоко интересоваться» музы­кой означает много играть, часто слушать музыку и много говорить о музыке. « Неисправимый игрок» много играет в карты. Любитель киносъемок делает снимки, проявляет их и любуется своими собственными снимками и снимками других людей и т. д.

Характеризуя поведение человека с точки зрения его частоты, мы принимаем определенные стандартные условия: он должен быть способен выполнить и повторить определенное действие, при этом другие виды поведения не должны мешать. Например, мы не можем знать, насколько сильна тяга человека к музыке, если ему приходится также заниматься другими вещами. Подойдя к проблеме уточнения научного определения вероятности, мы обнаруживаем, что исходными моментами являются частота и условия, при которых наблюдается то или иное поведение. Мы устраняем или покрайней мере сохраняем в неизменном виде любое условие, которое способствует проявлению конкуриру­ющего с изучаемым нами видом поведения. Животное помещается в отдельный (quiet) ящик, и за его поведе­нием наблюдают с помощью одноканального экрана, или оно регистрируется посредством специальных технических устройств. Эти условия нельзя рассмат­ривать как вакуумную среду, так как животное будет реагировать на свойства ящика многими способами, однако его поведение постепенно достигнет достаточ­но устойчивого уровня, на котором можно исследовать частоту заданной реакции.

Для изучения процесса, который Торндайк назвал запечатлением, мы должны иметь его «последствие». Это может быть, например, предъявление еды голод­ному животному. Мы можем предъявлять нашему ис­пытуемому еду в удобном для него месте, на большом подносе, с помощью специального устройства. При первом предъявлении подноса животное, вероятно, будет реагировать на него различными, поведенчески­ми реакциями, которые мешают проявлению изучае­мого нами поведения. Постепенно после нескольких кормлений оно без промедления принимает пищу и мы получаем возможность рассматривать это последствие как зависящее от поведения и наблюдать его результат. Мы выбираем относительно простой вид поведения, который свободно и многократно воспроизводим и кото­рый легко поддается наблюдению и регистрации. На­пример, если испытуемым является голубь, то поднятие им головы выше определенного уровня является удобным поведением для изучения. Оно может быть зафиксировано взглядом экспериментатора на шкале, прикрепленной к задней стенке ящика, на фоне которой находится голубь. Сначала мы изучаем естественную высоту поднятия го­ловы голубем и выбираем на шкале отметку, которая до­стигается им только в отдельных случаях. Фиксируя свой взгляд на шкале, экспериментатор начинает очень быс­тро открывать поднос, как только голова поднимается выше этой линии. Если эксперимент проводится в соот­ветствии со спецификациями, то получается один и тот же результат: мы наблюдаем быстрое изменение частоты пересечения головой голубя заданной линии. Мы также видим, что голова голубя поднимается на более высокий уровень, и этот факт имеет большое теоретическое значе­ние. Мы можем очень быстро заставить голубя высоко поднимать голову, установив время предъявления пищи. Через одну-две минуты поза голубя изменяется таким образом, что его голова редко опускается ниже линии, которую мы выбрали вначале.

Когда мы демонстрируем процесс запечатления в такой относительно простой форме, мы видим, что не­которые обычные интерпретации эксперимента Торн-дайка избыточны. Выражение «научение путем проб и ошибок», которое часто связывается с законом эффекта, здесь явно неуместно. Мы вкладываем особый смысл в наши наблюдения, когда называем любое поднятие го­ловы «пробой», и нет оснований считать «ошибочным» любое движение, которое не приводит к установленно­му нами результату. Даже употребление термина «науче-ние» вводит в заблуждение. Утверждение, что «птица научается получать пищу посредством вытягивания шеи», является неадекватным выражением того, что происходит. Говорить, что она приобрела «навык» вы­тягивать шею — значит просто обращаться к объясни-тельным вымыслам, поскольку единственным доказа­тельством наличия навыка является приобретенная тенденция выполнять действие. Простейшим возможным описанием данного процесса является следующее: мы делаем данный контингент следствий зависимым от оп-ределенных физических свойств поведения (поднятия головы), далее фиксируем, что частота появления этого поведения возрастает. Принято рассматривать любое движение живого существа как реакцию. Это слово заимствовано из исследований, посвященных изучению рефлексов. Оно означает действие, которое наступает в ответ на предшествующее событие — стимул. Но мы можем сделать событие зависимым от поведения без определения предшествующего стимула. Мы не изме­няем среду обитания голубя для того, чтобы вызвать поднятие головы. Вероятно, нельзя показать, что любой простой стимул неизменно предшествует этому движе-нию. Такое поведение может оказаться под контролем стимулов, но при этом отсутствуют отношения по типу одно порождает другое». Поэтомутермин «реакция» не вполне адекватен, но он настолько укоренился, что далее мы будем его использовать.

Конечно, нельзя предсказать и проконтролировать реакцию, которая уже произошла. Можно только пред­сказать, что похожие реакции будут наблюдаться в бу­дущем. Поэтому единицей науки о прогнозировании яв­ляется не реакция, а класс реакций. Для его описания будет использоваться слово «оперантный». Данный тер­мин показывает, что поведение «воздействует» (operates) на среду, генерируя последствия. Следствия определяют свойства, по которым устанавливается сходство реакций. Он будет использоваться и как прилагательное (операн-тное поведение), и как существительное, обозначающее поведение, определенное данным следствием.

Поднятие голубем головы один раз в определенный момент является реакцией. Это прошлое и его можно рассматривать со всех точек зрения, которые представляют для нас интерес. Поведение, называемое «поднятием головы», которое происходит независимо от опреде- ленных обстоятельств (instances), является оперантным. Его можно описать не как завершенное действие, а как состав действий, определяющийся свойствами высоты, на которую нужно поднять голову. В этом смысле oпe-рант можно определить посредством следствия, характе-ризуемого с помощью физических терминов. «Поднятие головы» («cutoff») на определенную высоту является частью (property) поведения.

Традиционное употребление термина «научение» может быть сохранено для описания перераспределения реакций на классы в сложной ситуации. Терминология, необходимая для описания процесса запечатления, может быть заимствована из теории условных рефлексов И. П. Павлова. Сам Павлов называет все события, которые усиливают поведение «подкреплением» и все возникающие в связи с ним изменения, «обусловливанием». Однако в экспериментах Павлова подкрепление сочетается со стимулом, а при оперантном поведении оно зависит от реакции. Поэтому оперант-ное подкрепление является специальным процессом и нуждается в специальном анализе. В обоих случаях усиление поведения, происходящее в результате подкрепления, называется «обусловливанием». При оперантном обусловливании мы усиливаем оперант, чтобы увеличить вероятность или частоту появления реакции. В условиях павловского, или «респондентного», обусловливания мы просто повышаем величину реакции, вызванную условным стимулом, и сокращаем время между стимулом и реакцией. Мы уже отмечали,- что этими двумя случаями исчерпываются возможности: 1) организм обусловливается, когда подкрепление сопро­вождает другой стимул, или 2) следует за поведением организма. Любое событие, которое не приводит к од­ному из этих случаев, не влияет на изменение вероят­ности реакции. Тогда в эксперименте с голубем еда является тем, что подкрепляет, а ее предъявление, ког­да реакция «выделяется», является подкреплением. Оперант определяется свойствами, от которых зависит подкрепление — высотой, на которую должна подни­маться голова голубя. Изменение частоты поднятия головы на эту высоту есть процесс оперантного обус­ловливания.

Находясь в состоянии бодрствования, мы постоян­но воздействуем на среду, и многие последствия нашего поведения имеют силу подкрепления. Посредством опе-рантного обусловливания среда конструирует базисный репертуар поведения, благодаря которому мы сохраняем равновесие, ходим, играем в спортивные игры, пользу­емся инструментами, говорим, пишем, гребем, управля­ем автомобилем и самолетом. Мы можем оказаться не готовыми к изменению в среде, например появлению нового автомобиля, нового друга, новых интересов, к смене работы и местожительства, но мы обычно быстро приспосабливаемся к новой обстановке, приобретая новые реакции и утрачивая старые. <...> Оперантное подкрепление не только структурирует репертуар поведения. Оно улучшает продуктивность поведения и еще долгое время сохраняет его после того, как его усвоение или продуктивность теряют свою значимость.

Количественные свойства

Совсем не просто получить кривую научения. Мы не можем полностью изолировать оперант и устранить все случайные помехи. Можно было бы построить кри­вую и показать, как частота поднятия головы на определенную высоту изменяется в зависимости от времени или количества подкреплений, но дело в том, что общий эффект больше. Происходит смещение в более крупной схеме поведения, и для того чтобы его полностью описать, необходимо проследить все движения головой. Даже в этом случае мы не исчерпаем всей проблемы. Высота поднятия головы была выбрана про­извольно, и эффект подкрепления зависит от нее. Если подкрепить высоту, которая достигается редко, изме­нение в схеме будет гораздо больше, чем в случае, ког­да выбирается высота, на которую голубь обычно под­нимает голову. Для адекватного объяснения необходимо получить набор кривых, описывающих все случаи. Если заставить голубя поднимать голову все выше и выше, появляется еще один произвольный элемент, так как можно использовать различные графики подкрепле­ния. Каждый график дает свою кривую, и картину можно считать исчерпывающей, только если будут использованы все графики подкрепления.

Мы не можем обойти эти проблемы, выбрав реак­цию, которая более строго определяется свойствами среды, например открытие двери. Определенный меха­нический индикатор поведения, разумеется, предпочти­тельнее, поскольку, например, он позволяет организо­вать постоянное представление подкрепления. Можно регистрировать высоту поднятия голубем головы с по­мощью фотоэлемента, но легче выбрать такую реакцию, которая производит изменение в среде и которую легче регистрировать. Если птица научается нажимать на небольшой рычаг, находящийся на стене эксперимен­тального ящика, можно сконструировать рычаг таким образом, чтобы он замыкал электрическую цепь, что позволит предъявлять поднос с пищей и регистрировать реакции. Думается, что такая реакция отличается от реакции поднятия головы тем, что она имеет характерна стику «все или ничего». Но ниже будет видно, что «реак­ция», которая не так произвольна, как реакция поднятия головы, не определяется механическими свойствами движения «нажатия на рычаг».

Нет необходимости иметь совершенное эксперимен­тальное устройство для того, чтобы получить важные количественные данные об оперантном обусловливании. Мы уже можем оценивать много факторов. Важность обратной связи ясна. Организм можно стимулировать последствием его поведения, если имеет место обуслов­ливание. Например, при обучении шевелить ушами необходимо знать, когда уши двигаются, если мы хотим подкреплять двигательные реакции. При переучивании больного пользоваться частично парализованной конеч-ностью можно с помощью специальных приспособлений или другого человека усиливать обратную связь при слабых движениях. Глухонемой научается говорить, только

если он поХучает обратную связь о своем поведении, что можно сравнить со стимуляцией, которую он получает от других говорящих людей. Одной из функций педагога яв­ляется обеспечение произвольных (иногда ложных) по­следствий с целью получения обратной связи. Обуслов­ливание также зависит от вида, количества и момента предъявления подкрепления, а также от многих других факторов.

Отдельное подкрепление может иметь значитель­ный эффект. При благоприятных условиях один какой-нибудь резкий шаг может привести к увеличению частоты появления реакции в дальнейшем. В обычных сучаях такое значительное увеличение наблюдается уже после одного подкрепления, и дальнейший дополнительный прирост величины продолжается по мере предъявления последующих подкреплений. Это наблю­дение ни в коей мере нельзя объяснить мгновенным изменением в сторону максимальной вероятности, по-скольку не выделен оперант в чистом виде. Увеличение частоты можно интерпретировать с точки зрения других поведенческих характеристик ситуации. Тот факт, что обусловливание организма может быть быстрым у животных такого «низкогоуровня развития», как крысы и голуби, приводит к интересным выводам. Разли­чия в том, что обычно называют интеллектом, до некоторой степени объясняются различиями в скорости научения. Но не может существовать более быстрого научения, чем мгновенное увеличение вероятности реакции. Следовательно, специфичность человеческого поведения определяется какими-то другими факто­рами.

Управление (control) оперантным поведением

Экспериментальная процедура оперантного обусловливания не сложна. Создается контингент подкрепления и предъявляется организму в течение определенного периода времени. Затем на основе этого объясняется частота возникновения реакции. Что было сделано в направлении предсказания и управления поведением в будущем? Какие переменные заставля­ют нас предсказывать, будет или не будет реагировать организм? Какими переменными нужно управлять, чтобы заставить организм реагировать? Мы экспери­ментируем с голодным голубем. Это означает, что го­лубь лишался пищи в течение определенного периода времени или.до тех пор, пока он немного не терялв весе. В противоположность тому, что можно было бы ожи­дать, экспериментальные исследования показали, что сила эффекта пищевого подкрепления может не зави­сеть от количества пищи. Но наблюдается, что частота реакций, которая является результатом подкрепления, зависит от степени депривации. Даже если мы научили голубя вытягивать шею, он не будет этого делать, если он не голоден. Таким образом, имеется еще один способ контроля за его поведением: для того чтобы заставить голубя вытягивать шею, необходимо лишить его пищи. Выбранный оперант прибавляется ко всему тому, что будет делать голодный голубь. Контроль за реакцией объединился с контролем за лишением животного пищи. Оперант может также контролироваться с помо- щью внешнего стимула, являющегося еще одной пере-менной величиной, которую можно использовать для предсказания поведения и контроля за ним. Тем не менее следует отметить, что обе эти переменные мож-но вывести из самого оперантного под крепления.

Оперативное угашение

Когда подкрепление больше не поступает, реакция становится все менее и менее частой; этот процесс получил название « оперантного угашения». Если задержать подачу пищи, голубь перестанет поднимать голову. В общем, когда мы выполняем поведение, которое больше «не приносит нам никакой выгоды», мы утрачиваем тенденцию повторять его. Если мы потеряли авторучку, мы все реже и реже направляем руку в кар-ман, в котором она хранилась. Если нам не отвечают на телефонные звонки, то в конце концов мы перестаем звонить. Если пианино расстраивается, то мы все реже и реже на нем играем. Если звук нашего радиоприемника стал слишком громким или передачи стали хуже, мы перестаем его слушать.

Поскольку оперантное угашение протекает гораздо медленнее, чем оперантное обусловливание, постольку наблюдать за ним гораздо проще. При благоприятных условиях получаются плавные кривые, показывающие, что скорость реакций медленно уменьшается, возмож­но, в течение нескольких часов. Кривые раскрывают свойства, которые нельзя получить из наблюдения. У нас «может сложиться впечатление», что организм реаги­рует реже и реже, но за характером изменения можно проследить только при регистрации поведения. Кривые показывают, что угашение есть довольно однородный процесс, который определяет силу поведения.

При определенных условиях на кривую оказывают влияние эмоциональные реакции. Отсутствие подкрепления приводит не только к угашению операнта. Оно вызывает также реакцию фрустрации, или ярости. Го­лубь, который не получил подкрепления, отворачивает-

ся от рычага, воркует, хлопает крыльями и демонстрирует другие виды эмоционального поведения. Человек также демонстрирует подобные реакции. Ребенок, у которого велосипед не двигается с места, когда он нажимает на педали, перестает их крутить. Взрослый, кото­рый находит ящик письменного стола запертым, скоро перестает дергать ручку, но он может колотить по столу и браниться или может проявлять другие признаки гне-ва. Точно так же как ребенок вновь вернется к велосипеду, а взрослый — к ящику стола, птица вновь повер­нется к рычагу, когда эмоциональная реакция угаснет. Могут наблюдаться и другие явления эмоционального характера. В таких условиях кривая угашения характеризуется циклическими колебаниями, поскольку эмоциональные реакции появляются, исчезают и вновь появ-лются. Если каким-либо способом удается устранить эмоцию, кривая принимает более простую форму.

Поведение, которое наблюдается во время угашения, является результатом обусловливания, которое ему предшествовало, и в свете этого кривая угашения дает

еще одну меру эффекта подкрепления. Если было подкреплено всего лишь несколько реакций, угашение происходит быстро. Большое количество подкреплений приводит к длительному сохранению реакции. Силу сопротивления угашению нельзя предсказать по вероятности реакции, наблюдаемой в каждый отдельный момент. Необходимо знать историю подкрепления. Напри­мер, если мы получили подкрепление в виде великолеп­но приготовленной пищи в новом ресторане, невкусно приготовленная пища может «свести на нет» хорошее впечатление от этого ресторана; но если мы питались в ресторане качественной пищей в течение многих лет, то тогда, при прочих равных условиях, нам надо будет не­сколько раз принять невкусную пищу, прежде чем мы утратим склонность постоянно питаться в нем.

Между количеством подкрепленных реакций и количеством реакций, возникающих при угашении, нет простых связей. Сила сопротивления угашению в ре­жиме прерывистого подкрепления может быть гораздо больше силы сопротивления угашению в случае, когда то же количество подкреплений дается за каждую реакцию. Таким образом, если мы только один раз слу­чайно подкрепим ребенка за хорошее поведение, то оно при отсутствии подкрепления будет сохраняться доль­ше, чем в том случае, когда мы подкрепляем каждое правильное выполнение.

Этот вывод имеет практическую значимость в тех случаях, когда ценные виды подкреплений ограниче­ны. Подобного рода проблемы возникают в области образования, промышленности, экономики и пр. В ус­ловиях некоторых режимов прерывистого подкрепле­ния голубь может произвести 10 000 поведенческих реакций, прежде чем полностью завершится процесс угашения.

Угашение является эффективным способом устра­нения операнта из организма. Его не следует путать с другими процедурами, созданными для получения того же эффекта. В настоящее время предпочтение отдается наказанию, которое включаете себя различные процессы, и эффективность которого вызывает сомнения. С угаше-нием часто путают забывание. При забывании эффект обусловливания утрачивается просто по мере прохожде-ния определенного времени, в то время как угашение требует, чтобы реакция возобновлялась без подкрепле-ния. Обычно забывание наступает не быстро; большие кривые угашения были получены через шесть лет после того, как реакции голубей были подкреплены последний раз. Шесть лет составляют больше половины жизни голубей. В этот период времени голуби жили в таких условия х, в которых реакция не могла быть подкреплена. В по­ведении человека реакции научения, порожденные относительно определенными условиями, часто сохраняют-ся без использования на протяжении половины жизни человека. Утверждение, что ранний опыт определяет личность зрелого организма, предполагает, что эффект

оперантного обусловливания долгосрочен. Таким обра-зом, если из-за раннего опыта, полученного в детстве, мужчина женится на женщине, которая напоминает его мать, то это говорит о том, что эффект определенных подкреплений должен сохраняться долгое время. Большинство случаев забывания включают в себя оперантное по-ведение при контроле определенных стимулов, и их нельзя подвергнуть адекватному анализу до обсуждения проблемы контроля.

Эффект угашения. Условия процесса протекания угашения более или менее известны, однако сущность его часто понимают неправильно. Экстремальное уга­шение иногда называют «abulia». Определение этого

феномена как «отсутствие воли» мало что дает, поскольку отсутствие или наличие воли выводится из, наличия или отсутствия поведения. Однако термин представляет-

ся полезным, поскольку он предполагает, что поведение отсутствует по определенной причине, и мы можем про­вести то же самое различение другим способом. Пове­дение является сильным или слабым из-за действия многих различных переменных, и задача науки о пове­дении заключается в том, чтобы их выявлять и классифицировать. Каждый случай мы определяем в терминах переменных величин. Условия, которые возникают в результате длительного угашения, по лежащим на по­верхности признакам напоминают инактивность, возникающую в результате действия других причин. Разли­чия этих случаев надо искать в истории организма.

Целеустремленный писатель, отправляющий издателям одну рукопись за другой, когда все они были отвергнуты, может в конце концов заявить, что «он не может больше написать ни одного слова». Частично он парализован тем, что его «зажимают», но все-таки он продолжает настаивать на том, что он «хочет писать», и мы можем согласиться с ним и квалифицируем это так: чрезвычайно низкая вероятность реакции определяется угашением.

Однако другие переменные все еще сохраняют свое действие и если бы угашение не произошло, они бы дали высокую вероятность достижения.

Необходимо обратиться к условиям, при которых небольшая сила операнта является результатом угаше-ния. Некоторые формы психотерапии являются система­ми подкрепления, созданными для восстановления пове­дения, которое было утрачено в процессе угашения. Терапевт может сам давать подкрепление или он органи­зует такие условия жизни, которые будут подкреплять поведение. В терапии профессионального продвижения, например, терапевты способствуют тому, чтобы паци­ент начал осуществлять простые формы поведения, мгновенно и сравнительно постоянно подкрепляемые. Объяснения, что такая терапия помогает пациенту пото­му, что дает ему чувство «достижения» или «укрепляет его нравственную сферу», «формирует его интересы» или предотвращает его от «разочарования», не дают никаких преимуществ. Такая терминология просто увеличивает объем объяснительных фикций. Человек, который действительно вовлечен в данный вид активно­сти, проявляет не интерес, а демонстрирует эффект подкрепления. Мы не даем человеку «чувство достиже­ния», а подкрепляем определенное его действие. Разо­чароваться — просто означает утратить возможность реагировать из-за отсутствия подкрепления. Наша про­блема состоит лишь в том, чтобы объяснить вероятность реакции в терминах процесса подкрепления и угашения.

Какие события являются подкрепляющими?

Имея дело с людьми в жизни, клинике и лаборато­рии, мы должны знать, каков подкрепляющий эффект какого-либо специфического события. Мы часто заме­чаем, насколько наше собственное поведение подкреп­ляется одним и тем же событием. Нередко подобного рода практика уводит нас в сторону; тем не менее суще­ствует общепринятое мнение, что подкрепления можно определять в отрыве от рассмотрения их воздействий на определенный организм. Однако в соответствии с на­шим использованием этого термина единственной оп­ределяющей характеристикой-подкрепляющего стиму­ла является то, что он подкрепляет.

Для того чтобы сказать, подкрепляет ли в определеных условиях, необходимо провести прямое испытание. Мы наблюдаем за частотой выбранной реакции, затем дела­ем событие зависимым от нее и следим за изменениями, происходящими в его частоте. Если изменения имеют место, то тогда мы рассматриваем данное событие как подкрепляющее организм в данных условиях. В классифицировании событий на основе их эффектов нет ниче­го тавтологичного; используемый критерий является как эмпирическим, так и объективным. Однако он стал бы тавтологичным, если затем мы стали бы утверждать, что данное событие усиливает оперант, потому что оно под­крепляет. Мы достигаем определенных успехов, когда нам удается угадать подкрепляющее событие только в результате «грубого» наблюдения. Так как мы испытали подкрепляющий эффект стимула на себе, мы допуска­ем, что он будет оказывать то же воздействие и на дру­гих. Мы достигаем успеха только тогда, когда рассмат­риваем себя как организм, подвергаемый изучению, и корректно наблюдаем за собственным поведением.

Можно выделить два типа событий, обладающих эффектом подкрепления. Некоторые подкрепления представляют собой предъявление стимулов или добавление чего-то, например воды, еды или возможности сексуального контакта в ситуацию. Они называются

положительными подкреплениями. Другой тип подкрепляемых событий состоит в устранении чего-либо, напри-мер сильного шума, яркого света, холода, жары или

электрического шока из ситуации. Это — отрицательное подкрепление. В обоих случаях сохраняется один и тот же эффект подкрепления — вероятность реакции повы­шается. Мы не можем обойтись без этого различения, просто указав на то, что в негативной ситуации подкрепляет отсутствие яркого света, сильного шума и т. д., поскольку воздействие оказывает именно отсутствие чего-либо после его презентации, и это еще один способ выражения того, что стимул устранен. Различия между двумя случаями станут яснее, когда мы рассмотрим случаи с презентацией негативного подкрепления, или случаи с устранением позитивного подкрепления. Их последствия мы называем наказанием. В условиях практического применения оперантно-го обусловливания часто бывает необходимо наблюдать за событиями, оказывающими подкрепляющее воздействие на данного индивида. В любой области, важной характеристикой которой является поведение, — обра­зовании, управлении, семье, здравоохранении, про­мышленности, искусстве, литературе и т. д. — мы по­стоянно изменяем вероятности реакции с помощью их подкрепления. Промышленник, который хочет, чтобы его рабочие работали постоянно и без прогулов, дол­жен заботиться о соответствующем подкреплении их поведения, и не только с помощью заработной платы, но также и с помощью подходящих условий работы. Девушка, которая хочет еще раз встретиться с молодым человеком, должна быть уверена, что поведение ее друга, связанное с назначением свидания и желанием сдержать свое слово, получило адекватное подкрепле­ние. Для того чтобы обучить ребенка читать или петь, или играть на музыкальном инструменте, необходимо разработать программу педагогических подкреплений, в соответствии с которой правильные реакции должны постоянно «оцениваться». Если пациенту необходимо еще раз обратиться к врачу за консультацией, то пос­ледний должен быть уверен в том, что данное поведе­ние пациента получило соответствующее подкрепле­ние. Мы оцениваем силу подкрепляющих событий, когда пытаемся установить, что «человек выбирает в жизни». Какие следствия определяют репертуар его поведения и относительную частоту реакций, входящих в него ? Кое-что об этом говорят нам реакции на различ­ные темы, обсуждаемые в разговоре, но его обычное поведение является еще лучшим ориентиром. Мы де­лаем вывод о значимых видах подкрепления на основа­нии проявления им интересов к какому-то писателю, освещающему определенные проблемы, к магазинам или музеям, в которых представлены определенные предметы, к друзьям, проявляющим определенные виды поведения, к ресторанам, в которых подают опре­деленную пищу и т. д. «Интерес» соответствует вероят­ности, являющейся результатом, по крайней мере час­тично, последствий поведения «проявления интереса». Мы можем быть почти уверены в значимости подкреп­ления, если наблюдаем за тем, как начинается и проте­кает поведение по мере чередующегося предъявления и удержания подкрепления, так как тогда изменение вероятности, очевидно, будет в меньшей степени определяться случайным изменением какого-то другого вида. Поведение, которое ассоциируется с дружбой с каким-либо человеком, изменяется, поскольку этот че­ловек изменяет поставляемые им подкрепления.

Если мы пронаблюдаем за подобными изменения-м и, то сможем составить вполне определенное мнение о том, «что означает эта дружба» или «что наш испыту­емый видит в своем друге».

Данная процедура наблюдения может быть усовер-шенствована с целью ее применения в клинических и лабораторных исследованиях. Можно составить набор картинок, предоставив испытуемому возможность про­смотреть их и при этом записав время разглядывания каждой из них. Поведение «разглядывания картинки» подкрепляется тем, что видится в ней. Рассматривание одной картинки может иметь больший эффект подкреп­ления, чем рассматривание другой картинки и, время, затрачиваемое на рассматривание картинок, также будет варьировать. Эта информация может быть при­менена в тех случаях, когда возникает необходимость по какой-либо причине подкрепить или устранить по-веденческие-реакции нашего испытуемого.

Литературу, живопись и эстраду можно рассматри-ватъ как хорошо продуманные подкрепления. Так или иначе приобретение книг, билетов на представления и выставки произведений искусства зависит от того, яв-ляются ли эти книги, пьесы, концерты или картины подкреплениями. Часто художник ограничивает себя поисками того, что является подкреплением для него» самого. Когда он действует таким образом, в его работе "отражается его собственная индивидуальность», и тогда только случайно (как мера универсальности) его книга или пьеса или музыка, или картина оказывают подкрепляющее воздействие на других. Поскольку ком-мерческий успех имеет большое значение, постольку с его помощью можно непосредственно изучать поведе­ние других людей.

Для выяснения того, что является подкреплением для данного человека, мы не можем ограничиться простым вопросом к нему о том, что его подкрепляет. Его ответ может представлять определенную ценность, но его ни в коем случае нельзя считать надежным. Подкрепляющие связи не всегда очевидны для человека.

Часто только в ретроспективе тенденции человека ве­сти себя определенным образом рассматриваются как результат определенных последствий, и отношения могут совсем не репрезентироваться субъекту, даже если они очевидны для других людей.

Конечно, существуют большие различия между инди­видами в отношении событий, которые имеют силу под­крепления. Различия между видами настолько велики, что едва ли они могут представлять интерес; очевидно, что-то, что подкрепляет лошадь, необязательно подкрепляет собаку или человека. Среди представителей вида боль­шие различия могут объясняться не столько наследствен­ностью, но и историей жизни индивида, обстоятельства которой могут быть прослежены. Тот факт, что организм наследует способность получать подкрепления в виде определенных событий, не может использоваться для предсказания неиспытанного, стимула. Также и отноше­ния между подкрепляющим событием и депривацией или любым другим условием организима не наделяют под­крепляющее событие никакими определенными физичес­кими качествами. Особенно невероятно, чтобы событие, которое приобрело силу подкрепления, выделилось бы каким-то определенным образом. Тем не менее такие события являются важными видами подкрепления.

Условные подкрепления

Презентируемый при оперантном подкреплении стимул может быть соединен с другим стимулом, представленным в респондентном обусловливании. В гл. 4 мы рассмотрели условия приобретения способ­ности вызывать реакцию; здесь остановимся на фено­мене подкрепления. Хотя подкрепление имеет другую стимульную функцию, процесс, возникающий при со­четании стимулов, представляется таким же. Если Го­лодному животному часто предъявлять пищу на под­носе, то пустой поднос вызывает выделение слюны. В определенной степени пустой поднос также будет подкреплять оперант.

Можно еще проще продемонстрировать условное подкрепление на примере стимулов, которые легче контролировать. Если каждый раз, давая пищу голодному голубю, мы будем включать свет, то свет постепенно станет условным подкреплением. Он может использо-

ваться для обусловливания операнта так же, как исполь­зуется пища. Нам уже кое-что известно о том, как свет приобретает это свойство: чем чаще свет сочетается с пищей, тем большую силу как подкрепление он приоб­ретает; нельзя предъявлять пищу вслед за светом через большие промежутки времени; сила подкрепления бы­стро утрачивается, когда пища не предъявляется. Все это вытекает из наших знаний о стимульном обусловлива­нии. Условные подкрепления часто являются продуктом естественных контингентов. Обычно пища или вода получаются только после того, как организм выполнил «предшествующее» поведение — после того, как он воз­действовал на среду, чтобы создать возможность для того, чтобы поесть и попить. Поэтому стимулы, порожденные этим «предшествующим» поведением, становятся под­креплениями. Таким образом, прежде чем мы сможем успешно перенести пищу с тарелки к себе в рот, необ­ходимо приблизиться к тарелке, и любое поведение, которое приближает нас ктарелке, автоматически под­крепляется. Следовательно, поддерживается сила «пред­шествующего» поведения. Это имеет большое значение, поскольку только незначительная часть поведения сра­зу подкрепляется пищей, водой, сексуальным контактом или другими событиями биологической важности. Хотя характерной особенностью человеческого поведения яв­ляется то, что важные подкрепления могут быть эффек­тивными при отсрочке на большие промежутки времени, это объясняется, по-видимому, тем, что промежуточные события становятся условными подкреплениями. Когда человек в октябре укрепляет на окнах своего дома вто­рые рамы, потому что в результате аналогичного пове­дения в октябре прошлого года в январе в доме было тепло, нам необходимо определить, как заполняется промежуток между поведением в октябре и его эффек­том в январе. Среди условных подкреплений, ответст-венных за силу этого поведения, есть определенные вер­бальные последствия, исходящие от самого человека или его соседей. Иногда бывает важно оставить ряд событий между действием и конечным важным подкреплением для того, чтобы осуществлять контроль за поведением в практических целях. В сфере образования, про­мышленности, психотерапии и др. мы сталкиваемся с различными методиками, разработанными для создания соответствующих условных подкреплений. Обеспечение непосредственных эффективных последствий тогда, когда конечные последствия отсрочены, должно «улуч-шатьмораль», «усиливать интерес», «предотвращать по­явление чувства неуверенности» или корректировать условия низкой оперантной силы, которые мы называем «abulia», и т. д. Конкретизируя это положение, можно сказать, что оно побуждает студентов учиться, лиц, на­нятых на работу, приходить в учреждения, больных при­нимать посильное участие в общественной жизни и т. д.

Обобщенные (generalized) подкрепления. Услов­ное подкрепление обобщается (is generalized), когда оно сочетается более чем с одним первичным подкрепле­нием. Генерализованное подкрепление оказывается по­лезным потому, что состояние организма в данный момент необязательно является значимым. Оперантная сила, генерализованная посредством только одного подкрепления, наблюдается при создании соответству­ющего условия депривации: когда мы подкрепляем пищей, мы получаем возможность управлять голодным животным. Но если условное подкрепление сочетается с подкреплениями, соответствующими многим услови­ям, тогда по крайней мере одно из них, соответствую­щее состоянию депривации, должно будет оказать вли­яние на последующую ситуацию. Поэтому реакция должна будет произойти. Например, когда мы подкреп­ляем деньгами, организуемое нами управление отно­сительно независимо от кратковременных депривации. Создается один вид обобщенного подкрепления, пото­му что многие первичные подкрепления получаются только после предъявленных преобразований физичес­кой среды.

В различных ситуациях одна форма «предшествую­щего» поведения может вести за собой различные виды подкреплений. Непосредственная стимуляция на осно­ве такого поведения становится обобщенным подкреп­лением. Мы автоматически получаем подкрепление, не­зависимо от любой определенной депривации, когда мы успешно осуществляем контроль за физическим миром. Этим объясняется наша тенденция увлекаться профес­сиональным мастерством, художественным творче­ством и такими видами спорта, как игра в кегли, билли­ард и теннис.

Однако возможны ситуации, при которых некото­рые эффекты подкрепления «сенсорной обратной свя­зи» не обусловливаются. Оказывается, что ребенок подкрепляется стимуляцией, идущей из среды, за кото­рой не следует первичное подкрепление, например действие детской погремушки. Способность получать подкрепление таким образом могла возникнуть в эво­люционном процессе, и она, возможно, аналогична подкреплению, которое мы получаем, просто «органи­зуя мир соответствующим образом». Любой организм, который подкрепляется успешным взаимодействием со средой, несмотря на последствия в-каждый момент, окажется в более благоприятных условиях, когда пос­ледуют значимые последствия.

Когда поведение подкрепляется другими людьми, появляется несколько важных генерализованных под­креплений, например внимание. Всем известны случаи, когда ребенок плохо ведет себя «только для того, чтобы привлечь к себе внимание». Внимание людей подкреп­ляет, потому что оно является необходимым условием других подкреплений, исходящих от них. Вообще, только те люди, которые внимательны к нам, подкрепляют наше поведение. Внимание со стороны людей, которые преж­де всего обычно являются источниками подкрепления — родителей, учителя или любимого человека, — служит особенно хорошим обобщенным подкреплением и фор­мирует особенно сильное поведение «получения внима­ния». Специфичность многих вербальных реакций со­стоит в том, что они привлекают .внимание, например «смотри», «пойми», а также произнесение имени чело-века. Другими характерными формами поведения, кото-рые можно назвать сильными, потому что они требуют внимания, являются симуляция болезни, раздражен-ность и броскость (самореклама).

Часто внимания бывает недостаточно. Другой чело-век может подкрепить только ту часть поведения данного человека, которое он одобряет, и, следователь-но, любой признак его одобрения по праву становится подкрепляющим. Поведение, которое вызывает улыб­ку, или вербальную реакцию «Правильно», «Хорошо», или любую другую похвалу, подкрепляет. Мы пользу­емся этим обобщенным подкреплением для формиро-вания поведения других людей, особенно в сфере образования. Например, мы обучаем детей и взрослых говорить правильно, произнося «Правильно», когда они дают правильную поведенческую реакцию.

Еще более сильным генерализованным подкрепле­нием является аффектация. Она может быть прежде всего связана с сексуальным контактом как первичным подкреплением, но когда тот, кто вызывает аффекта­цию, также вводит другие виды подкрепления, эффект генерализуется.

Трудно дать определение внимания, одобрения и аффекта и также трудно наблюдать за ними и измерять их. Они являются не вещами, а аспектами поведения других. Их неуловимые физические параметры пред­ставляют трудность не только для ученого, который дол­жен изучать их, но также и для индивида, которого они подкрепляют. Если мы не можем легко обнаруживать, что человек обращает внимание на нас, одобряет наше пове­дение или что мы привлекательны для него, тогда наше поведение не будет последовательно подкрепляться. Поэтому оно может оказаться слабым, может иметь тен­денцию протекать в несоответствующее время и т. д. Мы не знаем, что делать для того, чтобы «привлечь к себе внимание», «вызвать любовь», или «когда это делать». Ребенок, борясь за внимание, влюбленный — за проявле­ния любви, художник — за одобрение его произведений, демонстрируют стойкое поведение, которое является только результатом прерывистого подкрепления.

Другим генерализованным подкреплением являет­ся подчиненность других людей. Когда человек бывает вынужден давать различные подкрепления, то любое указание на его подчиненность становится подкрепле­нием. Задиристого человека всегда подкрепляют при­знаки трусости, а представителей правящего класса — признаки уважения. Престиж и уважение являются генерализованными подкреплениями только постоль­ку, поскольку они гарантируют, что другие люди будут действовать определенным образом. То, что наличие своего собственного образа действия подкрепляет, можно показать на примере поведения тех людей, ко­торые управляют ради того, чтобы управлять. Физичес­кие признаки покорности обычно не бывают столь не­уловимыми, как свойства внимания, одобрения и любви. Задиристый человек может настаивать на проявлении четких признаков признания его доминирования, а ри­туальные обычаи могут подчеркивать уважение.

Источники обобщенных подкреплений легко забы­ваются, и они рассматриваются как подкрепления имеющие якобы самостоятельную силу. Мы говорим о потребности во внимании, одобрении или аффекте, о «потребности в доминировании» и «любви к деньгам», как будто бы они являются первичными условиями депривации. Но способность к подкреплению с помо­щью подобных средств едва ли может развиться за короткий промежуток времени, в течение которого преобладают необходимые условия. Внимание, аффект, одобрение и подчинение, по-видимому, существовали в человеческом обществе только короткий промежуток времени в процессе эволюции. Более того, они не пред­ставляют собой-фиксированные формы стимуляции, поскольку зависят от особенностей склада определен­ных групп. Поскольку аффектация главным образом связана с сексуальной сферой, постольку она может быть связана с условием первичной депривации, кото­рая в определенной мере независима от истории жиз­ни человека, но признаки «удовольствия», которые приобретают силу подкрепления- благодаря их связи с сексуальным контактом или с другими-подкрепления­ми, едва ли могут обладать эффектом подкрепления по генетическим причинам. Символы появились еще по­зднее, и редко высказывается мнение, что потребность в них врождена. Обычно мы можем наблюдать за про­цессом, в котором ребенок начинает получать подкреп­ление в форме денег. Однако часто «любовь к деньгам» кажется независимой от «потребности в одобрении», но если мы более детально рассмотрим эффективность этих генерализованных подкреплений, у нас окажется столько же оснований для признания врожденной по­требности к деньгам, как и для признания врожденной потребности во внимании, удовольствии или домини­ровании.

Обычно генерализованные подкрепления оказывают­ся эффективными, даже если первичные подкрепле­ния, на которых они основываются, больше их не сопровождают. Мы играем в игры, требующие опреде­ленных навыков ради них самих. Аффекты не всегда вызываются сексуальным подкреплением. Подчиненность других людей подкрепляет, даже если мы не используем ее. Эффект подкрепления деньгами жад­ного человека может оказаться настолько сильным, что он может обречь себя на голод, чтобы не лишиться их. Эти факты, поддающиеся наблюдению, должны занять надлежащее место при построении террий и изучении практики. Они не означают, что обобщенные подкреп­ления представляют собой нечто большее, чем физичес­кие свойства стимулов, наблюдаемые в каждом случае, или что существуют какие-то нефизические данности, которые необходимо принимать во внимание.

Почему подкрепление подкрепляет?

Закон эффекта не является теорией. Это просто правило, объясняющее усиление поведения. Когда мы подкрепляем реакцию и наблюдаем за. изменениями ее частоты, можно легко описать то, что произошло, в объек­тивных терминах. Но при объяснении того, почему это произошло, необходимо обратиться к теории. Почему подкрепление подкрепляет? Одна из теорий утвержда­ет, что организм повторяет реакцию, потому что он на­ходит, что его следствия «приятны» или «приносят удовлетворение». Но в каком смысле это является объяс­нением для естественной науки? Такие характеристи­ки, как «приятный» или «приносящий удовлетворение», вероятно, не относятся к физическим свойствам того, что подкрепляет, поскольку физическая наука не использу­ет ни эти термины, ни какие-либо другие их эквивален­ты. Термины должны характеризовать определенное воздействие на организм, но можно ли его определить таким образом, чтобы оно было пригодным для объясне­ния подкрепления?

Иногда полагают, что вещь является приятной, если индивид стремится к ней или сохраняет ее, и она считается неприятной, если индивид избегает или от­вергает ее. Сделано много попыток найти объектив­ное определение, но все они уязвимы для критики: оп­ределяемое поведение может быть просто еще одним продуктом эффекта подкрепления. Утверждение, что стимул приятен, потому что организм стремится при­близиться к нему или удержать его, может быть еще одним способом выражения того, что стимул подкре- пил поведение «приближения» или «удержания». Вместо того чтобы определять эффект подкрепления с точ­ки зрения его воздействия на поведение в общем, мы просто определили известный нам вид поведения, ко­торый почти с неизбежностью подкреплялся и, следо­вательно, в общем является пригодным в качестве индикатора силы подкрепления. Если продолжать ут­верждать, что стимул подкрепляет потому, что он при­ятен, тогда то, что выдвигается как объяснение, вклю­чающее два эффекта, в действительности является излишним описанием одного из них.

Альтернативный подход к описанию характерис­тик «приятный» и «неприятный» (или «приносящий удовлетворение» и «раздражающий») заключается в том, что испытуемого спрашивают, что он ощущает, когда имеет дело с определенными событиями. Это предполагает, что подкрепление имеет два эффекта: усиливает поведение и порождает «чувства» и что одно является функцией другого. Но функциональные отно­шения можно рассмотреть и в другой плоскости. Когда человек сообщает, что событие приятно, он может про­сто иметь в виду, что это такое событие, которое под­крепляет его или по отношению к которому он обнару­живает в себе тенденцию стремиться, двигаться, так как оно подкрепляет такое движение. Далее мы увидим, что человек мог бы и не приобретать вербальные реак­ции, указывающие на его ощущение удовольствия, если бы подобный феномен не имел бы места. В любом слу­чае сам испытуемый не получает преимуществ, фикси­руя таким образом свои наблюдения. Субъективные суждения об удовольствии или удовлетворении, порож­даемые стимулами, как правило, ненадежны и неустой­чивы. Как подчеркивается в теории бессознательного, мы не можем давать самоотчет о всех событиях, кото-рые проявляют себя как подкрепляющие нас, или мы можем сообщить о том, что вступает в прямое противо­речие с объективными наблюдениями; также мы можем назвать неприятным событие, которое в действитель­ности подкрепляет. Примеры такой аномалии варьи­руют от мазохизма до мученичества.

Иногда утверждают, что подкрепление оказываете эффективным потому, что оно редуцирует состояние депривации. В данном случае имеет место по крайней мере побочный эффект, который не следует путать с самим подкреплением. Очевидно, что депривация име­ет большое значение для оперантного обусловливания. В наших экспериментах мы имеем дело с голодным го­лубем и по-другому не можем продемонстрировать оперантное обусловливание. Чем голоднее птица, тем чаще она реагирует в результате подкрепления. Но, несмотря на эту связь, неправильно было бы считать, что подкрепление всегда редуцирует депривацию. Обусловливание может наступать прежде любого зна­чительного изменения в депривации, измеряемой дру­гими способами.

Связь между насыщением и подкреплением следу­ет искать в процессе эволюции. Едва ли можно оста­вить без внимания тот факт, что первичные подкрепле­ния играют огромную биологическую роль. Пища, вода, сексуальный контакт и избегание боли явно связаны с благополучием организма. Индивид, который подкреп­ляется такими событиями, приобретает в высшей степе­ни эффективное поведение. Также биологически значи­мым является то обстоятельство, согласно которому поведение, порождаемое определенным подкреплени­ем, с большей вероятностью появляется в состоянии депривации. Таким образом, важным является не толь­ко то, что любое поведение, которое приводит к приему пищи, должно стать важной частью поведенческого репертуара, но и то, что это поведение оказывается особенно сильным, когда организм голоден. Эти две особенности организма, по-видимому, определяют то, что организм может подкрепляться специфическими способами и что результат будет наблюдаться в реле­вантных условиях депривации.

Некоторые формы стимуляции получают положи­тельное подкрепление, хотя они не вызывают поведения, имеющего биологическое значение. Ребенок подкрепля­ется не только пищей, но и звоном колокольчика или блес­ком яркого предмета. Поведение, которое постоянно сле­дует за этими стимулами, характеризуется увеличением вероятности. Трудно, а может быть и невозможно про­следить эти эффекты подкрепления в истории обус­ловливания. Позднее мы можем обнаружить, что того же самого индивида подкрепляют звучание оркестра или красочный спектакль. В данном случае еще труднее убе- диться в том, что эффект подкрепления не обусловлен.

Однако можно утверждать, что способность получить подкрепление из среды с помощью любой обратной свя­зи была бы биологическим достижением, поскольку она готовила бы организм к успешному управлению средой, прежде чем сформируется данное состояние депривации. Когда организм порождает тактильную обратную связь, например, ощущение текстуры материала или поверхно­сти скульптуры, обусловливание обычно рассматривает­ся как результат сексуального подкрепления даже тогда, когда стимулируемая область по функции не является первично-сексуальной. В этой связи хотелось бы предпо­ложить, что другие формы стимуляции, продуцирован­ные поведением, точно так же связаны с биологически значимыми событиями.

Когда среда изменяется, тогда способность полу­чать подкрепление данным событием с биологической точки зрения может рассматриваться как недостаток. Сахар является очень обильным подкреплением для большинства представителей человеческого рода, о чем свидетельствует огромное количество прилавков для продажи сладостей. В этом отношении его эффект го­раздо превосходит биологическую потребность в нем в наши дни.

Этого не было до того, как сахар стал выращивать­ся и производиться в большом количестве. Несколько сот лет тому назад сильный подкрепляющий эффект сахара, вероятно, был оправдан. Среда изменилась, но генетические возможности организма остались на пре-жнем уровне. Секс является еще одним примером. В на­стоящее время сильный эффект сексуального контак­та не является преимуществом организма, но нам нет необходимости возвращаться на много лет назад, для того чтобы обнаружить условия голода и эпидемий, при которых сила сексуального подкрепления была оправ­дана. Объяснение силы подкрепления биологией орга-низма можно продолжать до тех пор, пока мы будем говорить о том, почему то или иное событие подкрепля-ет. Для функционального анализа такое объяснение, вероятно, ничего не даст, так как оно не дает никаких способов идентификации подкрепляющих стимулов, прежде чем мы не испытаем его подкрепляющего воз­действия на организм. Следовательно, мы должны до­вольствоваться объяснением с точки зрения воздействий стимулов на поведение.

Непредвиденные обстоятельства и «суеверное» поведение

Утверждалось, что эксперименты Торндайка нети­пичны для процесса научения, поскольку кошка не может «видеть связей» между движением задвижки и «выходом из ящика». Но в оперантном обусловливании фиксирование связей не является существенным мо­ментом. Как во время, так и после обусловливания че­ловек часто рассказывает о связи своего поведения с окружающей его средой. Его отчет может оказаться пригодным для научного объяснения, и его реакция на его собственное поведение может даже оказаться важ­ным связующим звеном в определенных сложных про­цессах. Но в простых процессах оперантного обуслов­ливания такие отчеты или реакции не требуются. Это объясняется тем, что человек может оказаться неспо­собным описать контингенты подкрепления, которые имели явно выраженный эффект.

Также отсутствует необходимость в каких-либо пер­манентных связях между реакцией и ее подкреплением.

Мы делаем прием пищи зависимым от реакции голубя, организуя механические и электрические свя­зи. За пределами лаборатории ситуации, в которых возникают связи между поведением и его следствием, определяются различными физическими системами. Но это никак не влияет на организм, и в этом никакой необходимости нет. Что касается самого организма, то единственно важное свойство контингента подкрепле­ния — в его временном характере. Подкрепление сле­дует за реакцией. Каким образом это происходит, зна­чения не имеет.

Мы должны допустить, что презентация подкрепле­ния всегда что-то подкрепляет, поскольку она неизбежно совпадает с каким-либо поведением. Мы знаем, что уже одно подкрепление может иметь значительный эффект. Если устанавливается только случайная связь между реакцией и появлением стимула, поведение называется «суеверным». Мы можем показать это на примере с го­лубем, аккумулируя эффект нескольких случайных обсто­ятельств. Предположим, что мы будем давать голубю небольшое количество еды каждые пятнадцать секунд, независимо от того, что он делает. Когда пища предъяв-

ляется первый раз, он выполняет какие-то поведенческие реакции — если только он не будет стоять спокойно — и произойдет обусловливание. Тогда более вероятно, что при предъявлении пищи снова будет наблюдаться то же са­мое поведение. Если это произойдет, то оперант будет еще более усилен. Если этого не произойдет, то будетусилено какое-то другое поведение. Обычно данное поведение достигает частоты, с которой оно подкрепляется. В даль­нейшем оно становится постоянной частью репертуара птицы, даже если пища предъявлялась в такое время, которое не связано с поведением птицы. Видимые реак­ции, которые были установлены таким образом, включа­ют резкие наклоны головы, переступание с ноги на ногу, наклоны и шарканье ногами, повороты вокруг своей оси, неестественную по-. ходку и наклоны головы. В дальней­шем топография поведения может сместиться на другие подкрепления, поскольку легкие изменения в форме ре­акции могут совпадать с приемом пищи.

При продуцировании «суеверного» поведения важ­ное значение имеют интервалы, через которые подается пища. За шестьдесят секунд эффект подкрепления утра­чивается в значительной мере, прежде чем появляется другой, и вероятность появления другого поведение больше. Следовательно, вероятность появления «суевер­ного» поведения меньше, хотя оно может иметь место, если эксперимент выполняется на протяжении длитель­ного времени. Через пятнадцать секунд обычно эффект бывает почти, мгновенным. Когда «суеверная» реакция устанавливается, она будет сохраняться, даже если она будет подкрепляться изредка.

Голубь не является исключением. Поведение людей также во многом «суеверно». Только небольшая часть поведения, усиливаемая непредвиденными обстоятельст­вами, становится ритуалом, который мы называем «суе­верием», однако сам принцип сохраняется в силе. Пред­положим, что, прогуливаясь по парку, вы находите десять долларов (и предположим, что это событие имеет для вас значительный подкрепляющий эффект). То, что мы дела­ли в момент, когда мы нашли деньги, подкрепляется. Конечно, трудно привести строгие доказательства, но весьма вероятно, что мы вновь пойдем на прогулку имен­но в тот же парк или в парк, похожий на этот, и более нероятно, что мы будем смотреть именно на то место, где были найдены деньги, и т. д. Это поведение будет варьи­роваться в зависимости от состояния депривации, кото­рому релевантны деньги. Его не следует называть «суе­верным», но оно порождается ситуацией, которая редко оказывается «функциональной».

Некоторые ситуации, которые продуцируют «су­еверное» поведение, не являются абсолютно случай­ными. Иногда за реакцией следует следствие, которое тем не менее ее не «продуцирует». Это можно лучше всего показать на примерах с таким типом стимула, который подкрепляет после его устранения. Прекра­щение кратковременной стимуляции такого вида мо­жет подкреплять поведение, порождаемое его нача­лом. Когда появляется неприятный стимул, организм приходит в состояние активности; стимул прекращает свое действие, и это подкрепляет определенную часть поведения. Определенные заболевания, хромота, ал­лергия таковы, что любые меры, лредпринятые для того, чтобы вылечить их, вероятно, будут подкреплять, когда состояние улучшится. Необязательно, чтобы данная мера была актуально связана с лечением. Ри­туалы, используемые в ненаучной, народной медици­не, вероятно, можно объяснить с точки зрения этой характеристики многих форм заболеваний.

В «суеверном» оперантном поведении, как и в ус­ловных «суеверных» рефлексах, процесс обусловлива­ния терпит неудачу. Обусловливание дает организму большие преимущества, вооружая его средствами по­ведения, которое позволяет ему действовать в новых условиях, однако не существует способов предотвра­щения усвоения неэффективных приемов случайного поведения. Любопытно, что эта трудность, вероятно, возрастала по мере развития обусловливания в процес­се эволюции. Если, например, для изменения вероят­ности реакции всегда требовалось три подкрепления, «суеверное» поведение было бы невероятным. Только потому что организм достиг такого уровня, на котором уже один контингент приносит значительные измене­ния поведения, они могут совпадать.

В человеческом обществе «суеверные» ритуалы включают в себя вербальные формулы и передаются как часть культуры. В этом смысле они отличаются от простого эффекта оперантного подкрепления. Но, вероятно, их источником является один и тот же процесс, и их, должно быть, поддерживают случайные условия, которые имеют такой же паттерн.

Цели, намерения и другие конечные причины поведения

Неправильно говорить, что оперантное подкреп­ление «усиливает» реакцию, которая предшествует ему. Реакция уже произошла и не может измениться. Изменению подвергается будущая вероятность реак­ции одного и того же класса. Именно оперант как класс поведения, а не реакция как определенный случай под­вергается обусловливанию. Следовательно, отсутству­ют нарушения фундаментальных принципов науки, которые исключают «конечные причины». Но этот принцип нарушается, когда начинают утверждать, что поведение находится под контролем «мотивов» или «целей», которых организм еще не достиг, Или «наме­рений», которых он . еще не выполнил. Утверждения, В которых используются такие слова, как «мотив», или «цель», обычно сводятся к утверждениям об оперант-ном обусловливании, и необходимо внести лишь не­большое изменение, для того чтобы ввести их в русло естественной науки. Вместо того чтобы говорить, что человек ведет себя соответствующим образом потому, что есть следствия, которые должны следовать за его поведением, мы просто говорим, что он ведет себя так потому, что имеются следствия, которые следовали за похожим поведением в прошлом. Это, конечно, закон эффекта, или оперантное обусловливание.

Иногда утверждают, что данную реакцию нельзя полностью описать до тех пор, пока не будут рассмот­рены ее цели как ее «текущее» свойство. Но что имеет­ся в виду под словом «описать»? Если мы пронаблюдаем за человеком, идущим по улице, мы сможем описать это событие на языке физической науки. Если затем мы добавим, что его цель состояла в том, чтобы опустить письмо, дополнит ли это то, что было выражено в пер­вом высказывании? Вероятно, ответ будет положитель­ным, так как человек может идти по улице «по многим причинам» и в каждом случае физический способ пере­движения останется одним и тем же. Однако различи­тельную грань необходимо проводить не по линии пове

дения, а по линии переменных величин, от которых по­ведение зависит функционально. Цель является свойст­вом не самого поведения, а является способом обра­щения к контролирующим переменным. Если мы составляем наше описание после того, как мы увидели, что человек опустил свое письмо в почтовый ящик и повернул обратно, мы приписываем ему цель события, которое заставило его идти по улице. Это событие при­дает «смысл» его выполнению не посредством расши­рения описания как такового, а посредством указания на независимую переменную, функцией которого оно могло бы быть. Мы не можем увидеть его цель, не уви­дев, что он опустил письмо, если только прежде мы не наблюдали подобного поведения и подобных следствий. В тех случаях, когда мы это делаем, мы пользуемся данным термином просто для предсказания того, что в данной ситуации им будет опущено письмо.

Также и наш испытуемый не может видеть свою цель, не соотносясь с похожими событиями. Если мы спросим его, почему он идет по улице или-какова его цель, и он ответит: «Я иду, чтобы опустить письмо», то мы не узнаем ничего нового о его поведении, кроме нескольких возможных причин. Конечно, сам испыту­емый может находиться в преимущественном положе­нии, описывая эти переменные, поскольку он находит­ся в постоянном контакте со своим поведением на протяжении; многих лет. Следовательно, его утверж­дение относится к тому же классу, что и утверждения других людей, которые несколько раз наблюдали за его поведением. Он просто делает возможное предсказа­ние с точки зрения своего опыта с самим с собой. Более того, он может ошибаться. Он может сообщить о том, что собирается отправить письмо, и, действительно, он может «нести в руке неотправленное письмо и опус­тить его в конце улицы, но мы все-таки можем пока­зать, что его поведение определяется тем фактом, что в прошлом он находился в таких ситуациях, когда он имел дело с человеком, значимость которого для него связа­на с такой прогулкой. Он может не осознавать эту цель в том смысле, что он не способен сказать, что его пове­дение определяется именно этой причиной. Тот факт, что оперантное поведение «направлено на будущее», вводит в заблуждение. Например, рассмотрим случай,

когда «что-либо ищется». В каком смысле это «что-либо», которое еще не было найдено, релевантно пове­дению? Предположим, что мы научаем голубя клевать пятно на стенке ящика и после формирования операн-та устраняем пятно. Птица подойдет к привычному для нее месту около стены. Она поднимет голову, направит взгляд в привычном направлении и даже возможно, что она произведет слабое клевательное движение. До тех пор пока процесс уташения не продвинется очень да­леко, она будет возвращаться на то же самое место и демонстрировать те же поведенческие реакции. Мож­но ли говорить, что голубь ищет пятно? Должны ли мы При объяснении поведения принимать во внимание поиск пятна?

Интерпретация этого поведения с позиций операн-тного обусловливания не представляет большого тру­да. Поскольку визуальная стимуляция, исходящая от пятна, обычно предшествовала приему пищи, пятно стало условным подкреплением. Оно усиливает пове­дение поиска в данном направлении с различных поло­жений. Хотя мы пытались обусловливать только реак­цию клевания, в действительности мы усиливали много различных видов «предшествующего» поведения, ко­торые заставляли птицу принять положение, из кото­рого она ищет пятно и клюет его. Эти реакции продол­жают появляться даже тогда, когда мы убираем пятно вплоть до наступления затухания. Пятно, которое ищет­ся, является таким пятном, которое в прошлом было неотсроченным подкреплением поискового поведения. В общем, поиск чего-либо включает в себя порождение реакций, которые в прошлом произвели «нечто» как следствие.

Аналогичная интерпретация применима к поведе­нию человека. Когда мы видим, что человек передви­гается по. комнате, открывает ящик письменного стола, смотрит на что-то, находящееся под журналами и т. д., Можно совершенно объективно описать его поведение: «Сейчас он находится в определенной части комнаты; большим и указательным пальцами правой руки он дер­жит книгу; он поднимает книгу и наклоняет свою голову так, чтобы можно было видеть любой объект, находящий­ся иод книгой». Можно также проинтерпретировать его поведение или «придать ему смысл»: он ищет что-то, или, если быть более конкретным, он ищет очки. То, что мы добавляем, является не дальнейшим описанием его по­ведения, а суждением о некоторых переменных, опре­деляющих его. Здесь нет ни текущей цели, ни мотива, ни намерения, которые должны быть приняты во внимание. То же самое будет иметь место, даже если мы спросим его о том, что он делает, и он ответит: «Я ищу свои очки». Это не дальнейшее описание его поведения, а это опи­сание переменных, функцией которых является его поведение, оно эквивалентно высказываниям: «Я поте­рял очки», «Я прекращу делать то, что я делаю, когда найду мои очки», или «Когда я это делал в прошлом, я находил мои очки?» Эти выражения могут показаться не вполне конкретными, однако это происходит потому, что высказывания, включающие цели и намерения, яв­ляются аббревиатурами.

Очень часто приписывание цели поведению исполь­зуется как еще один способ описания биологической адаптации. Это положение уже обсуждалось, однако можно добавить следующее. Как в оперантном обус­ловливании, так и в эволюционном отборе поведенче­ских характеристик следствия изменяют будущую ве­роятность. Рефлексы и другие врожденные паттерны поведения развиваются, потому что они увеличивают вероятность выживания вида. Операнты укрепляются, потому что за ними следуют важные следствия в жизни индивидов. По той же самой причине оба процесса по­рождают вопрос о цели, и в обоих случаях обращение к конечной причине может быть аналогичным образом отвергнуто. Паук не владеет тщательно отработанным репертуаром поведения, с помощью которого он плетет паутину, потому что она дает ему возможность ловить пищу, благодаря которой он выживает. Он владеет схо­жим поведением, потому что в прошлом такое же пове­дение пауков давало им возможность ловить пищу, кото­рая необходима для выживания.. В эволюции поведению «плетения паутины» соответствовала серия событий. Мы не правы, когда говорим, что видим «цель» плести паути­ну, наблюдая похожие события в жизни индивида.

Миллер (G. Miller) Джордж (род. в 1920 г.) — американ­ский психолог, профессор Гарвардского университета. Из­вестен своими работами по экспериментальному изучению речевой коммуникации и исследованиями общих психоло­гических проблем.

Некоторые из его важнейших трудов: Psychology. The Science of Mental Life. Penguin books. — 1967; The psychology jf communication. 1967; (bei Me. Neill D.). Psycholinguistics. — In: The Handbook of Social Psychol. — 1969. — Vol. 3; Language and Perception, 1976. Галантер (Galanter) Юджин (род. в 1924 г.) — американский психолог, профессор Пенсильванского универ­ситета. Основные исследования в области применения теории информации в психологии: Contemporary psychophysics. — In: Brown R., Galanter E., Hess E. H., Mandler G. New directions in psychology, 1962 vol. 1. N. Y.; The direct measurement of unitity and subjective probabilty. — Amer. Journ. of Psychol. — 1962. — Vol. 75; Textbook of Elementary Psychology. — 1966.

Прибрам (Pribram) Карл (род. в 1919 г.) — американс­кий нейропсихолог, профессор Стэнфордского универси­тета, видный представитель американской нейропсихологии, автор ряда книг и многочисленных статей по широкому кругу проблем. Написанная им совместно с Дж. Миллером и Ю. Га-Аантером книга «Планы и структура поведения» переведена на русский язык в 1965 г. Также была издана на русском языке его книга «Языки мозга» (1975).

В данное издание включены отрывки из I и II глав книги « Планы и структура поведения» (М., 1965. —С. 26—34,40—54).

Здесь поведение описывается как сложный акт, выключающий фазы пробы (Test) и операционную (Operate) и регулируемый знаниями, накопленными в прошлом опыте организма (авторы называют их Образами) и программой, обеспечивающей последовательность операций (называется здесь Планом).

ПЛАНЫ И СТРУКТУРА ПОВЕДЕНИЯ

Задача заключается в том, чтобы дать описание того, как внутреннее представление организма о его Вселен­ной контролирует его деятельность. Если мы рассмот­рим, какова эта деятельность у нормального животно­го, то мы будем поражены тем, в какой степени она организуется в определенные системы. Большинство психологов утверждают, что эти системы деятельности определяются иерархией целей, но в настоящее время не это нас интересует. Мы хотим привлечь внимание к тому факту, что такая организованность действительно существует. Структура является таким же важным свой­ством поведения, как и восприятия. Однако структуры поведения имеют тенденцию быть главным образом развертывающимися во времени; именно последова­тельность движения плавно развивается в то время, как живое существо бегает, плавает, летает, разговаривает или занимается чем-либо еще. Поэтому мы должны обеспечить способ, при помощи которого мы сможем зафиксировать познавательное представление в виде соответствующей схемы деятельности. Но как же нам расчленить эту находящуюся в движении схему дея­тельности на поддающиеся анализу части?

Трудности при анализе деятельности животного возникают не от недостатка методов, а от их чрезмер­ного изобилия. Мы можем описать действие как пос­ледовательность сокращений мышц или как последо­вательность движений конечностей и других частей тела, как последовательность целенапрвленных дей­ствий или даже более крупных комплексов. В соответ­ствии с теорией Толмена большинство психологов отличают мелкие единицы поведения от крупных, называя мелкие «молекулярными», а крупные — «мо- лярными». Всякому, кто спрашивает, какая из этих единиц имеет надлежащий объем для использования

при описании поведения, говорят, что законы поведе­ния кажутся более очевидными при использовании молярных единиц, но добавляют, что ему придется установить на основании собственного опыта и наблю­дений, насколько «молярными» должны быть исполь­зуемые единицы.

Однако довольно ясно следующее: сложность за­ключается в том, что молярные единицы должны со­стоять из молекулярных единиц, а это означает, что Надлежащее описание поведения должно делаться од­новременно на всех уровнях. Иначе говоря, мы пы­таемся описать процесс, который организуется на не­скольких различных уровнях, и сочетание элементов на одном уровне может быть указано только в том случае, если мы укажем элементы следующего, высшего, или более молярного уровня описания. Например, молярная схема поведения X состоит из двух частей —А и В. Таким образом, Х=АВ. Но А в свою очередь состоит из двух частей — а и Ь, а В состоит из трех — с, d и е. Следовательно, Х=АВ= abcde, и мы можем описать этот сегмент поведения на любом из указанных трех уров-ней. Дело, однако, в том, что мы не хотим избрать один уровень и доказывать, что он почему-то лучше других: полное описание должно включать все уровни. Иными словами, структурные свойства поведения будут поте-ряны, если мы установим только, например, abcde: тог- да (ab) (cde) можно спутать с (abc) (de), которые могут представлять собой совершенно различные вещи.

Несомненно, этот вид организации поведения наи-более очевиден в словесном поведении человека. От­дельные фонемы организуются в морфемы, морфемы объединяются, чтобы составить фразы; фразы в соот-ветствующей последовательности дают предложение, а ряд предложений образуют высказывание. Полное описание высказывания включает все перечисленные нами уровни.

Примером двусмысленности, которая является ре-зультатом ситуации, когда не все уровни известны, мо­жет служить следующее предложение: «They are flying planes». Последовательность фонем может остаться не-изменной, но это предложение можно проанализиро­вать двояко, как (They) (are flying) (planes) и (They are) (flying planes), получив два совершенно разных высказывания: (а) «Они водят самолеты»; «Это — летящие самолеты»1.

Психологи редко проявляли нежелание призна­вать существование таких молярных единиц, как «сло­ва» или даже «значения», когда они касались словес­ного поведения, несмотря на то, что фактические реакции, доступные для восприятия, представляют собой всего лишь ряды звуков, акустические представ­ления предполагаемых фонем. Такое же признание молярных единиц в несловесном поведении требует подобного описания, охватывающего все уровни. Од­нако, к сожалению, психолог обычно описывает пове­дение или какой-либо аспект поведения на одном-един-ственном уровне и предоставляет своим коллегам вывести при помощи собственного здравого смысла, что произошло на других уровнях. Тщательная регис­трация каждого сокращения мышц, даже если бы кто-нибудь отважился попытаться это сделать, все же оказалась бы недостаточной, так как она не содержа­ла бы структурных черт, которые характеризуют мо­лярные единицы. Эти структурные черты должны вводиться на основе теории поведения. Наши теории поведения в этом смысле всегда оставались туманны­ми и интуитивными. (Довольно странно представить себе, что, хотя бихевиоризм существует полвека, этот аспект проблемы описания поведения почти никогда не учитывался и, уж конечно, не был разрешен.)

1 Традиционный метод анализа предложения служит прототипом того вида описания поведения, которого мы требу­ем. Хомский в гл. IV своей монографии «Синтаксические струк­туры» (Chomsky N. Syntactic Structures) дает формальное пред­ставление о такого рода описании, называемом лингвистами «конституэнтным анализом». Мы обсудим предлагаемый Хом-ским метод описания словесного поведения более детально в главе X. Предположение, что лингвистический анализ дает модель для описания всех видов поведения, конечно, не явля­ется новостью: оно часто выдвигалось как лингвистами, так и психологами. Например, психолог Джон Б. Кэрролл в «Иссле­довании языка» (Carrol J.B. The Study of Language. — Cambridge, 1953) отмечает, что из лингвистической теории мы заимствуем представление об «иерархии единиц— от элементарных еди­ниц, подобных отличительной черте фонемы, до крупных еди­ниц типа предложения. Можно предположить, что отрезки поведения любого типа могут быть организованы до некоторой степени таким же образом» (Р. 106).

В тех счастливых случаях, когда мы находим аде­кватные описания поведения — которые мы почти всегда встречаем у лингвистов и этологов, — совер­шенно очевидно, что поведение организуется одновре­менно на нескольких уровнях, характеризующихся разной степенью сложности. Говоря об этом факте, мы будем именовать его «иерархической организацией поведения»2. Эта иерархия может быть изображена различными способами. Иерархическая схема обыч­но принимает форму дерева, ответвления которого указывают в последовательном порядке все меньшие единицы. Иначе иерархия может быть представлена в виде контура:

Можно рассматривать иерархию и как ряд переч­ней: X — это перечень, содержащий два пункта —АиВ; А — перечень, содержащий два пункта — а и b— пере-

2 Многим психологам знакомо мнение, что поведение врганизуется иерархически, потому что они помнят, как Кларк Хвлл употреблял термин «генеалогическая иерархия». Поэто­му мы спешим отметить, что то, как использовал термин «иерар-хия» Халл и как используем его теперь мы, не имеет почти ничего общего. Мы говорим об иерархии уровней описания. Халл говорит о систематизации альтернативных (взаимозаме-няемых, взаимозамещаемых) реакций соответственно их силе. См,, например, работу: Hull C.L. The Concept of the Habit-family Hierarchy and Maze Learning. — Psychol. Rev. № 41. — 1934. — P, 33—54, 134—152). Ближе к духу настоящего обсуждения стоит система эпизодов поведения, использованная Роджером Бар-кором и Гербертом Райтом в труде «Средний Запад и его дети» (Barker R., G. Wright. Midwest and Its Children.) для описания Малярного поведения детей в их естественном окружении. Труд Варкера и Райта является заслуживающим внимания» исклю­чением из нашего утверждения, что психологи не пытались описать структурные черты поведения.

чень, содержащий три пункта — с, d, e3. Наконец, иерар­хию можно рассматривать как ряд правил, на основании которых происходят допустимые замены: там, где встре­чается X, мы можем заменить его АВ; А можно заменить ab и т. д.4 Каждый из этих способов изображения иерар­хии имеет в особых условиях свои преимущества.

Теперь, если принять иерархическую систему орга­низации поведения за единственно правильную, пришло время выделить несколько терминов для специальных целей настоящего обсуждения. Так как определения представляют собой трудное чтение, мы постараемся сократить наш список до минимума.

План. Всякое полное описание поведения должно быть пригодным для того, чтобы служить перечнем инст­рукций, т. е. оно должно обладать характерными чертами плана, который может руководить описываемым действи­ем. Однако, когда мы говорим о Плане на страницах дан­ной книги, этот термин будет относиться к иерархии инструкций, и если это слово будет начинаться с заглав­ной буквы, то это будет указывать, что оно употребляется в этом специальном значении. Итак, План — это всякий иерархически построенный процесс в организме, способ­ный контролировать порядок, в котором должна совер­шаться какая-либо последовательность операций.

Для организма План в основном представляет со­бой то же самое, что и программа для математической машины, в особенности если эта программа имеет иерархический характер, описанный выше. Ньюэлл, Шоу и Саймон очень четко и систематично применяли иерархическую структуру перечней в своей работе над «языками для обработки информации», которые при­меняются при программировании для скоростных цифровых математических машин в случаях модели­рования человеческих процессов мышления. Их успех

3 Формы изображения в виде дерева и контура — древние и хорошо знакомые формы, но использование формы перечней кажется нам относительно новым. Впервые мы познакомились с ним в труде Ньюэлла, Шоу и Саймона по моделированию познавательных процессов при помощи счетно-вычислительных устройств. См.: Newell A., Simon H.A. The Logic Theory Machine: A Complex Information Processing System «IRE Transactions on Information Theory». — 1956. — Vol. 1—2. — № 3. — P. 61—79; Proceeding of the Western Joint Computer Conference. Los Angeles, February.— 1957.— P. 230—240.

в этом отношении, который, по нашему мнению, явля­ется очень значительным и многообещающим, под­тверждает правильность гипотезы, что иерархическая структура является основной формой организации при решении задач человеком. Поэтому мы с полным ос­нованием полагаем, что в дальнейшем термин «План» может быть всюду заменен термином «программа». Тем не менее сведение Планов «только к программам все еще является научной гипотезой и требует даль­нейшей проверки. Поэтому пока мы скорее избежим путаницы, если будем рассматривать программу ма­тематической машины, моделирующей некоторые черты поведения организма, как теорию о Плане орга­низма, порождающем поведение»5.

Кроме того, мы будем также использовать термин «План» для обозначения грубого наброска какой-то после­довательности действий, просто ряда основных темати­ческих заголовков наряду с полностью детализированной спецификацией каждой отдельной операции6.

Стратегия и тактика. Понятие об иерархической Организации поведения было дано ранее, а также ука­зывались различия между молярными и молекулярны­ми единицами анализа. Теперь, однако, нам хотелось

5 Следует четко осознавать, как указывают Ньюэлл, Шоу и Саймон, что уподобление последовательности операций, совершенных организмом, хорошо программируемой работе счетной машины резко отличается от уподобления счетной ма-шине, мозгу или электрических реле синапсам и т. д. Ньюэлл, Шоу Дж., Саймон Г. Элементы теории решения задач. См. работу: Newell A., Shaw J.C., Simon H.A. Elements of a Theory of Human Problem Solving.— Psychol. Rev.— 1958.— № 65.— P, 151—166; Herbert A., Simon H.A:, Newell A. Models. Their Uses tnd Limitations. — In: White L. D. (ed.). The State of the Social Iclences. — Chicago, 1956. — P. 66—83.

в Ньюэлл, Шоу и Саймон также пользовались термином «План» для обозначения общей стратегии, до того как были разработаны детали, но они подчеркивают отличие такого Плана ВТ программы, которая . дает возможность счетной машине использовать планирование как один из технических приемов решения задачи. См.: Newell A., Shaw J. С, Simon И, A. A Report en a General Problem Solving Programm. — In: Proceedings of the International Conference on Information Processing.— Paris, 1959. Другие исследователи употребляют термин «машина» в столь широком смысле, что он включает в себя и План, и инструмент, i помощью которого этот план осуществляется. См.: Minsky M.L. I ItMirlstic Aspects of the Artifical Intelligence Problem, Group Report 14 55. Lincoln Labor., Massachus. Inst. of Technology, 1956.

бы расширить нашу терминологию. Мы покажем, что молярные единицы представляют собой стратегию по­ведения, молекулярные единицы — тактику.

Выполнение. Мы говорим, что живое существо вы­полняет данный План, в то время как на деле этот План контролирует последовательность операций, которые оно выполняет. Когда организм выполняет План, он делает это шаг за шагом, завершая одну его часть и затем переходя к следующей. Выполнение Плана не обяза­тельно должно выражаться во внешнем действии — в особенности у человека; можно, по-видимому, считать справедливым, что наряду с Планами, руководящими действиями, существуют Планы для сбора или перера­ботки информации. Хотя это фактически не является необходимым, мы интуитивно предполагаем, что одно­временно может выполняться только один План, хотя возможно довольно быстрое чередование Планов. Орга­низм может хранить много других Планов, кроме вы­полняемого им в данный момент.

Образ. Образ — это все накопленные и организо­ванные знания организма о себе самом и о, мире, в ко­тором он существует. Конечно, Образ заключает в себе нечто гораздо большее, чем картины. Употребляя этот термин, мы имеем в виду в основном тот же вид пред­ставления, которого требовали другие сторонники по­знавательной теории. Оно включает все, что приобрел организм, — его оценки наряду с фактами, — органи­зованное при помощи тех понятий, образов или отно­шений, которые он смог выработать.

В ходе продолжительных дебатов авторы настоя­щей книги пользовались большим количеством других терминов для уточнения термина «План», но эта тер­минология не будет приведена здесь. Новые термины будут вводиться и разрабатываться по мере надобно­сти в ходе последующего обсуждения. В настоящее же время мы дали достаточное количество определений, чтобы иметь возможность сказать, что центральной проблемой этой книги является исследование отноше­ний между Образом и Планом.

Может показаться, что это утверждение означает резкое разделение Образа и Плана, так что имело бы смысл задать вопрос: «Входит ли такой-то процесс ис­ключительно в План или исключительно в Образ? » Из нижеприводимых соображений должно стать ясным,

что эти две точки зрения не могут быть использованы для классификации процессов по двум взаимоисклю- чающим категориям: План может быть заучен и стать тем самым частью Образа.

Формулировки Планов должны у человека включать часть Образа, поскольку то, что человек в состоя­нии выполнить данные Планы, должно являться час­тью его Образа о самом себе. Знания должны быть включены в План, поскольку В противном случае План не может служить основой для руководства поведением. Следовательно, Образы могут составлять часть Плана. Можно внести изменения в Образы только путем выполнения Планов по сбору, накоплению и перера­ботке информации.

Можно внести изменения в Планы только на осно­ве информации, почерпнутой из Образов.

Преобразование описаний в инструкции представ­ляет собой у человека простую словесную процедуру.

Те психологи, которые привыкли считать своей за­дачей исследование взаимоотношений между стимулом И реакцией, склонны рассматривать работу, подобную Нашей, параллельным образом — как исследование вза­имоотношений между субъективным стимулом и субъек­тивной реакцией. Если бы все, что мы должны сказать, можно было свести к этому, то едва аи нам понадобилось бы писать для этого книгу. Стимул и реакция — это пси­хологические понятия, заимствованные из анализа реф­лексов. Но мы отказались от классической концепции о рефлекторной дуге как основной схеме организации все­го поведения и поэтому не ощущаем необходимости пе­реносить классическое разделение стимула и реакции в область Образов и Планов. Предположение, что План представляет собой замаскированную реакцию на ка-кой-то внутренний Образ стимула, приводит только к по­пытке уподобить объективные концепции их субъек­тивным эквивалентам и оставляет рефлекторную дугу по-прежнему хотя и довольно призрачным, но все же хозяином всего механизма мышления. Едва ли нам уда­стся свергнуть старого хозяина без помощи нового, по-этому далее нам предстоит задача найти ему преемника.

...Нервный механизм, участвующий в рефлекторном акте, не может быть изображен как простая рефлекторная дуга... В рефлекторном акте участвует значительно более сложная форма регуляции чем та, которую предполагает теория рефлекторной дуги. Единственное требование, предъявляемое к стимулу в классической цепи элемен­тов, выражается в критерии пороговых интенсивностей для каждого из элементов.. Если внешний раздражитель достаточно силен, чтобы быть выше порога на всем про­тяжении рефлекторной дуги, он сможет вызвать реак­цию ... Однако порог является лишь одной из многих раз­личных сторон, в отношении которых может быть опробовано воздействие. Более того, ответ эффекторных аппаратов зависит от результатов такого опробования, и его наиболее правильно рассматривать как попытку из­менить получаемые результаты. Действие возбуждается «несоответствием» между состоянием организма и состо­янием, которое опробуется. Действие сохраняется до тех пор, пока несоответствие (т. е. проксимальный стимул) не устраняется. Общий характер рефлекторного акта, таким образом, заключается в опробовании воздействующей энергии определенными критериями, установленными в организме, в возникновении реакции, если результат пробы показывает наличие несоответствия (рассогласо­вания) и в продолжении реакции до тех пор, пока это несоответствие не исчезает... Следовательно, существует «обратная связь», идущая от результата действия к фазе опробования; мы обнаруживаем здесь возврат­ную петлю. Простейший вид схемы, представляю­щей эту концепцию рефлекторного действия в проти­воположность классической рефлекторной дуге, будет выглядеть примерно следующим образом (рис. 1).

Рис. 1. Единица Т—О—Т—Е (Test—Operate—Test—Exist)

...Мы будем использовать представление о Т—О— Т—Е как общее описание процессов, участвующих в ре­гуляции . В самой простой форме схема Т—О—Т—Е лишь утверждает, что операции, выполняемые организмом, постоянно регулируются результатами различных проб.

Авторы настоящей книги считают, что система Т------

О—Т—Е, включающая важное понятие обратной связи, является как объяснением поведения, так и объяснением рефлекторного акта, принципиально отличным от объяс­нения, предлагаемого принципом рефлекторной дуги. Следовательно, традиционные понятия стимула и реак­ции должны быть определены по-новому, чтобы соответ­ствовать своему новому контексту. Стимул и реакция должны рассматриваться как фазы организованного, координированного акта. Мы суммируем указанные пред­ставления следующим образом: «Стимул является той фазой формирующейся координации, которая представ­ляет условия, необходимые для достижения успешного результата; реакция является той фазой этой же форми­рующейся координации, которая дает возможность дос­тигнуть соответствия этим условиям и служит инструмен­том в достижении успешной координации. Поэтому они являются строго соответствующими друг другу и совпа­дающими во времени»7.

Ввиду того что стимули реакция соответствуют друг другу и совпадают во «времени, процесс действия раз­дражителя следует рассматривать не как предшествую­щий реакции, а скорее как ведущий ее к успешному устранению несоответствия. Иначе говоря, стимул и реакция должны рассматриваться как элементы обрат­ной связи.

Необходимость какого-то вида обратной связи при описании поведения хорошо видна большинству сто­ронников рефлекторной теории, но они вводят ее осо­бым путем. Например, они обычно говорят о некоторых Следствиях рефлекторного акта, таких, как усиление ИЛИ подкрепление рефлекса, — такой подкрепляющий результат действия является четким примером обрат-Ной связи. Подкрепление, однако, является особым ви­дом обратного воздействия, которое не следует отож-

7 Эта цитата взята из статьи: Dewey J. The Reflex Arc Concept In Piychology. Эта статья ввиду мудрости и глубины понимания имеет такое же значение, какое она имела в 1896 г.

дествлять с обратной связью, включенной в систему Т—О—Т—Е. Их различия таковы: (1) подкрепляющая обратная связь должна усиливать что-то, в то время как обратная связь в схеме Т—О—Т—Е осуществля­ет акт сличения; (2) подкрепляющая обратная связь рассматривается как определенный раздражитель (наприпример, пища), в то время как обратная связь в Т—О—Т—Е может быть раздражителем или информацией (например, инструкцией); (3) подкреп­ляющая обратная связь часто рассматривается как фактор, «снижающий потребность» организма, в то время как обратная связь в Т—О—Т—Е не имеет по­добного значения.

Когда процесс Т—О—Т—Е завершен — операция выполнена, проба дала удовлетворительные результа­ты, реакция завершена, — организм может достичь более благоприятного состояния. Возможно, правиль­но, что система Т—О—Т—Е, которая успешно завер­шается в данной ситуации, имеет тенденцию повторять­ся с возрастающей вероятностью, хотя такая связь не является обязательной. Поэтому возможно обсуждать Т—О—Т—Е в терминах подкрепления. Тем не менее Т— О—Т—Е включает значительно более общее представле­ние об обратной связи. Понятие подкрепления пред­ставляет важный шаг вперед от рефлекторной дуги к петле обратной связи, однако в теории поведения нуж­ны еще более смелые шаги, чтобы продвинуться за пределы описания простых экспериментов по выработ­ке условных рефлексов.

Возможно, окажется необходимым внести измене­ния в основной тип Т—О—Т—Е как гипотезу, поэтому в целях настоящего обсуждения мы будем продолжать, рассматривать схему, изображенную на рис. 1, скорее-как гипотезу, чем факт. Однако важность значения этой гипотезы для общих положений нашей книги не долж­на быть упущена. Она представляет собой описание в сжатой форме связи между Образом и действием, ко­торое мы выполняем. Т—О—Т—Е представляет собой основную схему, в которую укладываются наши Пла­ны; фаза «опробования» Т—О—Т—Е включает опреде­ление того, какие знания необходимы для сравнения, а операционная фаза представляет собой то, что организм делает в соответствии с этим. Последнее часто может включать открытые, видимые действия. Каким же об­разом План связывает представления (Образ) организ­ма о самом себе и окружающем его мире с действиями, реакциями, поведением, которые организм производит?

Посмотрим, что мы должны сделать для того, чтобы распространить эту идею на некоторые важные про­блемы. Одно из первых затруднений, не слишком боль­шое, — это определить более точно, что мы подра­зумеваем под «несоответствием» (рассогласованием), которое выявляется на стадии первоначальных проб. Почему бы нам не говорить о наличии простого разли­чия, а не «рассогласования»? Ответ не является глубо­ким: мы просто не хотим заниматься описанием систе­мы Т—О—Т—Е в случаях, когда организм улавливает различие и когда он не улавливает таких различий. Ко-Гда схема Т—О—Т—Е используется для описания сер­вомеханизмов, например, очень важно разграничить «положительную» и «отрицательную» обратную связь, но, ввиду того, что мы прежде всего интересуемся об­ратной связью при регуляции, такие вопросы не явля­ются существенными. Вряд ли стоит рассматривать все эти варианты как различные элементы анализа, оче-видно, проще рассматривать их все как примеры более общего типа механизма, «чувствительного к несоответ­ствию»8.

Второе затруднение — несколько более серьезное — заключается в вопросе, каким образом из системы Т— О—Т—Е мы можем прийти к целой иерархической Структуре поведения, на важность которой мы указыва­ли в главе I. Как можно примирить два понятия — обрат-ная связь и иерархия? Один из методов комбинирования Компонентов обратной связи в иерархию был описан Д.М. Маккеем9, который предположил, что последствия операционной фазы в одном компоненте представляют собой стимул для действия сличающего механизма вто­рого компонента; согласно предположению Маккея, су-

• Понятие механизма, «чувствительного к несоответствию», нежится авторам связанным с концепцией «познавательного диссонанса» Фестингера, но мы не пытаемся исследовать или развить эту возможную связь.

ществует ряд таких компонентов обратной связи, каж­дый из которых представляет более высокий уровень абстракции от внешней действительности. Хотя схема Маккея является очень остроумной, мы вынуждены признать, что несколько иной метод построения иерар­хии будет лучше служить целям психологического опи­сания. Центральное положение метода, принятого на этих страницах, заключается в том, что операционные компоненты схемы Т—О—Т—Е сами могут быть элемен­тами этой схемы. Иначе говоря, схема Т—О—Т—Е вклю­чает как стратегические, так и тактические элементы поведения. Таким образом, операционная фаза системы Т—О—Т—Е более высокого порядка может сама состо­ять из цепи других подобных . же систем, а каждая из последних в свою очередь может содержать вновь ряды таких же подчиненных единиц и т. д. Поскольку этот метод применения одной и той же схемы описания для высших, стратегических элементов и для низших, такти­ческих элементов может вызвать недоразумения при первом знакомстве, мы рассмотрим соответствующий пример.

Р. С. Вудвортс показал, что часто акты поведения состоят из двух стадий 10. Вудвортс называет их «двух­фазными двигательными актами». Первая фаза яв­ляется подготовительной, или мобилизующей; вторая — результативной, или удовлетворяющей. Чтобы прыг­нуть, вы прежде всего сгибаете бедра и колени, а затем с силой разгибаете их, сгибание подготавливает к прыжку. Чтобы взять предмет, сначала вы разжимаете кисть, а затем сжимаете ею предмет. Нужно открыть рот, прежде чем откусить кусок хлеба, нужно отвести руку назад, прежде чем ударить, и т. д. Указанные две фазы — это совершенно различные движения, хотя они, несомненно, выполняются как единое действие. Если раздражение адекватно, для того чтобы вызвать дви­жения, прежде всего надо осуществить подготовитель­ный процесс проб, а когда он завершается, возникают условия для осуществления результативной системы проб и соответствующее действие выполняется. Мно­гие из этих двухфазных планов являются повторяющи­мися: завершение второй фазы в свою очередь создает стимулы, показывающие, что вновь возможно осуще­ствление первой фазы, так что устанавливается чере­дование двух фаз, как это происходит при ходьбе, беге, жевании, питье, подметании; шитье и т. д.

Мы хотим особо подчеркнуть формирование «двух­фазной» системы Т—О—Т—Е, состоящей из двух бо­лее простых элементов. Рассмотрим в качестве приме­ра забивание гвоздя.

В качестве выполнения плана забивание гвоздя, конечно, имеет две фазы: подъем молотка и удар по гвоздю. Мы можем изобра­зить это в виде дерева или иерархии, как на рис. 2. Од­нако, если нам потребуются детали, изображение за­бивания гвоздя на рис. 2 как простой комбинации, содержащей два элемента, несо­мненно, является слишком упрощенным. Оно не гово­рит нам, например, как долго продолжается забива-ние. Что здесь является поводом к прекращению действия? Для этой цели мы должны выделить фазу проб, как на рис. 3. Схема на рис. 3 должна показать, что, когда, система Т—О—Т—Е, которую мы называем «забиванием», регулируется, удары молотком про­должаются до тех пор, пока шляпка гвоздя не сравни­вается с той поверхностью, в которую мы его забива-ем. Когда проверка показывает, что гвоздь вбит, регуляция переносится на другие элементы. Однако теперь мы, очевидно, потеряли представление об

иерархической структуре. Иерархия восстанавлива­ется, когда мы глядим на прямоугольник с надписью «Молоток», так как там мы обнаруживаем две систе­мы Т—О—Т—Е, каждую со своей собственной пробой, как показано на рис. 4. Когда две такие системы, объе­диненные на рис. 4, включаются в операционную фазу на рис. 3, результатом является иерархический План забивания гвоздей, который показан на рис. 5.

Если это описание забивания гвоздя является пра­вильным, мы должны ожидать, что последовательность событий будет разворачиваться следующим образом:

Сверка положения гвоздя (шляпка торчит) —Свер­ка положения молотка (молоток опущен) — Подъем мо­лотка —Сверка положения молотка (молоток поднят.) — Удар по гвоздю — Проба молотка (молоток опущен) — Сверка положения гвоздя (шляпка торчит) — Сверка положения молотка.

Рис. 4. Пунктирная линия показывает, как две простые схемы Т—О—Т—Е объединяются, образуя определенную фазу более сложной системы, изображенной ранее на рис. 3

И так далее, пока проба гвоздя не покажет, что его шляпка сравнялась с поверхностью; в этот момент ре­гуляция переносится в другое место. Таким образом, система Т—О—Т—Е достаточно легко раскладывается на координированную последовательность проб и дей­ствий, хотя лежащая в ее основе структура, органи­зующая и координирующая поведение, сама по себе яв­ляется иерархической, а не просто последовательной.

Рис. 5. Иерархический План забивания гвоздей

Может показаться не вполне разумным анализиро-вать движения, участвующие в забивании гвоздей по­добным образом. Однако лучше забавлять читателя, чем запутывать его. Эти схемы лишь иллюстрация того, как Несколько простых систем Т—О—Т—Е, каждая со своей петлей «проба — операция — проба» (Test — Operate—Test), могут быть включены в операционную фазу более сложной системы с собственными аналогич­ными связями. Без такого объясняющего примера мог­ло бы быть неясно, как эти кольца, замкнутые в более сложные системы колец, могут образовывать иерархии. Более сложные Планы—Вудвортс называет их «поли­фазными двигательными элементами» — могут быть подобным же образом описаны как системы Т—О—Т— E1 построенные из субпланов, которые сами являются подобными же системами. Птица может взлететь, сде­лать несколько взмахов крыльями, полететь парящим полетом, прекратить взмахи крыльями, выпрямить ко-нечности и приземлиться на них. Все действие возни­кает как единое целое, регулируется единым Планом, составленным, однако, из нескольких фаз, каждая из которых имеет свой собственный План, который в свою очередь может состоять из субпланов и т. д.

Обратите внимание на то, что именно операцион­ная фаза этой системы раскладывается на ряд других подобных же систем. Если бы мы захотели сохранить, схему Т—О—Т—Е в том виде, как она показана на рис. 1, мы не смогли бы использовать ее для построения более сложных проб11. Таким образом, адекватные пробы расцениваются как сравнительно фиксированные; из­менчивой и сложной может быть лишь операционная фаза. Конечно, операционная фаза может состоять из ряда подобных же систем, она может также завершать­ся эфферентной активностью12. Если мы рассмотрим комплексные Планы — иерархии описанных систем, в которых операция одной системы рама является рядом подчиненных систем, — то станут очевидными некото­рые общие особенности таких систем.

Иерархическая структура, лежащая в основе пове­дения, должна быть просто описана на языке счетно-решающих устройств, разработанном Ньюэллом, Шоу и Саймоном.

11 Причина, по которой система Т—О—Т—Е на рис. 1 мо­жет быть расширена только за счет своей операционной фазы, чисто формальна и может быть показана посредством простого расчета. С пробой на рис. 1 связаны четыре стрелки: две стрел­ки связаны с Операцией и две стрелки связаны с Т—О—Т—Е в целом. Поэтому, если эта система с двумя стрелками исполь­зуется для формирования компонента другой подобной же си­стемы, образуемый ею компонент должен быть Операцией с ее двумя стрелками, а не Пробой с четырьмя стрелками. Однако возможно, что жесткие ограничения, подобные этим, являются, вероятно, нереальными, оправданными только в целях дидакти­ческого упрощения. Всякий, кто изучал иерархически органи­зованные программы, составленные Ньюэллом, Шоу, Саймоном для моделирования процесса решения задач человеком, может понять, как в действительности примитивны и неразработаны иерархии подобных систем Т—О—Т—Е.

12 Если мы примем всерьез предлагаемую схему Т—О— Т—Е, система может быть легко представлена в в,иде петель. Например, если все субпробы при расширении операционной фазы применимы, но основная проба оказалась несостоятель­ной, возникает петля. Для того чтобы избежать петель, мы .дол­жны утверждать, что основная проба ведет к разъяснению суб­проб. При более реальномрешении проблемы мы принимаем возникновение петель как сигнал о том, что План оказался неуспешным в достижении результата, на который была на­правлена основная проба. Следует далее найти механизмы обнаружения и ликвидации таких петель.

Планирование может рассматриваться как состав­ление перечня проб, которые следует произвести. Ко­гда у нас есть отчетливый Образ желаемого результа­та, мы можем использовать для его создания условия, которые мы должны опробовать, и, будучи организо­ваны в нужной последовательности, эти пробы состав­ляют в грубых чертах стратегию возможного Плана. (Возможно, более понятно можно сказать, что условия, которые мы должны опробовать, являются Образом желаемого результата).

Операционная фаза может содержать как пробы, так и операции. Поэтому выполнение Плана любой сложности должно включать значительно больше проб, чем действий. Эта конструктивная особенность ответ­ственна за общее снижение количества информации, которое наблюдается, когда человеческое существо рассматривается как коммуникационный канал.

У низших животных можно видеть, что структура их поведения в естественных условиях формируется более или менее случайно, под воздействиями окру­жающей среды, только человек тешит себя иллюзиями, что он является хозяином своей судьбы. Иначе говоря, обстановка поставляет раздражители, которые «высво­бождают» следующую стадию деятельности животно-го. Это в известном отношении философский вопрос — в какой мере мы верим в Планы, которые лежат где-то вне нервной системы. Поэтому, вероятно, мы скажем только, что низшие животные кажутся обладающими больше тактикой, чем стратегией.

По мере продвижения вверх по эволюционной лест-нице мы обнаруживаем на уровне млекопитающих воз­растание сложности проб, которые животное может» произвести. Только у человека мы наблюдаем способность создавать символы и манипулировать ими, и, когда эта способность используется для того, чтобы символически обозначать всю схему действия, для него» становится возможным пользоваться языком, чтобы перестраивать порядок символов и формировать новые Планы. У нас есть все основания считать, что речевые возможности че­ловека интимно связаны с его способностью планировать. А вследствие того что человеческие Планы так часто но­сит словесный характер, они могут сообщаться, что пред­ставляет собой факт огромной важности в эволюции на-шего приспособления друг к другу.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]