Факторы, изменяющие вероятности.

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный технический университет Украины «Киевский политехнический институт»

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Lektsii_KOS / Тема 6. Лекция.docx

Скачиваний:

Добавлен:

12.05.2015

Размер:

60.74 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 103 4 5 6 7 8 9 10 > Следующая >>>

Факторы, изменяющие вероятности.

Традиционное употребление термина «научение» может быть сохранено для описания перераспределения реакций на классы в сложной ситуации. Терминология, необходимая для описания процесса запечатления, может быть заимствована из теории условных рефлексов И. П. Павлова. Сам Павлов называет все события, которые усиливают поведение «подкреплением» и все возникающие в связи с ним изменения, «обусловливанием». Однако в экспериментах Павлова подкрепление сочетается со стимулом, а при оперантном поведении оно зависит от реакции. Поэтому оперантное подкрепление является специальным процессом и нуждается в специальном анализе. В обоих случаях усиление поведения, происходящее в результате подкрепления, называется «обусловливанием». При оперантном обусловливании мы усиливаем оперант, чтобы увеличить вероятность или частоту появления реакции. В условиях павловского, или «респондентного», обусловливания мы просто повышаем величину реакции, вызванную условным стимулом, и сокращаем время между стимулом и реакцией. Мы уже отмечали, что этими двумя случаями исчерпываются возможности: 1) организм обусловливается, когда подкрепление сопровождает другой стимул или 2) следует за поведением организма. Любое событие, которое не приводит к одному из этих случаев, не влияет на изменение вероятности реакции.

Формальная модель обучающего оператора.

Эдуард Торндайк и Беррес Фредерик Скиннер разработали специфический тип обучения, который был назван оперантным обусловливанием. В отличие от принципа классического обусловливания по И.П. Павлову: Стимул —> Реакция, они разработали принцип оперантного обусловливания: Реакция —> Стимул, согласно которому, поведение контролируется его результатами и последствиями. Исходя из этой формулы, один из возможных путей воздействия на человека - влияние на его результаты, или: подкрепляется то спонтанное поведение, которое признается желательным.

В этой модели главное внимание уделяется последствиям поведения, то есть результатам, к которым приводят определенные виды поведения, а не его предпосылкам. Указанная модель признает активную роль обучающегося в процессе обучения, связанную с его существованием в определенной среде.

Поведение нельзя рассматривать как простое следствие влияния тех или иных раздражителей. Наоборот, оно отражает собственную мотивацию индивида и внешние влияния на его мировосприятие. Оперантное научение можно представить как процесс обучения, основанный на связи: раздражитель --> реакция --> подкрепление, в рамках которой поведение формируется и поддерживается в силу тех или иных его последствий.

Если обучение людей основывается на модели оперантного научения, то его успех или неудачу можно связать со способом закрепления поведенческих рефлексов. Б.Ф. Скиннер определил три таких способа закрепления:

Позитивное подкрепление повышает вероятность повторения реакции (поведения) после предъявления приятного стимула. Например, моральное (похвала) или материальное (премия, продвижение по службе) вознаграждение.
Негативное подкрепление вырабатывает поведение, приводящее к устранению или избежанию неприятного стимула. Например, устранение угрозы или опасности неудачи может способствовать созданию ситуации, в которой обучающиеся готовы идти на риск и делать ошибки для углубленного усвоения материала.
Наказание уменьшает вероятность повторения нежелательного поведения. Например, угроза применения наказания может оказывать сдерживающее влияние и подавлять отдельные виды поведения, отрицательно влияющие на процесс обучения.

В знаменитых опытах Скиннера лабораторная крыса помещалась в пустой ящик с педалью внутри (так называемый "ящик Скиннера") и получала полную свободу действий. В процессе хаотичного исследования ящика крыса неизбежно задевала педаль и получала порцию пищи. После нескольких случайных нажатий на педаль у крысы формировалась новая форма поведения, которая не была связана ни с какими предшествующими стимулами. Теперь, проголодавшись, крыса целенаправлено следовала к педали и, нажав на нее - получала желаемое.

Таким образом, ключевое отличие оперантного обусловливания от классического состоит в том, что в случае оперантного обусловливания живой организм своим поведением активно воздействует на окружающую среду и сталкивается с теми или иными последствиями. В случае формирования условного рефлекса такого воздействия не наблюдается. Животные в опытах Павлова были специально, в целях соблюдения чистоты эксперимента, лишены какой-либо возможности влиять на окружение. В этом смысле оперантное поведение активно и направлено на исследование окружающего мира, респондентное поведение реактивно и лишь следует тем или иным воздействиям, в процессе классического обусловливания, приобретшим для организма определенное сигнальное воздействие.

В теории Б.Ф. Скиннера ключевую роль играет концепция подкрепления поведения человека. Скорость, с которой оперантное поведение приобретается и сохраняется, зависит от правила или режима подкрепления.

Б.Ф. Скиннер выделял три основных режима:

Режим постоянного и регулярного подкрепления.
Режим целенаправленного вариативного подкрепления.
Режим случайного вариативного подкрепления.

Б.Ф. Скиннер также разделял подкрепляющие стимулы на два типа: первичные и вторичные.

Первичное подкрепление дают любые события или объекты, сами по себе обладающие подкрепляющими свойствами (пища, вода, физический комфорт, секс и т. д.).

Вторичное, или условное, подкрепление дают любые события или объекты, которые приобретают свойство подкрепления посредством тесной ассоциации с первичным подкреплением, обусловленным прошлым опытом организма (деньги, внимание, привязанности и т. п.).

Голубь, помещенный в клетку, на полу которой имеется красное пятно, лишь случайным образом может клюнуть в него. Но если сразу вслед за этим он получит пищу - зернышко, то этот оперант (действие в расчете на успех) будет чаще встречаться в будущем. Человек, которого вкусно накормят в одном из ресторанов города, будет чаще ходить в этот ресторан, даже если он довольно далеко расположен от дома. Эту закономерность Скиннер назвал "законом выгоды (приобретения)", иногда его еще называют первым законом оперантного научения.

Закон приобретения означал для Скиннера и его последователей следующее: если перед терапевтом или учителем встает задача сформировать новые привычки, новые образцы поведения, то единственный способ, который дает предсказуемые и надежные результаты, состоит в том, что мы специально создаем позитивные последствия для так называемого "целевого" поведения, т.е. поведения, с которым мы бы хотели чаще встречаться впредь.

Подкрепляя это поведение, мы обязательно добьемся своего: это поведение будет встречаться чаще.

Логичным кажется и другой способ модификации поведения. Многие предполагают, что поведение, которое наказывается, штрафуется, т.е. ведет к последствиям, для индивида неприятным, должно исчезнуть. Этому выводу, однако, Скиннер не нашел подтверждения. С его точки зрения, наказание - довольно спорный способ отучить от нежелательного поведения, поскольку поведение, за которым следуют неприятные последствия, никуда не исчезает, оно лишь видоизменяется самым неожиданным образом. Человек в случае штрафа вынужден искать иные формы поведения, чтобы избежать штрафа. Часто оказывается так, что эти новые формы бывают еще менее желательными, чем те, которые вызвали наказание.

Конечно, человек (или любое другое живое существо) склонен избегать неприятных событий. Это - факт. Однако предсказать, к чему приведут его поиски альтернативных форм поведения - практически невозможно, если только не оказывать ему помощь - не продемонстрировать в явной форме образцы поведения, которые позволят наказания избежать.

И здесь Скиннер еще раз напоминал о том, что предотвращение негативных последствий само вызывает позитивные последствия, т.е. само является подкреплением. И эту форму подкрепления, конечно, можно использовать.

Принципиально в целях изменения поведения можно использовать пять различных типов последствий. Во-первых, это позитивное и негативное подкрепление, которое ведет к укреплению способов поведения, вслед за которыми оно следует. Далее следует позитивное и негативное наказание, ведущее к непредсказуемым последствиям, и игнорирование - то есть абсолютное отсутствие последствий, которое ведет к угасанию поведения и (как мы увидим далее) - к состоянию выученной беспомощности.

<<< < Предыдущая 1 23 / 103 4 5 6 7 8 9 10 > Следующая >>>

Соседние файлы в папке Lektsii_KOS

#
12.05.2015262.65 Кб67Тема 11. Лекция.docx
#
12.05.20151.06 Mб57Тема 2. Лекция.docx
#
12.05.2015186.36 Кб75Тема 3. Лекция.docx
#
12.05.2015246.65 Кб66Тема 4. Лекция.docx
#
12.05.2015100.79 Кб87Тема 5. Лекция.docx
#
12.05.201560.74 Кб71Тема 6. Лекция.docx
#
12.05.201568.5 Кб80Тема 7. Лекция.docx
#
12.05.20151.85 Mб97Тема 8. Лекция.docx
#
12.05.2015106.11 Кб65Тема 9. Лекция.docx

Факторы, изменяющие вероятности.

Формальная модель обучающего оператора.