Режимы подкрепления

Скорость, с которой оперантное поведение приобретается и сохраняется, зависит от режима применяемого подкрепления.

Режим подкрепления – правило, устанавливающее вероятность, с которой подкрепление будет происходить. Самым простым правилом является предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию. Это называется режимом непрерывного подкрепления и обычно используется на начальном этапе любого оперантного научения, когда организм учится производить правильную реакцию.

Непрерывное и прерывистое подкрепление

Возможны различные режимы подкрепления, но с точки зрения мотивации труда наиболее интересны два основных режима подкрепления:

• режим пропорционального подкрепления. В этом режиме организм подкрепляется по наличию заранее определенного или «постоянного» числа соответствующих реакций. Этот режим является всеобщим в повседневной жизни и ему принадлежит значительная роль в контроле над поведением. Система сдельной оплаты труда основана на режиме пропорционального подкрепления.

• режим временного подкрепления. В этом режиме организм подкрепляется по истечению твердо установленного временного интервала с момента предыдущего подкрепления. Режим временного подкрепления используется при повременной системе оплаты труда.

Получается, можно выдавать вознаграждения за интервалы и цепочки действий. Иногда это явные цепочки действий и фиксированные интервалы (fixed intervals), дающие награду лишь после нужного количества правильных ответов, или по прошествии определенного промежутка времени. Можно так же использовать неявные цепочки и нечетко обозначенные интервалы, в результате которых награда выдается за случайное количество правильных ответов или через неявный промежуток времени (лотерея).

График демонстрирует различие уровней отклика четырех простых сценариев подкреплений. Каждая «засечка» означает момент выдачи подкрепления.

Комбинированные сценарии вознаграждений

Большинство из нас, вероятно, играло по комбинированным сценариям вознаграждений (compound reward schedules), хоть и не отдавало себе в этом отчета. Скажем, вам нужно 100 правых клыков упыря (это для квеста, ладно?). Вначале вы будете находить нужные клыки на одном из трех упырских трупов. Вскоре, однако, клыки станут попадаться лишь раз в две минуты, после чего – только на одном из пяти упырей.

Параллельные сценарии вознаграждений

Как и гейм-дизайн, бихевиоризм приветствует использование параллельных сценариев вознаграждений (concurrent reward schedules). Они дают возможность игроку самостоятельно выбрать, как себя лучше вознаградить. Лучший способ потешить игрока – это угодить ему. У играющих всегда должно быть несколько опций того, как себя стимулировать. Не нагружайте их неприятными ситуациями. Мы и так знакомы с миром, от которого убегаем.

Но во всем нужно знать меру. Это поможет удовольствию время от времени делать передышки,. При хорошо структурированных вознаграждениях становится сложнее контролировать поступки, поскольку наш главный нейрохимический мотиватор, дофамин, связан не столько с удовольствием, но «жаждой поиска».

<<< < Предыдущая 12 / 32 3 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
17.03.201627.67 Mб152Барановский Е.Г., Владиславлева Н.Н. Методы анализа международных конфликтов.doc
#
01.05.2025260.61 Кб5безоп жизедеят.Реф.Зач.БесединГМУРСО.doc
#
01.04.202557.76 Кб3билеты 15-18.docx
#
01.04.2025134.74 Кб3Билеты социология.docx
#
01.04.2025102.91 Кб3билетыГЭК.doc
#
01.05.2025385.54 Кб3бихевиористическая теория скиннера.doc
#
10.08.20192.51 Mб57БЛОК ЧЕЛОВЕК И ОБЩЕСТВО.docx
#
25.11.201963.86 Кб15БУ_задачи_ауд_УП.docx
#
24.11.2019261.12 Кб13В продолжение темы предыдущего занятия.doc
#
01.05.2025128 Кб4Вариант 1-406.doc
#
01.05.2025252.93 Кб3Вариант 2-407.doc