298
.pdfсобаки к своему хозяину приобретет значимое значение, и станет
более, прочнее |
надежнее и обретет положительный мотив в |
|
стремлении |
выполнять это действие |
в очередной раз. |
Комплексное поощрение в этом случае будет являться таким
событием, |
в |
качестве |
которого |
выступает |
положительное |
|||
подкрепление. |
|
|
|
|
|
|
|
|
Отрицательное |
(негативное) |
подкрепление – это |
||||||
поведение |
направленное |
живым |
организмом, |
на избегание |
||||
любого неприятного |
события. |
Еще |
точнее, |
изменение |
||||
поведения, |
которое направленно на уменьшение |
неприятных |
||||||
ощущений. |
|
|
|
|
|
|
|
|
Отрицательное подкрепление |
не является физическим |
|||||||
наказанием, как мы привыкли его понимать. |
|
|
||||||
Отличие |
отрицательного подкрепления, |
от физического |
||||||
наказания заключается в том, что оно подобно положительному, происходит во время поведения, а не после него и включается за счет изменения поведения.
Например: При обучении собаки двигаться у левой ноги хозяина по команде «Рядом», дрессировщики часто прибегают к болевым воздействиям на собаку с использованием поводка, парфорса или удавки. Если собака двигается на одинаковом уровне со своим хозяином, она поощряется похвалой.
Когда собака тянет вперед, дрессировщик подает команду «Рядом» и прибегает к болевому воздействию. В результате нескольких таких повторений, животное начинает избегать
неприятные |
и |
болевые ощущения. |
Изменяя тем самым свое |
||||
поведение, за счет движения у левой ноги дрессировщика. |
|||||||
Данное |
изменение |
поведения, |
направлено |
на |
избегание |
||
неприятного |
события, |
которое |
выступает |
в |
качестве |
||
отрицательного подкрепления. |
|
|
|
|
|||
Отрицательное (негативное) подкрепление используется в |
|||||||
формировании |
нужного для нас поведения |
так же эффективно, |
|||||
как и положительное. |
|
|
|
|
|
||
Например: |
Если |
собака уклоняется |
и отвлекается от |
||||
рабочего объекта во время поисковой работы, или производит ошибочные (ложные) действия, дрессировщик сразу же старается включить отрицательное подкрепление.
11
При |
|
использовании |
отрицательного |
|
подкрепления, |
|||
дрессировщики |
часто |
ограничиваются |
не |
физическим |
||||
наказанием, |
а |
временной изоляцией собаки |
в |
клетке |
или в |
|||
вольере. |
Ограничивая тем самым, ее в пространстве, обществе, |
|||||||
общении |
со |
своими соплеменниками, |
общении со |
своим |
||||
хозяином, в свободе и т.д. Такой вид подкрепления способствует формированию у собак некоторых, выгодных для нас действий.
То есть |
поведение |
собаки строиться |
за счет того, что |
правильные |
действия |
закрепляются |
положительным |
подкреплением, а ненужные действия сопровождаются отрицательным.
Также в |
|
качестве |
отрицательного |
подкрепления |
дрессировщиками |
используется |
функция публичного «игнора», |
||
по отношению |
к |
нежелательным действиям. |
Которая, как |
|
правило, в конечном итоге будет побуждать животное,
направленно изменять свое поведение. |
|
|
|
||
При |
соблюдении |
выше перечисленных |
правил, |
||
формируется такое поведение, при котором животное |
выделяет |
||||
для себя |
определенные |
выводы, |
и |
стремится |
совершать |
действия, |
которые в последующем доставляют определенный |
||||
комфорт. |
По принципу: |
« Лучше |
я |
выполню определенное |
|
действие, и получу взамен многое!», чем «Ничего не выполню, или, выполню не правильно, и в конечном итоге останусь ни с чем….».
Своевременность подачи и величина подкрепления
Оба вида подкрепления соответствуют одинаковым правилам применения. И ошибка во времени подачи, как одного подкрепления, так и другого не принесет нужных результатов.
Подкрепление должно совершаться в одной связи с действием, которое предполагается видоизменить. Иначе говоря подкрепление является источником информации, потому как положительное подкрепление несет в себе позитивную информацию, а отрицательное подкрепление негативную информацию. С помощью этой информации мы можем говорить собаке то, что именно нам нравиться в ее поведении.
На стадии обучения, для собаки информационное
содержание |
подкрепления становится |
важнее самого |
подкрепления. |
Нельзя забывать, что запоздалое подкрепление |
|
12
является большим недочетом у начинающих дрессировщиков, точно также как и слишком раннее, которое является малоэффективным.
При работе с животным, величина каждого подкрепления должна быть не большой. Чем меньше подкрепление, тем быстрее собака съест его. Это не только будет экономить время, но и позволит делать большее количество повторений за одно упражнение, прежде чем животное насытиться.3
Маленькая величина подкрепления используется на начальных стадиях обучения, в дальнейшем дрессировщик использует получение животным, куша (сюрприза) который в 10 раз больше обычного подкрепления. Это является одним из наиболее полезных приемов пищевого или какого-либо другого комплексного поощрения.
Очень часто, особенно при работе с пищевыми раздражителями, мы подкрепляем нужные действия не в момент его совершения, а уже после того как собака его совершила.
Например: Если, мы приучаем собаку выполнять, определенное действие по команде «Сидеть», то выполнение собакой посадочного действия, нами подкрепляется не в момент его совершения, а уже после того, как она села. Речь идет о своевременности подкрепления нужного действия. Для того чтобы добиться более быстрого понимания, используется – условное подкрепление.
Условное подкрепление – представляет собой изначально ничего незначащий звуковой сигнал (щелчок) – который умышленно в последующем связывается с подачей истинного (натурального) подкрепления. Таким образом, возможность мгновенно подать информацию с помощью звукового сигнала (щелчка) представляет для нас, большую ценность.
Дрессировка с использованием положительного подкрепления всегда должна начинаться с выработки условного подкрепления
По принципу:
3 К. Прайор, « Не рычите на собаку!» книга о дрессировке людей, животных и самого себя.
13
щелчок – лакомство, игрушка; щелчок – лакомство, игрушка и т.д.
В результате этого, прежде чем формировать нужное поведение, мы даем возможность собаке осознать значимость условного подкрепления – сочетая его с пищей, поглаживанием, лаской, игрой и другим истинным подкреплением.
Со временем звуковой сигнал (щелчок) приобретает смысловое значение, и собака начинает реагировать на действие, данного условного подкрепления, после которого обязательно следует истинная награда. После выработки условного подкрепления, у нас в руках оказывается реальная возможность, доносить до собаки то, что нас больше всего интересует.
14
3. Понятие об оперантной дрессировке с использованием кликер-тренинга. Формы научения
Оперантная дрессировка с использованием кликер-тренинга
является общим составляющим |
в дрессировочном процессе, |
в |
||||||||||
основе которой заложен оперантный метод обучения. |
|
|
||||||||||
Под |
|
оперантным |
обучением |
|
понимается |
|||||||
целенаправленный |
отбор |
дрессировщиком |
тех или |
иных |
||||||||
желательных |
действий |
животного, |
за |
счет |
использования |
|||||||
положительного |
и |
отрицательного |
подкрепляющего |
|||||||||
воздействия. |
Причем |
желательные или нежелательные действия |
||||||||||
подкрепляются |
немедленно, а |
сформированный |
навык |
в |
||||||||
дальнейшем |
|
подводится |
под |
стимульный |
контроль. |
|||||||
Стимульный |
контроль означает, |
что |
на определенной стадии |
|||||||||
обучения |
используемая |
|
команда |
запускает |
навык, |
или |
||||||
санкционирует его выполнение. |
|
|
|
|
|
|
|
|||||
Эффективность |
обучения с |
использованием |
оперантного |
|||||||||
метода дрессировки, заключается |
не только в том, что животное |
|||||||||||
само стремится совершить |
|
какое – либо действие. |
Но и в том, |
|||||||||
что подкрепление – |
это |
|
не просто |
событие, |
|
связанное |
с |
|||||
последующей подачей какого – либо звукового сигнала, а
событие – всегда приводящее к удовлетворению |
доминирующей |
||
потребности. |
|
|
|
Оперантное |
обучение |
основано на |
положительном |
подкреплении. Оно учит собаку |
« работать, чтобы заслужить » |
||
награду за совершение определенного действия, без малейшего негативного оттенка.
Другими словами, дрессировщик не реагирует наказанием на то, что собака не выполнила действие. Он просто положительно реагирует на нужное действие, когда оно случается. Сначала это действие будет происходить случайно. Но, поскольку это действие приносит поощрение, приятное собаке, она будет выполнять его снова и снова. Со временем
собака будет обобщать полученный урок. |
Она |
начинает |
осознавать, что у нее появляется возможность |
влиять на |
|
происходящее: « Если сделать все правильно - |
то с тобой будут |
|
происходить хорошие вещи ». |
|
|
15
В современной дрессировке выделяют две формы научения:
-формирование навыка на основе классического условного рефлекса, т.е. на основе реактивного поведения;
-формирование навыка на основе оперантного (свободного) поведения.
Главное их отличие в том, что при формировании классического условного рефлекса сначала следует стимул, а точнее сказать происходит стимулирование, а уж потом следует реакция, или же говоря проще, происходит ответное действие организма.
Например: Если, мы обучаем собаку команде «Сидеть», то сначала следует команда «Сидеть», затем собаку слегка тянут вверх за поводок, одновременно надавливая на круп, и после того как собака села, ей дают вознаграждение. Собака садится, но
ктому времени, когда хозяин произносит ей команду, «Хорошо», она уже занята другими делами, часто не успевая связать нужное действие с похвалой.
При |
формировании |
навыка |
на |
основе |
оперантного |
поведения |
сначала происходит действие, |
а уж потом следует |
|||
стимулирование, т.е. дача стимула. |
|
|
|
||
Например: Если, мы обучаем собаку той же команде, то во |
|||||
время внимательного наблюдения |
за ней, она |
обязательно в |
|||
какой - то момент сядет, и после чего сразу же последует условное звуковое подкрепление (щелчок) в следствии которого обязательно последует натуральное подкрепление. По мере выработки уверенного выполнения данного действия, вводится команда «Сидеть».
Здесь есть несколько моментов, которые необходимо учитывать:
1.Невозможно подкрепить то поведение, которое не встречается в обычной жизни, т.е. нет собаки, которая не умела, бы сидеть, лежать или вставать самопроизвольно.
2.Подкрепление, изменяет поведение только тогда, когда подается в правильно выбранный момент, т.е. немедленно после выполнения, а лучше во время его выполнения.
3.Оперантный метод обучения – превращает урок в игру, и животное обучается не только потому, что его заставляют или
16
дают за это пищу, но и за интерес, за удовольствие. Данный метод интересен еще и тем, что применять его можно, как к молодым, так и ко взрослым собакам, и хотя времени на
обучение может понадобиться |
чуть больше, но успех все равно |
|||||
будет достигнут4. |
|
|
|
|
|
|
Метод |
кликер-тренинга |
был разработан |
американским |
|||
биологом Карен Прайор, в нем |
используется звуковой сигнал |
|||||
(щелчок) |
кликера, |
действие |
которого |
более, |
лучше |
|
распознается |
слуховыми |
анализаторами |
животного, чем |
|||
голосовые команды подаваемые нами. С помощью данного звукового сигнала (щелчка) удается более точно фиксировать нужные действия животного. Таким образом, звуковой сигнал (щелчок) является, как бы переводчиком с человеческого языка на собачий.
Методика оперантного метода обучения, при которой животному позволяют совершать различные действия, нужные из которых подкрепляют. Эта методика дрессировки может быть основана на любой потребности, выбор которой определяется индивидуальными особенностями животного.
Например: Для одной собаки при отработке навыков можно применять пищевую потребность, для другой эффективнее будет использование игровой потребности и т.д.
Давайте рассмотрим, какое подкрепление более желательно во время дрессировки применительно к служебным собакам. Учитывая то, что если у собаки доминирующая реакция поведения является игровой, то частое использование игрового вида подкрепления, будет приводить к ее сильному перевозбужденному состоянию, что будет препятствовать дальнейшему формированию нужного поведения. Задача каждого дрессировщика, во время дрессировки создать уравновешенное и сбалансированное поведение у животного, с целью дальнейшего его успешного управления.
На начальном этапе дрессировки в подавляющем большинстве, более желательно применение пищевого вида
4 Мак – Фарленд Д. Поведение животных. : Психобиология, этология, и эволюция.
17
подкрепления, которое, будет создавать соответствующий баланс.
Пищевое подкрепление на начальном этапе дрессировки является основным, потому что пищевая реакция – это врожденное поведение. Игровое подкрепление используется в качестве дополняющего комплексного воздействия на животное, учитывая его индивидуальные особенности. Учитывая
эти особенности, пищевое и |
игровое подкрепление могут |
|||
использоваться как в комплексе, так и раздельно. |
|
|||
Эти два |
вида подкрепления образуют |
ассоциативно |
– |
|
побудительное |
воздействие, |
которое |
основывается |
на |
способности собак к ассоциативному мышлению и побуждению ее к выполнению нужных дрессировщику действий, в ходе которого собака получает ассоциативный опыт.
Характеристика оперантного метода дрессировки:
- высокая скорость обучения, которая достигается за счет возможности поощрять собаку точно в момент, когда она делает то, что мы от нее хотим, путем использования звукового сигнала, т.е. за счет своевременного информирования;
- высокая заинтересованность собаки в работе, т.е. используя, условное звуковое подкрепление, собака очень быстро понимает – что от нее хотят. А когда, имеет место
полного взаимопонимания, тут и появляется |
полная |
заинтересованность в совместной работе; |
|
-высокая запоминаемость изученных навыков, секрет – прост, собаки легко запоминают и охотнее делают то, до чего додумались сами. Потому что, кликер - дрессировка основана на минимальном воздействии на собаку. Допускается лишь наведение указкой, или лакомством, но идеальный вариант, это полное отсутствие подсказок со стороны человека;
-отсутствие наказания в том виде, как мы привыкли его
понимать. Неправильные и нежелательные действия искореняются, используя отрицательное подкрепление (игнор).
- собака легко учится работать на расстоянии от человека (отработка выдержки и т.д.), это означает, что свой желанный кусок, она однозначно получит, и ей нет нужды гипнотизировать хозяйский карман.
18
Очень часто, у многих дрессировщиков возникает вопрос,
а как быть, если при себе не оказалось кликера |
во время работы |
|
со своей собакой. |
|
|
Мы начинаем с кликера и лакомства, |
что |
является |
отличным приспособлением, с помощью которых собаку можно научить многому.
И после того, как она научится понимать, какого действия мы от нее хотим, мы можем заменить щелчок – словом, а лакомство – лаской.
Слово и ласка, у нас всегда при себе. Главное, что собака к этому времени уже умеет и охотно выполняет нужное для нас действие, или какой – либо сложный навык.
19
4. Схема кликер-тренинга
Схема 1.
Значение |
Звук |
сигнала |
сигнала |
Положительное |
|
|
|
Оперантный |
|
подкрепление |
|
|
|
метод научения |
|
|
|
|
|
|
|
Кликер-тренинг
|
|
Обучение |
|
|
новому |
|
|
поведению. |
|
|
Повышение |
Обуславливание |
|
|
|
критериев |
|
сигнала |
|
|
|
|
|
|
|
|
|
|
|
Вариабельное |
|
Включение |
подкрепление |
|
поведения в |
|
|
репертуар |
|
|
|
Усложнение, |
|
|
включение |
|
Совершенствование |
отвлечений |
|
навыка |
|
|
|
|
|
|
Сигнал
Выработка
правильных
иерархических отношений в «стае» человек-собака
Окончание
повышения
критериев
Взятие поведения под стимульный
Переход к очень редкому вариабельному подкреплению
20
