Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Общие вопросы дрессировки.doc
Скачиваний:
7
Добавлен:
04.05.2019
Размер:
671.74 Кб
Скачать

Методы дрессировки

За годы Советской власти у нас развивалось только одно направление в дрессировке, основанное на методе контрастной дрессировки. Поэтому при переходе на работу с курсами IPO и SchH даже у опытных инструкторов возникают сложности. Поскольку отличия IPO и SchH незначительны, мы будем рассматривать только SchH, подразумевая, что все сказанное о SchH относится и к IPO.

Известно несколько направлений в дрессировке.

  • Механическая дрессировка

Она основана на нанесении животному болевых (механических) воздействий. С помощью этих воздействий у животных вызываются нужные для дрессировщика действия. Если животное совершает требуемое движения, она не получает болевого воздействия, если не совершает - наказывается болью (отрицательное подкрепление).

  • Вкусопоощрительная дрессировка (метод Дурова)

Она основана на применении положительного подкрепления. С помощью лакомства от животного добиваются нужного движения (жестикуляция). Вводится условный сигнал (команда). Если животное ее выполняет, оно получает лакомство, не выполняет - не получает.

  • Метод ограничения возможности ошибаться и повторений (полицейская школа дрессировки)

В начале века в российской полиции при работе с собаками не применяли ни болевые воздействия, ни пищевые. Дрессировка сводилась к выработке у собаки определенных стереотипов или привычек. Например, при обучении команды "рядом" собаку водили на коротком поводке вдоль стены, препятствующей ей отходить в сторону от дрессировщика. Многократные повторения вырабатывали у собаки привычку держаться на определенном месте около дрессировщика. В качестве положительного подкрепления полицейские использовали похвалу, одобрительные слова. С физиологической точки зрения этот метод основан на образования временной связи.

  • Контрастная дрессировка

В ней используются элементы первых трех методик. С помощью механического воздействия, болевого или не болевого, или с помощью дразнения лакомством от собаки добиваются нужного действия. Если по команде собака совершает это действие - она получает положительное подкрепление лакомство, если не совершает - отрицательное подкрепление болью или принуждением.

Эти четыре метода достаточно хорошо известны в нашей стране, их довольно успешно применяли дрессировщики ДОССАФ, о них написаны пособия. На них нет смысла нам останавливаться. К сожалению, новые методы и подходы, применяемые во многих развитых странах и дающие дрессировщику дополнительные возможности, у нас практически не известны. Незнание этих методов и вызывает у даже опытных дрессировщиков трудности при обучении собак новым курсам дрессировки.

Теория подкрепления

Самой интересной для нас теорией обучения является теория подкрепления, разработанная профессором Гарвардского университета Б. Скиннером. Иначе она называется бихевиоризмом, модификацией поведения, психологией поведения, теорией подкрепления и т.д. Эта область психологии сейчас бурно прогрессирует. Именно на ее основе разработаны программы компьютерного обучения и аутотренинга, доказавшие свою высокую эффективность. В ней обучаемый является не только объектом применения своих сил обучающего, но и самостоятельной значимой величиной, принимающий в процессе обучения самое деятельное участие. В России была издана книга К. Прайор "Не рычите на собаку!", в которой эта теория очень подробно описывается.

Подкрепление

Положительное подкрепление (ПП)- это событие, совпадающее с каким-либо действием и ведущее к увеличению вероятности совершения этого действия.

Таким событием может быть не только дача лакомства, но любое, доставляющее удовольствие обучаемому. Самое главное здесь - то, что нельзя подкрепить поведение, которое не встречается.

Например, требуется добиться, чтобы какой-то человек вам почаще звонил (дети, родители, друзья). Необходимо сделать так, чтобы каждый телефонный разговор с вами был ему приятен. Кто любит посплетничать - должен услышать последние новости из жизни знакомых, кто любит слушать себя - получить внимание и интерес собеседника. Если же позвонивший услышит упреки, что он так долго не звонил, его желание набрать ваш номер следующий раз появится нескоро.

Подкрепление не является абсолютным. То, что нравится одному, то может быть неприятно другому. Сытому безразлично предложенное угощение. Дрессировщик должен иметь очень широкий спектр ПП, от ласки и похвалы до лакомства и игры.

Отрицательное подкрепление (ОП) - то, что субъект старается избежать.

Оно может иметь градацию от очень сильных (удар электротоком) до слабых (сквозняк).

Отрицательное подкрепление имеет принципиальное отличие от наказания. Наказание следует после совершения проступка и не может уже его изменить. ОП может остановить ненужное действие или даже не допустить его.

При обучении львиная доля успеха зависит от верного времени подачи подкрепления. Если подкрепление запаздывает, то оно часто становится подкреплением не нужному действию, а уже совершенно другому. Например, дрессировщик дал команду "Сидеть!". Собака села. Он полез в карман за лакомством. Собака вскочила. Если он дает лакомство в это момент, он подкрепляет не посадку собаки, а ее вскакивание.

Если подкрепление дается слишком рано, до завершения необходимого действия, то тем самым подкрепляется его несовершение.

Например, дрессировщик дает лакомство, когда собака не успела зафиксировать посадку. Этим он увеличивает вероятность, что по команде "Сидеть!" собака будет присаживаться, вскакивать, но так и не сядет.

Не вовремя поданное подкрепление не только не несет полезной информации, но и, напротив, дезинформирует объект обучения. Если отработка какого-нибудь приема не получается, надо спросить себя: "А что же я собственно подкрепляю?" и тогда ошибка становится понятной.

Для повышения точности времени дачи подкрепления было введено условное подкрепление. Это понятие совершенно неизвестно для дрессировщиков, которые воспитаны в школе ДОСААФ. Именно использование условного подкрепления позволяет достичь успеха там, где оказываются бесполезными старые методики.

При работе с пищевым подкреплением очень часто возникает ситуация, что его невозможно дать в тот момент, когда это нужно. Например, невозможно поощрить лакомством собаку в момент выполнения ей команды "Вперед!". Она получает положительное подкрепление уже после остановки. Т.е. подкрепляется сама остановка. Кстати, именно обучение этой команде в SchH вызывает огромные трудности у наших дрессировщиков.

Кроме того, очень часто мы требуем выполнения от собаки достаточно сложного действия, включающего несколько компонентов. Подкрепляя все действия в целом, мы не даем животному информации, какой компонент нас устраивает, какой нет.

Например, при высылке собаки вперед мы требуем, чтобы она: а) бежала по прямой, б) не останавливалась без команды, в) бежала быстро. Введение условного подкрепления может помочь обойти многие трудности.

Условное подкрепление - изначально нейтральный сигнал (звук, свет, движение), который умышленно связывают с подачей подкрепления. Наиболее удобно использование свистка.

В жизни у людей очень много условных подкреплений. Для многих приятен звук телефонного звонка (вдруг звонит старый друг), приятно видеть заваленный письмами почтовый ящик. И хотя не все звонки и письма доставляют удовольствие, ассоциации с ними связаны очень хорошие.

Таким же условным подкреплением являются деньги. На самом деле, деньги обозначают только то, что на них можно купить - пищу, вещи, обслуживание. Многие богатые люди, имеющие денег больше, чем могут потратить, продолжают работать, хотя деньги уже, казалось бы, им не нужны. Для них условное подкрепление (получение денег) стало значимее реальных благ (полноценный отдых, крепкий сон).

Практическую дрессировку собак с использованием положительного подкрепления почти всегда следует начинать с выработки условного подкрепления. Дрессировщик учит животное понимать значимость условного подкрепления, сочетая его с пищей, поглаживанием, отдыхом, игрой и т.д. Чем с большим числом приятных вещей сочетается условный стимул, тем действеннее он работает.

После выработки условного подкрепления в руках дрессировщика появляется реальный способ общения с собакой, возможность передать свои желания. Условное подкрепление приобретает очень большую значимость. Важна сама информация одобрения действия животного, она необязательно должна сопровождаться безусловным подкреплением.

Нельзя разбрасываться дачей условного подкрепления, иначе оно перестанет работать. Фальшивая или незначимая награда теряет всякую силу в качестве условного подкрепления.

Можно выработать и отрицательное условное подкрепление. Например, им пользовался Владимир Дуров, останавливая неправильные действия своих воспитанников тихим "тсс!".

Режимы подкрепления

После того, как какой-то навык уже сформировался, дрессировщик уже не должен подкреплять каждый раз выполнение команды. Наоборот, гораздо полезнее подкреплять в непредсказуемом (вариабельном) режиме.

Низковероятностный режим подкрепления намного эффективнее подкрепления каждого правильного действия. Очень хорошим жизненным примером являются игральные автоматы. Азартный человек может провести с ними целый день в надежде получить выигрыш. В то же время, этого же человека вряд ли увлечет возможность получить строго определенную сумму денег, если он 8 часов будет нажимать на кнопки автомата. Да, это будет зарабатыванием денег, но каким нудным способом!

Если дрессировщик станет подкреплять только самые четкие выполнения его команд, собака начнет стараться, пытаться отгадать, что от нее требует хозяин. Этот интерес - мощный стимул желания собаки работать. Ведь, в конце концов, вне зависимости от ее успехов, ее владелец все равно накормит. Чем длительнее интервалы между подкреплениями, тем эффективнее работает вариабельный режим, тем сильнее он стимулирует поиск правильного решения.

Именно поэтому так трудно угасить нежелательное поведение, например, поедание на улице корма. Если даже в 1 случае из 10 собаке удается безнаказанно сожрать его, не получив от хозяина трепки, она будет все время пытаться незаметно сделать это, а вдруг опять повезет!

Выработка навыка методом формирования поведения

Чтобы живое существо, человек или собака, не делало бы, оно это делает не всегда одинаково. Таким образом, формировать поведение можно, подкрепляя те действия животного, которые наиболее близки к требуемым. К. Прайор сформулировала 10 правил выработки, которые необходимо соблюдать.

  1. Критерий дачи подкрепления повышается медленно.

  2. В конкретный промежуток времени выработка идет только по одному критерию.

  3. Критерий повышается или вводится новый только после перехода на вариабельный режем подкрепления.

  4. После введения нового критерия требования по старым критериям уменьшаются.

  5. Дрессировщик должен быть готовым к неожиданно быстрой выработке.

  6. Одному и тому же навыку не могут одновременно обучать разные дрессировщики.

  7. Если одна процедура выработки не приносит успеха, нужно попробовать другую.

  8. Дрессировщик уделяет все свое внимание собаке до конца занятия.

  9. Если навык начал ухудшаться, необходимо вернуться на более ранние стадии обучения.

  10. Занятие заканчивается на "высокой ноте".

Теперь более подробно о каждом правиле.