Пять основных ошибок при дрессировке собак на положительном подкреплении

Вы никогда не услышите от меня, что принудительные методы дрессировки собак не работают, они работают. Так же вы не услышите от меня, что поощрительные методы сделают из любой собаки образцовую собаку-компаньона. Нет, это не так.

Однако существует большая разница между поощрительным и принудительным методом воспитания. В случае если метод, опирающийся на применение силы, не приносит результата, то, скорее всего, это связано с тем, что собака не способна терпеть физическое давление и устрашение. Это может привести к долгосрочным серьезным проблемам в поведении животного и иногда к физическим повреждениям у собаки.

Собаки с более напористым характером могут настойчиво сопротивляться принудительным методам дрессировки. В то время как те, чей характер мягче, чтобы вытерпеть физические наказания, могут укусить из оборонительных целей или просто полностью закрыться. Поощрительный метод дрессировки часто оказывается неудачным из-за ошибок, возникающих при его реализации. Если вы неправильно пользуетесь кликером и поощрениями, то в результате вы можете получить толстую, счастливую и неконтролируемую собаку, но у вас гораздо меньше шансов нанести ей психический и физиологический ущерб.

Целью, конечно, остаётся здоровая, счастливая и послушная собака. Для того чтобы добиться такого результата поощрительными методами дрессировки, вы стоит избегать типичных ошибок, описанных ниже.

Ошибка №1: путать положительное подкрепление и вседозволенность

Скорее всего, вы слышали, что тренера, использующие отрицательное подкрепление, настаивают на том, что должны быть негативные последствия за неприемлемое поведение, а иначе животное никогда не поймёт, что ему дозволено. Вы удивитесь, когда узнаете, что сторонники положительного подкрепления не спорят с этим. Дело в том, что мы по-разному понимаем последствия этого. Хорошо реализованная программа поощрительной дрессировки совмещает правильный менеджмент ситуаций — чтобы не дать собаке возможность получить подкрепление нежелательного поведения и негативное наказание – когда неприемлемое поведение собаки приводит к прекращению каких-то хороших вещей.

Посмотрите эти примеры:

Принудительный/силовой — собака на поводке, собирается прыгнуть на прохожего. Хендлер жёстко корректирует (наказывает) ее, резко дернув за поводок. Прыжок наказывается. Собака запоминает, что происходит что-то плохое, когда она пытается на кого-то прыгнуть. Стоит отметить, что собака может так же запомнить, что сам факт приближения к человеку может вызывать негативные последствия, что ведёт к формированию агрессивного или боязливого поведения в присутствии незнакомцев.

Позитивный — собака на поводке, собирается прыгнуть на прохожего. Хендлер удерживает собаку так, что она не имеет возможности приблизиться к человеку. Просит прохожего остановиться и подождать, пока собака сядет и уже потом разрешает ее погладить. Действие собаки было проконтролировано, собака запоминает, что от прыжка на прохожего она ничего не получает, а вот если она сядет рядом с человеком, то это приведет к хорошим последствия. Так закладываются основы для будущих хороших манер и умения вежливо знакомиться с посторонними.

Вседозволенный – собака на поводке, собирается прыгнуть на прохожего. Хендлер позволяет собаке исполнить её желание, и прохожий награждает её поглаживанием. Поведение подкрепляется. Собака запоминает, что прыжки приносят приятные эмоции и продолжает прыгать на гостей, приходящих в дом, иногда даже усиливая свои попытки прыгнуть на человека.

Менеджмент ситуаций играет жизненно важную роль в положительном (а не вседозволенном!) методе дрессировки. Не давая собаке получить награду за нежелательное поведение, вы не даете собаке самоподкрепляться в этих ситуациях. Это работает, когда вы пресекаете прыжки собаки на прохожих, закрываете её в клетке, чтобы не дать ей разгромить дом в ваше отсутствие, убираете всё съедобное со стола, чтобы собака не училась проверять поверхности на предмет вкусных «подарочков», убираете привлекательные предметы из зоны доступа, чтобы собака не могла их сгрызть и много других вариантов, где вы можете использовать менеджмент ситуаций.

Поведение, которое никак не подкрепляется, в конечном итоге исчезает. Особенно, если вы делаете упор на поощрении альтернативного, желательно несовместимого с первым, поведения.

Ошибка №2: зависимость от наведения

Если вы не убежденный приверженец шейпинга (метод обучения через отбор поведения), то вы, скорее всего, используете наведение при работе с положительным подкреплением.

В наведение используются лакомства, чтобы показать собаке, что вы хотите, чтобы она сделала. Чтобы навести собаку на команду «лежать», держите лакомство прямо перед носом собаки, пока она сидит, затем начните потихоньку опускать его вниз. Как только собачий нос потянется за лакомым кусочком, обозначьте это действие щелчком с помощью кликера либо голосом, например «да», и наградите лакомством.

Продолжайте постепенно опускать лакомство на пол, хвалить и поглаживать собаку, пока она лежит на полу. Если вдруг собака встанет, скажите «нет», усадите собаку и начните наводить заново, но на этот раз опускайте лакомство не так быстро.

Наведение для обучения новому поведению – это хорошо. А вот забывать постепенно убирать наведение – это нехорошо. Если вы не начнете достаточно быстро убирать наведение во время обучения навыку, поведение вашей собаки может стать зависимым от наличия лакомства в вашей руке. Несмотря на то, что у меня почти всегда есть лакомство в кармане или где-то поблизости, я не хочу, чтобы моя собака показывала нужный навык, основываясь только на знании, что лакомство у меня с собой.

Здесь описано как постепенно отойти от наведения на примере команды «лежать»:

  1. Применяйте наведение до тех пор, пока собака не станет выполнять команду без особого труда — когда вы опускаете корм вниз, собака ложиться сразу и получает лакомство. Для большинства собак шести повторений бывает достаточно.
  2. Встаньте перед собакой, держите руки по бокам от себя. Лакомство держите в руке, которую вы используете для наведения. Если собака пытается достать лакомство из руки, спрячьте её за спину.
  3. Как только собака сядет, дайте команду «лежать».
  4. Подождите немного, и, если собака не ляжет (что происходит в большинстве случаев), наведите собаку лакомством в нужное положение.
  5. Повторите 3 и 4 шаги несколько раз. Иногда ждите чуть-чуть дольше, прежде чем начать наводить, иногда начинайте раньше.
  6. Если собака не ложится после шести повторений, начните постепенно убирать наведение. Скомандуйте «лежать», пауза, начните наводить собаку, но вместо полного движения рукой до пола, проведите ¾ пути и быстро спрячьте руку за спину, ведя ее параллельно полу (если вы поднимете руку, то собака, скорее всего, снова сядет). Поскольку собака проделала ¾ пути до пола, то вероятнее всего, она продолжит движение и ляжет, несмотря на то, что лакомства уже нет. Если собака всё же встала, то попробуйте проделать то же самое, но провести куском 7/8 пути до пола.
  7. Повторяйте шаг 6, постепенно уменьшая наведение к полу, пока оно совсем не исчезнет.
Вы можете применить этот алгоритм к любым другим командам, которые можно научить наведением. Как только собака начнёт быстро выполнять их с наведением, сразу же начинайте наведение уменьшать. По сути, вы переводчик для вашей собаки, вы показываете ей, что слова, которые вы используете – это эквивалент наведению. Когда вы даёте команду «лежать», делаете паузу и затем наводите, это равнозначно тому, как если бы вы сказали: «Собака, слово «лежать» значит то же, что и кусок перед твоим носом, который опускается на пол, а ты следуешь за ним».

Ошибка №3: зависимость от поощрения

Даже если у вас хорошо получается уходить от наведения, вы все равно можете замечать за собой, что не можете отказаться от постоянной выдачи лакомства – вам кажется, что вы обязаны поощрять собаку каждый раз, когда собака демонстрирует нужное поведение, а иначе оно может угаснуть.

Такая ситуация называется непрерывное подкрепление. Собака может достигнуть таким способом великолепного стабильного поведения, но это поведение скорее всего не будет достаточно длительным . Если по каким-то причинам вы перестанете поощрять каждый раз, когда собака демонстрирует поведение, скорее всего собака достаточно быстро перестанет показывать нужное поведение, поскольку она перестает получать первичное подкрепление (еду).

Примените очень важный концепт вариативного подкрепления. Когда ваша собака стабильно выполняет команды на непрерывном подкреплении – демонстрирует желаемое поведение как минимум в 8 из 10 случаев, то пора начинать поощрять с перерывами. Проще говоря, время от времени пропускайте момент клика и лакомства, вместо этого хвалите собаку. По началу, пропускайте щелчки лишь изредка, постепенно начиная пропускать всё больше и больше, до тех пор, пока собака не начнет работать в основном за похвалу (или другие социальные поощрения).

Если вы постоянно включаете похвалу в ваш дрессировочный процесс — клик, лакомство, «хорошая собака!», тогда у вашей собаки выработаются позитивные ассоциации с похвалой, и она будет ценна для собаки, даже когда вы станете работать без кликов и лакомства.

Напоминаю: в моих дрессировочных сессиях, кликер всегда значит, что потом последует лакомство. Когда я начинаю внедрять вариативное подкрепление, то я перестаю кликать, а только хвалю. Это помогает сохранить ценность и силу кликера.

Вы можете использовать другие поощрения, когда хотите поощрить животное без кликера и лакомства. Все, что ваша собака любит, может использоваться для мотивации, особенно если вы можете контролировать доступ собаки к предмету и применять его в поощрении правильного поведения. Это могут быть: мячик, любимая игрушка, прогулка на машине, на поводке или почесывание за ухом.

Иногда, я поощряю своих собак за ожидание перед дверью, открывая дверь и разрешая им выбежать из нее. Они срываются с места и бегут играть и делать свои дела. Все это тоже варианты социальных поощрений, которые подкрепляют собак естественным путём.

Конечно, они не всегда получают возможность выскочить в дверь. Вариативное поощрение делает поведение очень длительным. Как игроман с автоматами, ваша собака будет играть бесконечно, потому что она знает, что однажды получит награду.

Ошибка №4: несвоевременность

Некоторые дрессировщики скажут вам, что последствия должны последовать за действием в течение какого-то определенного промежутка времени, чтобы они повлияли на действие, т.е. чтобы собака поняла связь между поступком и наградой (наказанием). Я слышала, что кто-то называет цифру в 5 секунд (на мой взгляд, это слишком долго), кто-то говорит про 1 секунду (по-моему, это более верная цифра).

Достаточно сказать, что результат тем лучше, чем ближе последствия к самому действию по времени. Это одинаково верно и для положительного подкрепления (лакомство, похвала, игрушка, поглаживание) и для негативного наказания (когда поведение собаки приводит к тому, что хорошие вещи уходят) или для положительного наказания (когда поведение собаки приводит к тому, что плохие вещи начинаются). Конечно, тренеры работающие на положительном подкреплении стараются избегать использования положительного наказания.

Наибольшая польза от маркера поощрения, например, щелчка кликера или слова «да» — это точный тайминг. С маркером у вас идеальный или почти идеальный тайминг отметки правильного поведения. Маркер — это как мостик между командой и лакомством. Как только произошло поведение, вы должны отметить его щелчком, а потом у вас есть несколько секунд, чтобы спокойно достать лакомство и дать его собаке.

Если у вас плохо с таймингом и вы постоянно запаздываете с кликом, вы можете непроизвольно, но постоянно подкреплять не то поведение, которого вы добивались от вашего подопечного. В лучшем случае это введет собаку в заблуждение, замедлит процесс обучения и расстроит вас обоих. В худшем – вы спровоцируете прямо противоположное поведение, все это закончится переучиванием или даже устранением нежелательного поведения.

Давайте представим, что вы обучаете собаку вежливо приветствовать гостей, выполняя команду «сидеть». Когда к вам приходят гости, собака у вас на поводке, чтобы вы могли предотвратить прыжки. Когда к вам заходит гость, собака идеально выполняет команду «сидеть» на входном коврике. Вы нажимаете на кликер, но пока вы нажимаете, собака успела подумать, что хвалить ее никто не планирует и как раз прыгает на тетушку Марту. Клик, ой! Конечно, вы не совершили никакой глобальной ошибки (если тете Марте не 90 лет и у нее не сломалось ребро от прыжка собаки). Но каждый раз, когда вы запаздываете с маркером, и даете его, когда ваша собака уже прыгает на гостя, а не сидит на выдержке, вы тем самым говорите собаке, что запрыгивать это хорошо, это поведение приводит к поощрению.

В данной ситуации есть преимущество у голосового маркера – слово «да» или щелчок языком. Если вы застигнуты врасплох и у вас нет кликера, то просто промаркируйте поведение голосом и подкрепите его лакомством, который наверняка лежит у вас в кармане.

Если вы поняли, что опаздываете со щелчком, даже когда кликер у вас наготове в руке, то вам нужно попрактиковаться с таймингом. Когда рядом нет вашей собаки (и она не может вас слышать), включите телевизор на спортивном канале и найдите теннисный матч. Смотрите внимательно. Каждый раз, когда теннисист отбивает мяч, нажимайте на кликер. Как только вы заметите, что ваш клик точно совпадает с ударом по мячу, вы можете приступать к дрессировке. (Заметим: такой вид отработки реакции не эффективен с гольфом и бейсболом.)
Ошибка № 5: неуверенность в своих убеждениях
Если вы дрессируете собаку, а эффекта не видно, то вам может показаться, что сойти с пути будет лучше. Всегда найдутся друзья, единомышленники, семья и другие профессионалы, готовые с радостью указать на ваши ошибки, и посоветуют применить жесткие меры, припугнуть или хорошенько одернуть вашу непослушную собаку, чтобы заставить ее подчиняться.

Возможно вы тренер, который уходит от применения наказания в обучении, но ваш предыдущий успех в применении силовых методов постоянно нашептывает вам: «я мог бы дернуть за поводок разочек!»

СТОП!

Основная вещь, которую мы так ценим в положительной дрессировке – это доверие, которое вырастает между человеком и собакой. Ваша собака верит, что может пробовать разные варианты поведения, и они не приведут к боли. Вы дадите ей понять, когда она права, и не напугаете и не побьете ее, если она ошиблась. Когда вы разрушаете доверие, вы рискуете получить негативные поведенческие последствия, иногда очень значительные — от агрессии с одной стороны, до отказа от работы или выученной беспомощности с другой.

Когда собака становится агрессивной, ее будущее ставится под сомнение. Когда собака отказывается работать, и вообще теряет какое-либо желание, т.к. боится наказания, то дрессировка становится сплошным расстройством.

Использование принуждения одновременно с положительным подкреплением так же имеет очень серьезные последствия. Если вы наказываете собаку за невыполнение команды, которые вы считает она «знает», то вы «отравляете» команду, другими словами, наделяете команду плохими ассоциациями. Команда становится двусмысленной: животное не понимает, что она несет в себе – положительные вещи (клик и лакомство) или отрицательные (наказание). Двусмысленность порождает стресс и превращает счастливую собаку в собаку с поджатым хвостом, а энтузиазм ее совсем куда-то исчезает.

«Отравленную» команда сложно, а иногда и невозможно, восстановить. Если вы все-таки «испортили» команду, то лучше ввести новую, чем пытаться восстановить старую.

У вас всегда есть выбор, как вести себя с собакой. Один из моментов, который мне очень нравится в позитивном методе дрессировки, это множество возможностей для закрепления команд без принуждения и запугивания. Применение силы в таком методе пагубно скажется на последующих тренировках, так же как и отсутствия творческого подхода.

На недавнем семинаре, хозяин одного милого бернского зенненхунда признался мне, что ему «приходится» использовать принудительную апортировку (с щипком за ухо), хотя во всех остальных моментах он использует положительное подкрепление. Я вежливо предположила, что он не «вынужден» использовать такой метод, но захотел использовать его. Я не удивилась, когда мы начали шейпинг упражнения (когда собака предлагает разные варианты поведения), берн сел у ноги владельца, неуверенно глядя ему в глаза, не предлагая никаких вариантов поведений, в то время как остальные собаки в паре с хендлерами были увлечены шейпинг играми. Выбор хозяина зенненхунда в корне влиял на собаку и их отношения.

Положительные методы дрессировки работают. Если вы привержены положительным методам дрессировки, то вы найдете способ научить собаку апортировке, не щипая ее за ухо. Существует огромное множество прекрасных книг, видео, дрессировщиков и веб-сайтов, которые готовы помочь вам в решении ваших дрессировочных проблем. Вы можете также решить, что апортировка не стоит того, чтобы становится жестоким, лучше найти другой вариант совместного времяпрепровождения с собакой. Это ваш выбор. Делайте его с умом.
Пет Миллер, CBCC-KA, CPDT-KA, редактор журнала Dog Journal's.
Оригинал статьи на английском