Comprender el entrenamiento de perros basado en la recompensa

La dama de mediana edad se deslizó enérgicamente por la alfombra de goma del centro de entrenamiento, su Labrador Retriever negro rebotando felizmente a su lado. Se detuvo suavemente y Skip se sentó rápidamente a su lado, en una posición perfecta de los talones. «¡Si!» Pensé para mí mismo, y luego hice un gesto de dolor cuando Carla bajó la mano y con entusiasmo le dio una palmada en la cabeza a Skip. Skip saltó y se alejó de su humano.

«Carla», dije en voz baja. «Acabas de castigarlo por sentarse derecho». La cara de Carla se cayó. «¡Maldita sea!» exclamó. «¿Por qué no puedo recordar eso?»

Un momento… ¿Desde cuándo dar palmaditas a un perro se considera un castigo? Desde que Skip nos hizo saber agachando la cabeza y alejándose de la mano de Carla que no le gustaba que lo acariciaran. Todos los demás laboratorios que Carla había tenido y entrenado a lo largo de su vida adoraban ser tocados como recompensa. Carla acarició a su perro por ser bueno sin siquiera pensarlo, fue una respuesta bien condicionada. Desafortunadamente, como a Skip no le gustaba que lo tocaran, cada vez que se lo hacía, lo castigaba, disminuyendo la probabilidad de que volviera a hacer esa sentada perfecta.

Las decisiones de un perro en la vida, y sus conductas resultantes, se basan en si un comportamiento particular produce algo que le gusta (una recompensa) o algo que no le gusta (un castigo). El entrenamiento es simplemente una cuestión de manipular las recompensas y los castigos de una manera reflexiva… Pero tienes que conocer a tu perro, ser muy consciente de sus gustos y aversiones, y ser consciente de tu propio comportamiento para que el «entrenamiento» funcione para ti.

Recompensas y castigos En la década de 1950, el científico del comportamiento B.F. Skinner desarrolló una serie de principios que son aplicables a todos los seres vivos con un sistema nervioso central. Encontró que los animales son propensos a repetir conductas que son agradables/gratificantes para ellos, y no es probable que repitan conductas que resulten en algo desagradable (castigo). Los estímulos neutros – cosas que no le importan al animal – no tienen un impacto en el comportamiento de una manera u otra.

Skinner demostró que los humanos pueden usar estos simples principios para modificar el comportamiento de un animal. Las recompensas son la forma más fiable de aumentar deliberadamente los comportamientos ofrecidos de un animal; por el contrario, el castigo disminuye esos comportamientos. (Ver «Los cuatro principios del condicionamiento operante», al final de la historia). Utilizamos estos principios de comportamiento en el entrenamiento de perros con gran éxito.

Sin embargo, como en el caso de Skip, la aplicación práctica de «recompensas» y «castigos» varía de un perro a otro, aunque la definición no lo haga. Una recompensa es cualquier cosa que le guste a un perro en particular. Un castigo es cualquier cosa que no le guste al perro.

A menudo utilizamos golosinas como recompensa en el entrenamiento porque casi siempre podemos encontrar algún alimento que un perro valorará lo suficiente como para que le sirva como una recompensa irresistible, pero la comida no es la única recompensa disponible para nosotros. Recuerden, una recompensa es cualquier cosa que le guste a un perro. Puede ser una palmadita en la cabeza (pero no para perros como Skip, a los que no les gusta que los toquen), un elogio verbal, un juego de tira y afloja, una persecución tras un palo o una pelota de tenis, un paseo con correa, un paseo en coche, el permiso para saltar al sofá, la señal para hacer un curso de agilidad, la liberación de una «espera» para salir corriendo al patio, el permiso para ir a saltar al lago, o la señal para reunir un rebaño de ovejas.

Cuando el adiestrador de perros promedio sin experiencia escucha la palabra «castigo», generalmente piensa en formas abiertas de castigo físico, como golpear, pellizcar o patear al perro, o sacudir la correa. No recomiendo ni utilizo el castigo físico, ya que pone en peligro al adiestrador, daña la relación con su perro y puede destruir el entusiasmo del perro por el adiestramiento. Afortunadamente, el castigo físico no es la única forma de eliminar un comportamiento no deseado.

Recuerden, los conductistas definen la palabra «castigo» como cualquier cosa que hace que un animal disminuya un cierto comportamiento. Así que, en el caso de Skip, el laboratorio al que no le gustaba que lo tocaran, una palmada en la cabeza después de realizar una sentada recta fue suficiente para que dejara de realizar esas sentadas rectas.

Los «entrenadores positivos», es decir, las personas que se han comprometido a entrenar sin utilizar el dolor, el miedo, la fuerza o la intimidación, a menudo utilizan ciertas formas de «castigo» (en el sentido de la conducta) para lograr sus objetivos de entrenamiento. Por ejemplo, cuando un perro que ansía el contacto físico y la atención salta sobre el entrenador, éste le dará la espalda y se alejará, eliminando tanto su atención (contacto visual e interacción) como la posibilidad de contacto físico con el perro. Estas son las recompensas que el perro busca al saltar. Cuando el comportamiento de salto del perro sigue resultando en la pérdida de algo que quiere mucho, dejará de saltar – especialmente cuando este «castigo» se empareja con la «recompensa» de atención, golosinas y caricias por sentarse en silencio.

Lo que en realidad constituye un castigo o recompensa para cualquier perro, entonces, es un asunto individual; en términos de comportamiento, el contexto lo es todo.

Entrenamiento no intencional El entrenamiento, por lo tanto, es el uso intencional de recompensas y castigos para manipular a propósito el comportamiento de un perro. Lo que a veces es difícil de recordar es el hecho de que los perros están aprendiendo todo el tiempo, ya sea que estemos prestando atención o no. La gente a menudo se desconcierta al ver por qué sus perros hacen algunas de las cosas que hacen, o dejan de hacer lo que la gente quiere que hagan.

En realidad es bastante simple. Los perros hacen lo que les funciona; no hacen cosas a menos que obtengan algo de ello.

Los perros hacen cosas que consideramos «comportamiento inapropiado», porque es divertido, se siente bien o sabe bien. Desde la perspectiva de un perro, los comportamientos que son inaceptables para nosotros, como meterse en la basura, perseguir a los gatos o dormir en el sofá, ¡son simplemente divertidos!

Los propietarios frustrados suelen decir a sus entrenadores: «¡Sabe que no debe hacer eso!». Lo castigo cuando lo hace, pero aún así lo hace. ¿Por qué?» A veces, el disfrute que el perro obtiene del comportamiento supera el «castigo» del dueño. Un perro que se excita mucho por la experiencia de perseguir a un gato por la valla del patio trasero puede que no le importe un poco que le griten por ello.

En otros casos, el «castigo» puede ser realmente gratificante para el perro. Por ejemplo, un labrador ruidoso que recibe gritos, golpes o incluso patadas por saltar sobre su dueño puede no tener ninguna pista de que los gritos, los golpes y las patadas se supone que son un castigo. Para los perros que anhelan atención y aman el contacto físico con la gente, este trato rudo es simplemente una invitación a jugar un juego agradable (gratificante).

Además, los dueños de los perros pueden no darse cuenta de que a menudo castigan irreflexivamente a un perro por hacer lo correcto. Si lo hace con suficiente frecuencia, sin darse cuenta «entrenará» a su perro para que deje de ofrecer las conductas que desea.

Considera a la mujer cuyo perro está disfrutando de un buen retozo con unos amigos caninos en el parque de perros. Es hora de irse, así que llama a su perro. Inmediatamente deja a sus amigos de juego y corre hacia ella. «¡Buen perro!» exclama ella, y le pone la correa, sacándolo del parque. En su opinión, el elogio verbal fue una amplia recompensa, y dejar el parque no tiene ninguna relación con el recuerdo. Pero así es como el perro lo ve: «Mamá llamó, vine, y la diversión ha terminado. Cuando vengo con mamá, sucede algo malo – la diversión se detiene». Es probable que se lo piense dos veces antes de venir la próxima vez que ella llame mientras él está jugando con sus amigos.

Mucha gente tiene muchos problemas para entrenar a su perro para que venga de forma fiable cuando se le llama. Tal vez no han considerado lo suficiente lo que le pasa al perro la mayoría de las veces después de que viene. No hace falta ser un Einstein canino para darse cuenta de que venir cuando se le llama es una mala idea si algo «malo» le sucede inmediatamente después, por ejemplo, se le mete en el sótano o se le encierra lejos de todos los invitados en la cocina, o se le tira fuera bajo la fría lluvia.

El entrenamiento también puede fallar cuando la recompensa no es lo suficientemente valiosa como para motivar al perro a molestarse en conseguirla. Debes programar una respuesta automática a la señal de «ven» con una recompensa de alto valor en ausencia de distracciones tentadoras antes de intentar aplicarla en la cara de las gallardas ardillas. Pocos perros dejarán una cacería de ardillas para venir y ganar un trozo de comida seca. Muchos entrenadores positivos usan una variedad de recompensas tentadoras y las mezclan. Entonces el perro nunca está seguro de cuán grande será la «recompensa» por su buen comportamiento; sólo sabe que será bueno.

Si duda de que mezclar pequeñas recompensas (como un elogio verbal, una palmadita o un trozo de comida seca) con recompensas más grandes (como trozos de carne fresca, perseguir una pelota o ser liberado para correr libremente) sea un motivador poderoso, considere la máquina tragaperras. Mientras pague una mezcla de no recompensas, recompensas pequeñas, y sólo un ocasional premio gordo, los jugadores humanos seguirán sentados y tirando de la manija, ¡más allá del tiempo en que tenga sentido hacerlo!

Actos aleatorios de refuerzo Tener una variedad de recompensas en su kit de herramientas de entrenamiento le da una mayor flexibilidad y le permite entrenar a su perro sin tener siempre un gran suministro de golosinas en su bolsillo. Un buen programa de entrenamiento se mueve hacia un refuerzo variable una vez que el perro está realizando de manera confiable un nuevo comportamiento. En lugar de hacer clic y darle un premio al perro cada vez que realiza la conducta, de vez en cuando se salta un clic y se elogia al perro en su lugar, luego se pide la conducta de nuevo y se hace clic en la siguiente. Aumenta gradualmente la variación y la duración del programa de refuerzo, recordando que la aleatoriedad es importante.

Si simplemente sigues haciendo que tu perro trabaje cada vez más duro por un clic, es probable que lo deje. Si cambias el programa de refuerzo, como en una tragaperras de Las Vegas, no puede predecir cuándo te va a pagar. ¿Tendré un clic esta vez? ¿Esta vez? ¿Esta vez? ¡Un clic! Al igual que la gente seguirá insertando monedas, tu perro seguirá ofreciendo comportamientos con entusiasmo, seguro que el próximo se llevará el premio gordo.

Para mantener su entusiasmo mientras alargas gradualmente el programa de refuerzos, usa otras recompensas para hacerle saber que sigue en el camino. Frecuentemente uso «¡Buen perro!» como elogio después de hacer clic y tratar, para que mis perros asocien la misma sensación cálida y difusa de obtener una recompensa de comida con el elogio verbal. Entonces, cuando uso el elogio verbal incluso sin el «click and treat», siguen teniendo la misma respuesta clásicamente condicionada de la asociación del elogio con la comida, y les hace sentir bien. Así, «¡Buen perro!» se convierte en una recompensa útil incluso sin comida.

Otras recompensas pueden crear más de una interrupción en el juego de entrenamiento. Si usas un juguete como recompensa, debes detenerte y dejar que tu perro juegue con él un rato. Esto puede funcionar muy bien para aumentar su entusiasmo, especialmente para un perro que está loco por las pelotas o al que le encanta tirar. No funciona bien cuando quieres hacer muchas repeticiones de un comportamiento discreto en una fila. Si tiras la pelota cada vez que él responde a tu señal de «abajo», te tomará mucho tiempo hacer media docena de repeticiones. Funciona bien como una recompensa por un comportamiento prolongado, como el tacón. Un perro loco por las pelotas puede aprender a taladrar con perfecta atención durante largos estiramientos en anticipación a la persecución de la pelota que ocurre al final.

El tiempo es la clave Es importante para un programa de entrenamiento exitoso entender lo que le gusta y lo que no le gusta a su perro, y usar esas recompensas y castigos de manera efectiva. Para que sea efectivo, las consecuencias – buenas o malas – deben ser entregadas en un tiempo cercano al comportamiento que se intenta influenciar.

Diga que su perro se inclina sobre el cubo de basura de la cocina mientras usted está en el trabajo. Si lo reprende cuando llega a casa del trabajo, horas después de la redada de basura, sólo le enseña a su perro que a veces es impredecible y peligroso cuando llega a casa. No importa lo «culpable» que parezca cuando le regañas, no hace ninguna conexión entre tu comportamiento de gritarle y su comportamiento de meterse en la basura horas antes. Tu percepción de su aparente conciencia de culpa, manifestada en su cabeza baja, la falta de contacto visual, y el deslizamiento a lo largo de los zócalos, es una interpretación errónea de su clásico lenguaje corporal canino que intenta sofocar tu ira, sea cual sea la causa.

Los conductistas están de acuerdo en que una recompensa o castigo debe ser entregado dentro de tres segundos, preferiblemente un segundo o menos, del comportamiento que se intenta aumentar o disminuir. Esta es una ventana de tiempo bastante pequeña, y subraya el valor de usar un clicker u otro marcador de recompensa (o marcador de no recompensa) para marcar el instante de comportamiento deseado (o inapropiado). Si dices «¡Uy!» en el instante en que tu perro salta y te das la vuelta, le estás enseñando un marcador de no-recompensa, que puedes usar para comunicarle a tu perro qué comportamiento fue el que hizo que lo bueno desapareciera (castigo negativo). Si haces clic o dices «¡Sí!» en el momento en que tu perro se siente, llegará a entender que la sentada se ganó la recompensa, incluso si tardas varios segundos en llevarle la golosina a la boca, e incluso si se levanta de la sentada antes de que consigas entregarle la golosina.

Saltando adelante Carla y yo tuvimos una larga discusión sobre cómo continuar con el entrenamiento de Skip. Identificamos dos opciones. Usando la insensibilización, podíamos enseñarle a Skip que el hecho de que Carla le diera palmaditas en la cabeza era realmente una recompensa, al emparejar consistentemente su toque con una recompensa de trato fuera de lo común, usando un contacto suave al principio, luego aumentando la intensidad hasta que aprendiera a asociar las palmaditas vigorosas con «cosas realmente buenas». Carla se comprometió a hacer esto a largo plazo, ya que realmente quería que Skip disfrutara de su toque.

También iniciamos un acercamiento a corto plazo para modificar el comportamiento de Carla, acordando usar un refuerzo positivo y un castigo negativo con ella. Cada vez que Skip se sentaba y no se agachaba para darle una palmadita, Carla se ganaba una recompensa, como una moneda, un trozo de chocolate o un juguete para perro. Cada vez que se olvidaba y se agachaba para darle una palmadita, yo salía de la sala de entrenamiento sin decir una palabra, por un período de tiempo de 30 segundos a tres minutos. Funcionó de maravilla, y en poco tiempo, Skip estaba sentado felizmente en posición de talón perfecto cuando Carla se detuvo, sin temor a ser castigado por su buen comportamiento.

También con este artículo Haga clic aquí para ver «¿Quién entrena a quién? Secretos de entrenamiento humano revelados». Haga clic aquí para ver «Los cuatro principios del condicionamiento del operario».

-Por Pat Miller

Pat Miller, editora de entrenamiento de WDJ, es también autora independiente y entrenadora certificada de perros mascota en Chattanooga, Tennessee. Es la presidenta de la junta directiva de la Asociación de Entrenadores de Perros de Mascota y recientemente publicó su primer libro, The Power of Positive Dog Training (El poder del entrenamiento positivo de perros). Para obtener más información, consulte «Recursos».

Posts relacionados: