Derfor elsker jeg positiv forstærkning #0: Indledende ord…

Dette er første indlæg i en serie om mine begrundelser for kun at anvende positiv forstærkning i træning af mine dyr. Hvor mange indlæg der ender med at komme vil vise sig. Jeg har 4-5 stykker planlagt.

Efter mit indlæg på bloggen om Top 10 og lidt til over hestetrænere der baserer sig på positiv forstærkning fik jeg et rigtig godt og legitimt spørgsmål på Facebook:

Hvorfor ønsker du kun brug af positiv forstærkning?
Jeg tænker nu hvor det er videnskabelig bevist at kombinationen af positiv forstærkning og negativ forstærkning øger indlæringen ift hvis man kun bruger den ene af de 2 operante procedure?

kommentar fra Facebook

Der er mange grunde til, at jeg (næsten) kun bruger positiv forstærkning og flere af dem har at gøre med indlæring, men ikke alle. Jeg har ikke set et studie, der viser, at en kombination af negativ og positiv forstærkning øger indlæringen. Og hvad betyder det egentlig at “øge indlæringen”? At det går hurtigere? At det huskes længere? At det er nemmere? Jeg ved det ikke. Derfor vælger jeg at svare på spørgsmålet via en række indlæg, der med forskellige vinkler forklarer, hvorfor jeg synes, at positiv forstærkning er vejen at gå med dyretræning.

Mine begrundelser findes primært i følgende kategorier:

Operant og klassisk betingning samt anden forskning indenfor indlæring.

Dyrs Følelser, herunder indlærte emotionelle responser (Klassisk Betingning) og Affective Neuroscience

Etiske overvejelser, som fremlagt af Susan Friedman og Applied Behaviour Analysis feltet

Jeg har planlagt indlæg indenfor disse emner + et par ekstra relaterede emner om forskellen på cues og commands samt forgiftede signaler.

Kort om positiv forstærkning

Men først er det vigtigt at få på plads, hvad jeg mener, når jeg siger positiv forstærkning. Positiv forstærkning er en af 4 indlæringsmekanismer beskrevet i Skinners teori om Operant Betingning. De andre 3 andre hedder negativ forstærkning, negativ straf og positiv straf.

Det er nærliggende at tro, at negativ og positiv har noget at gøre med godt og skidt. I denne sammenhæng har positiv ikke noget at gøre med om noget er godt og negativ betyder ikke at noget er skidt. Positiv betyder at noget er til stede eller bliver tilført og negativ betyder, at noget er fraværende eller bliver taget væk. Altså ligesom plus og minus i matematik eller et og nul i programmering. Grunden til at jeg nævner dette er, at når jeg siger, at jeg træner med positiv forstærkning, bliver jeg ofte mødt med en kommentar om “at jeg træner også med positive metoder” og når jeg stikker dybere i det, viser det sig typisk, at personen ikke mener helt det samme, som jeg gør. Dvs. vi taler ikke ud fra samme udgangspunkt og kan derfor ikke være sikre på at forstå hinanden.

Jeg vil ikke gå særlig meget i dybden med Operant Betingning i dette indlæg. Jeg har skrevet om det her.

Ultra kort er positiv forstærkning en procedure, hvor et dyr eller et menneske lærer noget nyt ved at modtage noget dejligt i løbet af processen, når vedkommende gør det rigtige. Positiv betyder at tilføje/give noget (i dette tilfælde noget godt) og forstærkning betyder at øge sandsynligheden for at en adfærd opstår igen eller styrke en adfærd. Træneren markerer korrekt adfærd ved f.eks. at anvende en klikker efterfulgt af en godbid. Eleven finder ud af, hvad det var der udløste godbidden og vil gøre det igen for at få en mere.

Jeg kalder det positiv forstærkning, andre kalder det belønningsbaseret træning og det ligner også belønning på flere punkter, dog ikke på alle. Forskellen på forstærkning og belønning, har jeg skrevet et indlæg om her. For mig er det vigtigt, at forstærkningen foregår efter nogle helt klare retningslinjer for ikke at forvirre dyret eller udvande træningen.

Hvad betyder det for træningen af have denne vinkel?

Når jeg baserer det meste af mit samvær med dyr på læring via positiv forstærkning lægger det op til en bestemt måde at arbejde på i praksis:

Jeg arbejder så vidt muligt helt uden pres og forsøger, at tilrettelægge min træning, så dyret har:

  • størst chance for succes
  • størst muligt kontrol over situationen
  • størst mulig frihed til at vælge
  • mindst mulig risiko for at lave fejl i træningen.

Lad os tage et eksempel på presfri træning af en adfærd: Jeg har lært Sovs at flytte bagparten til højre og venstre helt uden at røre ved ham eller læne mig frem mod ham eller noget som helst andet han kunne opfatte som et pres. Jeg har lært ham det ved at holde en target stick ned ved rumpen af ham og forstærket (dvs. klik med en klikker + godbid) når han har rørt bolden for enden af target stick’en med rumpen. Derpå har jeg knyttet et signal til, så han nu gør det, enten når jeg holder en arm ud til højre eller til venstre (ligesom når man viser af når man cykler) eller hvis jeg holder en genstand ud for hans rumpe. “Flyt bagpart til siden” er altså trænet udelukkende med positiv forstærkning. Jeg har på intet tidspunkt forsøgt at skubbe bagparten eller tappe den med en pind eller holdt et pres eller noget lignende.

Der er 100 andre måder, jeg kunne have gjort det på, men når jeg arbejder med positiv forstærkning er der nogle måder, der byder sig til og nogle der IKKE byder sig til. Nederst i dette indlæg er der en liste over, hvad jeg IKKE gør og ikke bør gøre, hvis jeg vil arbejde på denne måde.

Mine primære metodikker, som jeg anvender når jeg træner med positiv forstærkning er følgende:

  • shaping
  • targeting
  • luring
  • start og stop knapper
  • loopy training
  • premacs principle
  • osv

Og eftersom det er heste, jeg typiske træner med og de kan være bange for alt muligt, gør jeg også brug af disse:

  • habituering
  • systematisk desentisisering
  • kontrabetining

Når jeg træner på denne måde, skal jeg ofte gentænke og genindlære adfærd som dyret allerede har lært på en anden måde. Eftersom jeg ikke har haft mine heste, siden de blev født, har de alle lært en hel masse vha. negativ forstærkning, inden de kom til mig. Det betyder typisk, at jeg skal lære dem samme adfærd igen, bare med positiv forstærkning i stedet – begrundelsen for denne gen-indlæring findes bl.a. i risikoen for forgiftede signaler, som er et af de emner, jeg har på programmet.

At bygge hele sin træning op omkring positiv forstærkning er ikke kun et spørgsmål om metoder, indlæringsprocedurer eller effektivitet. For mig er effektivitet ikke den vigtigste parameter, når jeg arbejder med dyr. Den er selvfølgelig vigtig, men den ligger lidt længere nede på listen over mine prioriteter. Over den ligger dyrets velfærd, relationen mellem mig og mit dyr samt dyrets følelser og sundhed. Om vi kommer fra A til B hurtigt er mindre vigtigt i forhold til om dyret trives, om det har primært gode følelser omkring, det vi laver sammen og om vores relation er positiv. Hvis vi tager etikken og følelserne med i betragtning og ønsker at styre efter dem er det ikke lige meget hvilke metoder og indlæringsprocesser vi sætter i spil. Den måde vi gør tingene på har uundgåeligt betydning for, hvordan det opleves af modtageren: dyret.

For mig er dyreundervisning/træning en helhedstankegang. De ovennævnte emner hænger sammen på kryds og tværs og spiller alle ind på det samlede billede.

Alt dette kommer der indlæg om. Jeg vil prøve at skyde ind på emnerne fra flere vinkler. Det vil alt sammen belyse forskellige og overlappende områder på billedet over dyretræning. Jeg siger ikke, at billedet vil stå fuldstændig skarpt, når jeg er færdig. Der vil endda være nogle områder, der slet ikke kan ses. Der er meget viden derude, jeg ikke har styr på og der er meget viden, vi mangler endnu. Men der er kommet nye detaljer og farver på siden Skinner og Pavlov formulerede deres teorier om Operant og Klassisk betingning. Det betyder ikke, at deres teorier ikke gælder mere. Det betyder blot, at de er blevet nuanceret og ny viden indenfor andre områder har bidraget til yderligere forståelse for, hvad adfærd og læring indebærer og hvordan det påvirker vores dyr. Derudover er etik og dyrevelfærd blevet vigtige områder og dyreorganisationer, zoologiske haver, private træningskonsulenter mv. bevæger sig mere og mere i retning af etisk, human og dyrevenlig træning. Vi er også blevet i stand til at måle på flere ting nu, end vi har været tidligere. F.eks. handler Affective Neuroscience om at måle på hjerneprocesser, hormoner og neurotransmittere. Det havde vi ikke muligheden for i Skinner og Pavlovs tid. Min pointe er, at det sjældent er entydigt, hvad der er bedst og at det kommer an på perspektivet og på hvad man prioriterer i sin træning.

Hvornår bruger jeg ikke positiv forstærkning

Der er dog lige et par forbehold mht. min brug af positiv forstærkning. Alt er en process og man bevæger sig ikke fra mere “traditionel” dyretræning til træning baseret på positiv forstærkning fra det ene øjeblik til det andet. Man lærer hen ad vejen på den gode og den knap så gode måde. Jeg er kommet meget langt og kan næsten ikke huske, dengang jeg ikke kendte til at være sammen med dyr på denne måde, men der er stadig tidspunkter, hvor jeg falder tilbage på negativ forstærkning, fordi jeg ikke føler mig stærk nok i den adfærd, jeg vil lære hesten. For mig er ridning f.eks. en stor udfordring, da jeg ikke rider ret meget og derfor falder jeg tilbage på negativ forstærkning, når jeg gør det. Det er min plan at finde en træner, der gider hjælpe mig med til at sadle om til positiv forstærkning i ridning også. Jeg ved det kan lade sig gøre, men her er et område, hvor jeg har brug for støtte. Jeg bruger også negativ forstærkning, når jeg skal have dyrlægebesøg , smed eller andre ting, hvor jeg ikke har nået at forberede hesten grundigt nok på det, der skal ske.

Men er det ikke dobbeltmoralsk vil nogen måske spørge? Nej, det mener jeg ikke det er, for som sagt er alt en process, som ikke er perfekt fra starten. Det er en omstilling for både mig og dyret og det er sådan livet er: livet er rodet og mindre end perfekt det meste af tiden og hvis man erkender det faktum og gør det bedste man kan og forholder sig pragmatisk til tingene, så har man efter min mening større chance for succes.

Det jeg heldigvis slipper for at gøre…

Hvad er det så jeg gladelig slipper for at gøre, når jeg træner på denne måde? Jeg slipper for:

  • at korrigere
  • at skælde ud
  • irettesætte
  • straffe
  • time out
  • presse
  • tvinge
  • overtale
  • bruge “forlængede arme”
  • små flag på en stang
  • vikle reb rundt om numsen på hesten for at få den op i en trailer
  • tappe med nogen former for pinde
  • hive i trækketov eller andre snore
  • skubbe
  • jage rundt i en round pen
  • anvende særlige grimer med knuder med særlige prespunkter
  • eller noget lignende

At vælge det gode…

Jeg startede med at sige, at positiv i denne sammenhæng ikke betyder om noget er godt, men at det er en videnskabelig term, der dækker over, at man tilføjer noget godt for at øge eller styrke en adfærd. Men man kan alligevel godt sige, at det er ‘positiv træning’, idet mennesker der træner på denne måde sjældent råber eller skælder ud. De har en bedre relation til dyret, dyret har højere velfærd og befinder sig overvejende i positive sindstilstande, der gavner dyrets fysiske og psykiske helbred. Så man kan måske alligevel godt kalde det positiv træning – som i “noget godt”.

Jeg hørte et interview med Positively Together fornylig (https://www.facebook.com/positive.reinforcement.training/), hvor hun sagde, at træning på denne måde, lærer dig at få øje på de gode ting – ikke kun i træningen af dyr, men måske også meget bredere i livet. Det er så nemt at få øje på det, der ikke fungere, det der kunne være bedre, det der er noget rigtig møg. Der er faktisk ikke noget nemmere end at se de dårlige ting. Vi er på en eller anden måde ofte tunet ind på de dårlige ting og overser nogle gange de gode ting. Man kan ikke overse de gode ting, når man træner med positiv forstærkning, for hele træningen er bygget op omkring at lægge mærke til og forstærke (belønne) selv de mindste gode bevægelser hen imod målet. Hvis man vælger at træne med positiv forstærkning ændres ikke kun selve træningen og samværet med dyrerne men hele ens tilgang til livet. Fordi man lærer at lægge mærke til det der fungere, det der virker, succeserne… kan man ikke få øje på dem, kan man ikke forstærke dem.

Tilbage til udgangspunktet. Spørgsmålet om, hvorfor jeg vælger denne tilgange bliver besvaret i en række indlæg. Det næste indlæg, handler om Affective Neuroscience og viden om dyrs følelser. Det skulle gerne komme i løbet af weekenden. Det efterfølgende kommer formentlig til enten at handle om, hvordan følelser smitter og griber bagud i tid eller om forgiftede signaler. Det afhænger af, hvad jeg bliver færdig med først. Hvis du vil følge med, kan du evt. trykke på “Følg denne blog”. Så vil der komme en mail til dig, når næste indlæg dukker på på bloggen.

Skriv kommentar

Udfyld dine oplysninger nedenfor eller klik på et ikon for at logge ind:

WordPress.com Logo

Du kommenterer med din WordPress.com konto. Log Out /  Skift )

Google photo

Du kommenterer med din Google konto. Log Out /  Skift )

Twitter picture

Du kommenterer med din Twitter konto. Log Out /  Skift )

Facebook photo

Du kommenterer med din Facebook konto. Log Out /  Skift )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.