Derfor elsker jeg positiv forstærkning #1: The Humane Hierarchy & LIMA

For et år siden var det planen at lave en serie om, hvorfor jeg elsker positiv forstærkning så meget, at jeg stort set er gået helt væk fra negativ forstærkning (og negativ og positiv straf + udslettelse). Jeg havde fået et spørgsmål om, hvorfor jeg gik så radikalt til værks, at jeg kun ønskede at bruge positiv forstærkning i min træning af heste, ”når det nu var bevist at en kombination af positiv og negativ forstærkning øgede indlæringen”, som der er stod i spørgsmålet. Dette opslag beskriver en meget vigtig grund til, at jeg så vidt mulig anvender ren positiv forstærkning. Det er ikke den eneste grund, men det er en af de vigtigste. Hvornår det næste indlæg kommer ved jeg ikke. Der kan godt gå noget tid ;-). Det første indlæg – indlæg nummer 0 – er her.

Hvis du ikke har styr på negativ og positiv forstærkning, kan du læse om det her … ellers kan det her indlæg godt blive svært at følge med i..

We have a full toolbox of effective, science-based training procedures, but from an ethical perspective, effectiveness is not enough.

Susan Friedman, 2020

For næsten 20 år siden skrev Susan Friedman en artikel:

“WHAT’S WRONG WITH THIS PICTURE? EFFECTIVENESS IS NOT ENOUGH”. – Link til artikel?

Artiklen var et modsvar på den tids opfattelse af, at dyr skulle trænes med pres, tvang og straf for at opnå det, man ville med træningen. Effektiviteten i proceduren var ofte et hovedargument for at anvende de indgribende procedurer. Effektivitet er stadig et argument, og det skal det også være, men det skal ikke være det eneste, der er afgørende, når vi vælger, hvordan vi vil arbejde med vores dyr.

I artiklen fremlagde Susan Friedman The Humane Hierarchy, som er en etisk rettesnor for valget af procedurer til at opnå adfærdsændringer ud fra dels hvor effektiv proceduren er i den pågældende kontekst og dels hvor indgribende den er for dyret. The Humane Hierarchy og LIMA (Least intrusive, Minimal Aversive eller Least Intrusive, Most Positive) bygger på principper inden for Applied Behaviour Analysis. Den benyttes af professionelle til at vælge den MINDST indgribende og samtidig effektive metode til at opnå adfærdsændringer. The Humane Hierarchy er blevet adopteret af dyreorganisationer. Den anvendes i zoos og i andre organisationer som f.eks. IAABC og har påvirket et hav af almindelige dyretrænere i hele verden – herunder undertegnede.

I år (2020) har hun udgivet en opfølgning på artiklen. Den nye artikel hedder: “Why Animals Need Trainers Who Adhere to the Least Intrusive Principle: Improving Animal Welfare and Honing Trainers’ Skills. Det giver anledning til at tage det op igen, for selvom træning med dyr nok er blevet blidere og mere etisk, kan vi sagtens gøre det endnu bedre.

Her er hvordan The Humane Hierarchy og Lima anvendes hos IAABC. De skriver, at indgribende/påtrængende løst oversat betyder “til hvilken grad eleven har kontrol over situationen selv”. Jo mere kontrol eleven eller dyret selv har over det der sker, jo MINDRE indgribende er proceduren overfor dyret. Det her med kontrol er en virkelig spændende snak, som vi må tage en anden gang.

Intrusiveness refers to the degree to which the learner has counter control. The goal of LIMA is for its trainers/consultants to determine and use the least intrusive effective intervention which will effectively address the target behavior. In the course of an experienced trainer/consultant’s practice, he or she may identify a situation in which a relatively more intrusive procedure is necessary for an effective outcome. In such a case, a procedure that reduces the learner’s control may be the least intrusive, effective choice. Additionally, wellness is at the top of the hierarchy to ensure that a trainer/consultant does not implement a learning solution for behavior problems due to pain or illness. The hierarchy is a cautionary tool to reduce both dogmatic rule following and practice by familiarity or convenience. It offers an ethical checkpoint for consultants to carefully consider the process by which effective outcomes can be most humanely achieved on a case-by-case basis. Rationale like, “It worked with the last case!” is not appropriate. The evaluation and behavior change program of every animal should be a study of the individual (i.e., individual animal, setting, caregiver, etc.). Changing behavior is best understood as a study of one.

https://m.iaabc.org/about/lima/hierarchy/

Det Humane Hierarki

Hierarkiet kombinerer videnskab og etik. Dvs. at der kigges på, hvor effektivt et tiltag er og samtidig vurderes det, hvor indgribende tiltaget er for dyret. Hierarkiet er bygget sådan op, at graden af, hvor indgribende proceduren er vokser opad. Nederst ligger de procedurer, der er mindst indgribende overfor dyret og øverst dem, der er mest indgribende. Vi går altid nedefra og op i hierarkiet.

Susan Friedman. Find den i artiklerne refereret nederst.

Er det f.eks. et adfærdsproblem vi skal arbejde med, spørger vi på trin 1, om der kan ligge smerte, sygdom eller lignende til grund for problemet og om problemet kunne løses ved at adressere helbred. Det kan også være, at problemet opstår pga. forkert ernæring eller lignende og at ændre foder kunne ændre adfærden.

Hvis problemet ikke kan løses på 1. trin kigger vi på Antecedent Arrangements. Antecedent betyder noget der går forud for noget andet. I denne sammenhæng drejer sig om at analysere dyrets omgivelser og ændre på dem og på den måde påvirke adfærden. Der er tale om en tilpasning af omgivelserne, så de understøtter den ønskede adfærd og/eller begrænser den uønskede. Antecedent arrangements bruges af mange, når de tilrettelægger deres træning – også selvom de ikke arbejder med problemadfærd, men blot med almindelig træning. De laver et setup omkring dyret og træningen, der gør det så nemt som muligt for dyret at gøre det rigtige og dermed reducere risikoen for, at dyret laver mange ”fejl” undervejs. Det kan f.eks. være, at fjerne distraherende genstande eller ting, der kan opfattes som farlige af dyret. Det kan også være at lave en reverse roundpen til at hjælpe træning af fremadbevægelse eller noget helt andet. Nogle trænere går så vidt, at de arbejder med at opnå fejlfri træning. Dvs. at hele træningen er sat op, så det stort set ikke er muligt for dyret at gætte forkert eller lave en fejl.

På trin 3 kommer positiv forstærkning. Af de 4 operante indlæringsmekanismer (positiv og negativ forstærkning samt positiv og negativ straf) er positiv forstærkning MINDST indgribende overfor dyret. Med positiv forstærkning forstærker man adfærdstyper, der kan falde under kategorien tilnærmelse. Dyret gør noget for at opnå noget, det gerne vil have, som f.eks. opmærksomhed, mad, nus, ros, leg, social kontakt eller lignende. Det er konsekvensen af det dyret gør, der resulterer i læringen – dvs. at dyret lærer, hvad præcis det skal gøre for at opnå noget det godt kunne tænke sig.

Helt overordnet kan man kategorisere funktionen af adfærd i to kategorier: tilnærmelse som i det ovenstående afsnit om positiv forstærkning og undvigelse/flugt som under trin 5.

Differential reinforcement of alternative behaviors, findes som en mulighed på trin 4. Ganske kort: lad os antage, at vi gerne vil have hesten til at holde op med at gøre et eller andet. Det kan vi gøre ved at træne en alternativ adfærd hesten kan udføre i stedet for, der samtidig opfylder funktionen for den adfærd, vi ikke ville have. Vi behøver således ikke at straffe hesten for det den gør, men giver den en mulighed for at gøre noget andet i stedet for. Heste gør ikke noget ud af det blå. Adfærd har en funktion og analysen af denne funktion kan hjælpe til at finde ud af, hvad der skal gøres for at opnå en alternativ adfærd, der samtidig opfylder funktionen. Der findes flere forskellige former for forstærkning af alternativ adfærd. F.eks. Differential reinforcement of incompatible behavior, som handler om at træne en ny adfærd, som udelukker den uønskede adfærd – har vi f.eks. en hest der stejler, kan vi træne den til at stå med alle 4 ben i jorden i stedet. De to adfærd udelukker hinanden: man kan ikke både stejle og stå med alle 4 ben i jorden samtidig. Dog kan man sige, at den nye stå-adfærd, nok ikke opfylder den funktion, som stejle-adfærden havde for hesten og vi har dermed ikke adresseret funktionen af den oprindelige adfærd i den nye adfærd. Så på den måde var det måske et lidt dårligt eksempel. Hvorfor befinder differential reninforcement of alternative behaviour sig helt her oppe på trin 4? Jeg er ikke helt klar over det, men jeg tror, at det er fordi, at denne metode typisk involverer udslettelse (mere om det længere nede), hvis man læser om det i litteraturen. Man behøver dog ikke at bruge udslettelse for at træne en alternativ adfærd.

Indtil videre har vi gennemgået de 4 første veje at tage. De kan selvfølgelig sagtens kombineres. På næste trin kommer den første advarselstrekant på vejen. Den gør opmærksom på, at her skal trædes mere varsomt. Her er nogle af de procedurer, som er mest indgribende overfor dyret og som kan have nogle uheldige konsekvenser i forskellige sammenhænge.

På trin 5 er negativ forstærkning, udslettelse og negativ straf, som alle vurderes som mere indgribende end alle de tidligere muligheder. Der er et advarselsskilt på den mulighed. Det er fordi negativ forstærkning bygger på aversiver og forstærker flugt- og undvigelsesadfærd. Med Susans friedmans ord:

Negative reinforcement is the process that strengthens escape and avoidance behavior.

Susan Friedman, 2020

Det er interessant, at Susan Friedman her lægger en “ny” definition af negativ forstærkning på bordet. Den er egentlig ikke så forskellig fra sådan som negativ forstærkning som regel defineres, ud over at hun skelner imellem de overordnede typer adfærd, som trænes med henholdsvis positiv og negativ forstærkning. Som det blev nævnt kan adfærd opdeles i overordnet 2 kategorier. Den type adfærd, der har til formål at få hesten tættere på noget den godt kan lide (tilnærmelse) og den type adfærd, der har til formål, at få hesten væk fra noget eller undvige noget den ikke bryder sig om (flugt/undvigelse). Det handler ikke om, hvorvidt hesten fysisk kommer tættere på eller længere fra (selvom det også kan handle om det). Det handler om konsekvenserne af det dyret gør. Hesten lærer, at konsekvensen af at gøre noget bestemt, får den enten væk fra noget ubehageligt eller tæt på noget rart. En hest der lærer at bakke, kan f.eks. komme tættere på en godbid ved at bakke (konsekvensen af at bakke er, at den får en godbid) eller den kan komme væk fra eller reducere pres ved at bakke (konsekvensen som hesten lærer af, er at presset fjernes).

Negativ forstærkning involverer aversiver – dvs. noget som dyret opfatter som ubehageligt. Læring består i at komme væk fra eller undgå aversiverne. Denne procedure er indgribende, dels fordi det bygger på højere eller mindre grad af ubehag og dels fordi der ligger et element af tvang og dermed reduceret kontrol for hesten. Hesten slipper ikke for det pres, vi lægger på den, før den har gjort, hvad vi ønsker den skal gøre . Hvis den ikke reagerer på den rigtige måde på presset, er det kutyme at holde presset eller øge presset gradvist, indtil vi får den respons, som vi ønsker.

Fra et velfærdsperspektiv øges velfærden når aversiver formindskes eller fjernes og derfor bør vi undgå at bruge procedurer baseret på aversiver i dyretræning – medmindre det er absolut nødvendigt og tidligere procedurer beviseligt ikke slår til.

It is self-evident that animals’ welfare increases as the number of aversive stimuli in their environment decreases. My hope for the animals in our care is that they don’t have occasion to use escape or avoidance behavior very often, even though they are equipped to do so.

Susan Friedman

Negativ straf burde næsten have et kapitel helt for sig selv sammen med udslettelse. Negativ straf er at tilbageholde noget dyret gerne vil have for at begrænse en adfærd og denne procedure kan være frustrerende og ubehageligt for dyr såvel som mennesker – særligt hvis dyret ikke ved, hvad det skal gøre for at opnå det, vi tilbageholder. Sådan helt basic, så vifter vi om hesten om næsen med en godbid, men udleverer den ikke, før hesten er holdt op med at gøre det, den gør lige nu. Negativ straf er noget man skal være meget opmærksom på, når man træner med godbidder. Det er alt for nemt at komme til at tilbageholde godbidden for længe og man ender med en dybt frustreret hest og et trist træningsforløb.

Også udslettelse er ekstremt ubehageligt. Udslettelse er, når noget der plejede at virke, pludselig holder op med at virke. Lad os fortsætte eksemplet med at lære hesten at bakke. Vi har lært hesten at bakke vha. at den får en godbid, hver gang den bakker, men den bakker kun 3 skridt og vi vil gerne have, at den bakker flere skridt. Indtil nu, har vi givet den en godbid, når den har bakket 3 skridt. Den er altså begyndt at forvente en godbid ved 3 skridt, men denne gang får den ikke en godbid. Det vil forvirre den. Hvorfor får den ikke en godbid? Den har jo lige bakket 3 skridt og det har hidtil resulteret i en godbid. Den vil helt sikkert prøve igen med 3 skridt og igen: INGEN GODBID. Nu begynder den at blive frusteret. Hvorfor virker det ikke mere? Når den har prøvet tilpas mange gange vil den bakke flere end 3 skridt med eksplosiv kraft i ren frustration og så får den endelig godbidden. Man kan sige, at vi har “udslettet” 3-skridt-bakningen. Nå ja, det kan diskuteres om det er udslettelse eller negativ straf jeg har beskrevet her, men pointen er, at jeg tror det giver sig selv, at det IKKE er en hverken fornuftig, blid eller sikker måde at træne heste på.

Jeg mærker selv udslettelse i min træning med hestene, når jeg gør noget, der ikke virker. Der kan gå et pænt stykke tid, hvor jeg bliver tiltagende frustreret og irriteret, før jeg giver op og finder ud af, at jeg nok skal gøre noget andet. Hesten har det på samme måde, når vi tilbageholder godbidderne. Det er dybt frustrerende og det kommer til udtryk i hestens adfærd f.eks. ved at den bliver overgearet, forsøger at gå ind foran træneren, bider ud efter træneren, hapser efter godbidden (får måske fat i lidt hud, anspændthed osv). Jeg tror, at det ofte er her, nybegyndere udi positiv forstærkning giver op, fordi det kan blive så voldsomt, at man bliver utryg ved hesten. Derfor prøver jeg helt at undgå udslettelse og negativ straf i min træning. Lyt til denne interessante podcast om extinction: https://hannahbranigan.dog/podcast/04/. Hannah Branigan’s podcast “Drinking From The Toilet” har mange interessante emner og gæster hun inviterer ind for at tale om et emne.

På det allerøverste trin finder vi positiv straf. Positiv straf er, når vi gør noget der er ubehageligt for hesten for at få den til at holde op med det den gør lige nu. Det behøver ikke at være mishandling. Det kan f.eks. være at råbe “NEJ”, hvis en hund f.eks. gør noget, den ikke må. Måske kan I kommer i tanker om bedre eksempler fra hesteverdenen, der ikke involverer at slå eller lignende? Definitionen på positiv straf er “at tilføre noget aversivt/ubehageligt for at mindske eller fjerne en uønsket adfærd”. Det kan IKKE anbefales at gå ned af den sti overhovedet. Positiv straf har nogle meget alvorlige bivirkninger og det er meget sjældent effektivt. Positiv straf bør kun udføres i ekstremt sjældne tilfælde og KUN af personer, som ved PRÆCIST hvad de laver og som kender alle faldgrupperne. Heldigvis er positiv straf kun meget sjældent nødvendig. Læs mere om de meget store ulemper der er ved at bruge positiv straf ovre hos Karolina Westlund her: https://illis.se/en/punishment-problems/

Sammenfatning

Susan Friedman siger altså ikke, at du ALDRIG må bruge negativ forstærkning. Der kan være gode grunde til at gøre det. Beslutningen om at bevæge sig op til negativ forstærkning skal være drevet af konkrete data fra træningen af denne adfærd med denne hest i denne situation (Applied Behaviour Analysis refereres af og til som “the science/study of ONE” – dvs. man kigger på det enkelte individ i kontekst for at vide noget om, hvad man kan gøre).  

Thus, the least intrusive principle doesn’t preclude the use of negative reinforcement (or punishment for that matter) per se; rather, it limits the use of negative reinforcement when it isn’t necessary (i.e., when less intrusive strategies will be equally effective). Progression along the continuum of intrusiveness should be databased and not based on convenience, authority or politics. Data collection needn’t be exhaustive or burdensome. Just a few baseline repetitions or a retrospective report from a reliable observer may be all that is needed to justify moving along the intrusiveness continuum.

Susan Friedman

Susan Friedman udelukker ikke nogen af procedurerne. Hun advokerer for, at begrænse brugen af de mere indgribende procedurer til, når det er absolut nødvendigt og KUN når vi har indsamlet lidt data om, at den procedure, vi har prøvet, ikke virker efter hensigten. Det skal ikke være bekvemmelighed, tradition, autoriteter eller politik, der skal være afgørende for, om man vælger at gå et trin op ad trappen – det skal ske på baggrund af en observation og vurdering af den pågældende hest i den pågældende situation med den pågældende procedure. Skridtet op af trappen skal bygge på data.

Efter min mening og erfaring kan man træne stort set alt vha de 4 nederste trin. Trænerens evner og viden samt dyrets erfaring er helt central. De fleste af os er vokset op med at bruge negativ forstærkning til træning af heste og det kan være svært at forestille sig, hvordan de 4 nederste trin kan bruges til f.eks. ridning og lignende. Erfaringsgrundlaget og kilderne til, hvordan man kan gøre det er stadig begrænsede i forhold til brugen af negativ forstærkning- MEN de er der! Det dur ikke som argument for at bevæge sig op ad trappen, at træneren ikke rigtig ved, hvordan man kan gøre noget vha. positiv forstærkning og Antecedent Arrangements. Derfor påpeger Susan Friedman også, at der bør være særlig fokus på at forfine træneres færdigheder og kompetencer – såvel teoretisk som praktisk. Moderne dyretrænere i dag gør netop det: de forfiner deres færdigheder ved at lære af mere erfarne trænere og ved at tilegne sig viden om adfærds funktioner.

Sammenfattende kan man sige, at det ikke er lige meget, hvilken procedure vi anvender, hvis vi kigger på det fra et etisk synspunkt. Negativ forstærkning bør ikke være et standardvalg, når vi vælger procedurer. Vi kan lære en hest at gå op i en trailer, at få ordnet fødder, at blive spulet med en vandslange, at få tørret eller dryppet øjne, at have rytter på ryggen og ride dressur, at stå stille, at overgå fra skridt til trav til galop og ned igen, at vige med bagpart og forpart, at indlære signaler osv osv osv effektivt med shaping, positiv forstærkning og antecedent arrangements. Der findes flere og flere eksempler på folk, der gør det! Det kan godt være, at det i nogle tilfælde er nemmere for os at anvende negativ forstærkning, men det er ikke argument nok til, at det er vores førstevalg set fra et etisk perspektiv. Og det er heller ikke nok, at vi krydrer negative forstærkning med et klik og en godbid hist og her. Det er muligt, at det virker, men det er stadig indgribende og der ligger en potentiel og meget reel risiko for bl.a. posioned cues. Det mindst aversive valg – antecedent arrangements og positiv forstærkning – er muligt i langt de fleste tilfælde, med de rigtige færdigheder, viden og hjælp til at gøre det og i de tilfælde, hvor det ikke kan lade sig gøre, er der stadig en mulighed for at anvende de mere indgribende procedurer – men dog først, når vi vha. observation og data har konkluderet, at vi ikke effektivt kan gøre det på en mindre indgribende måde.

Kilder:

Friedman, Susan (2004): Whats Wrong With This Picture? Effectiveness is Not Enough. http://www.behaviorworks.org/htm/articles_behavior_change.html

Friedman, Susan (2020): Why Animals Need Trainers Who Adhere to the Least Intrusive Principle: Improving Animal Welfare and Honing Trainers’ Skills. http://www.behaviorworks.org/htm/articles_behavior_change.html

Tjek også Alexandra Kurlands podcast, hvor hun og Dominiq Day drøfter The Humane Hierarchy med Susan Friedman i anledning af Susans nye artikel. Find episode 113 og 114 her: Equiosity

Læs mere om poisoned cues her og her f.eks.

Skriv kommentar

Udfyld dine oplysninger nedenfor eller klik på et ikon for at logge ind:

WordPress.com Logo

Du kommenterer med din WordPress.com konto. Log Out /  Skift )

Google photo

Du kommenterer med din Google konto. Log Out /  Skift )

Twitter picture

Du kommenterer med din Twitter konto. Log Out /  Skift )

Facebook photo

Du kommenterer med din Facebook konto. Log Out /  Skift )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.