Šest pogrešnih pretpostavki o treningu temeljenom na pozitivnom poticanju

facebook_1446211825118

Trening temeljen na pozitivnom poticanju (R+) susreće se sa jako puno nerazumijevanja i pogrešnih interpretacija. Mnogi ljudi zaista ne razumiju na koji način funkcionira dok drugi, čini se, namjerno ga pogrešno prezentiraju. Neka od ovih nerazumijevanja i pogrešnih interpretacija su jako prisutni. Nerazumijevanje, slamnati-čovjek (slab argument koji se lako pobije),  mitovi – kako god ih želite nazvati, ali oni su prisutni i utjecajni.

Ovdje je navedeno šest najčešćih. Ima ih još jako puno. Na primjer, nisam se niti dotaknula onih ”psi školovani pozitivnim poticanjem (R+) su pretili” ili ”R+ trening funkcionira samo za trikove i lagane pse” ili ”R+ trening je podmićivanje”. Međutim, dolje navedenih šest mitova osvjetljavaju neka najučestalija nerazumijevanja vezana za R+ trening.

  1. Trening baziran na pozitivnom poticanju je popustljiv. 

Vjerujem da je ovaj argument zaista prisutan kod mnogo ljudi. Prije nego sam počela proučavati teoriju učenja, zbilja nisam imala pojma kako netko može koristiti pozitivno poticanje kao dio plana treninga, kako bi se npr. promjenilo nepoželjno ponašanje. Sve što sam mogla zamisliti jest kako netko dijeli poslastice za dobro ponašanje. Činilo se kao odličan recept za kaos. Što se može napraviti sa poslasticom ako pas učini nešto ‘loše’? Ono što nisam znala jest da treneri koji rade po principima pozitivnog poticanja ne nagrađuju samo poželjna ponašanja nego također imaju i određen broj humanih tehnika upravljanja potkrijepljenjima  za neželjena ponašanja kako se oni nebi isplatili životnji. Ovo uključuje: aranžman prethodnih uvjeta, poticanje alternativnih ponašanja, i u nekim slučajevima negativnu kaznu (P-). Trening temeljen na pozitivnom poticanju, posebno kada se primjenjuje na problematična ponašanja, zahtjeva pažljivo promišljanje i planiranje. Ono je jako precizno, namjerno i potpuno suprotno od: ”idemo se svi družiti u zemlji vila i duga”.

2. R+ treneri samo ignoriraju nepoželjna ponašanja.

Ovo također priziva jako lošu sliku: brižni vlasnik dopušta svom psu da skače na bakicu, šeta po kuhinjskim elementima i kopa po smeću. Međutim, istina je bitno drugačija. Ono što zapravo radimo vezano za nepoželjna ponašanja jest: 1) spriječavamo da se uopće dogode; 2) učimo psa nečemu poželjnome što može raditi umjesto nepoželjnog ponašanja i povremeno, 3) kaznimo koristeći negativnu kaznu ((P-) oduzimanje nečega što pas želi op.a). Znamo da ignoriranjem nepoželjnih ponašanja ona neće nestati sama od sebe. Međutim, da malo zakompliciramo stvari, evo dvije situacije gdje se u radu koristi ”ignoriranje”. Jedna je kada učimo nova ponašanja i/ili povezujemo verbalni signal sa novim ponašanjem. U ovim slučajevima, ako pas napravi grešku, ne događa se ništa. Ne nagrađujemo. Ali u ovim situacijama ne radi se o ustaljenim, štetnim ponašanjima koja se mogu potkrijepiti na druge načine. Radi se samo o pogrešnom pokušaju u igri pogađanja. Druga situacija u kojoj se ignoriranje može koristiti kao dio treninga jer kada je ponašanje životinje nagrađivano pažnjom. No, čak i u toj situaciji ne bismo koristili samo ignoriranje.

3.  R+ treneri vjeruju kako se nikad ništa neugodno u životu nebi smjelo dogoditi psu i pokušavaju zaštititi pse od svih mogućih neugodnih posljedica.

Prvo, ovo je nemoguće. Blagi do umjereno snažni averzivni stimulusi (nešto neugodno što pas želi izbjeći op.a) su oko nas cijelo vrijeme, i mi – i naše životinje – odrađujemo mnoga ponašanja kako bi ih izbjegli ili ublažili. Možda je psu jako vruće. To je averzivno. Možda muha zuji oko glave. To je averzivno. Možda pas mora dobiti injekciju kod veterinara. To je svakako averzivno! Istina je da mi izbjegavamo trenirati sa averzivnim stimulusima, uključujući blage. Ako pas koji se boji grmljavine pobjegne u kuću kada počne grmiti, ovo se naziva prirodno ili automatsko negativno potkrijepljenje. Pas je potkrijepljen za trčanje u kuću kroz udaljavanje od zvuka grmljavine. Grmljavina je neizbježni averzivni stimulus u životu (sovjim psima pomažem da se nose s time na druge načine osim samog bježanja). Međutim, ne bih nikada koristila glasan zvuk kao dio trening sesije i koristila činjenicu da se pas tog zvuka boji kako bi dobila određeno ponašanje. Što se tiče snažnih averzivnih podražaja (posjet veterinaru) – pripremamo psa za njih kako bi ih učinili što manje averzivnima. To je potpuno suprotno od korištenja njihovih averzivnih karakteristika.

4.  Zbog točke broj 3, R+ treneri će dopustiti svom psu da izleti u promet samo kako bi izbjegli trzanje ogrlice ili će izbjeći bilo kakakv medicinski postupak koji bi mogao biti ‘bolan’.

Ovaj argument je skoro pa uvijek slamnati čovjek. Poprilično sam sigurna da ljudi koji to govore i ponašaju se kao da to vjeruju, ne misle zaista da bismo stajali gledajući kako naši psi stradaju. U hitnoj situaciji blokirat ćemo tijelom ili zgrabiti ili srušiti ili potegnuti uzicu na psu koji će možda učiniti nešto opasno, baš kao i bilo koje drugo normalno ljudsko biće koje se brine za svog psa. Da, ovo znači koristiti averzivne podražaje. Međutim, to nije scenarij u kojem psa namjerno učimo. Drugačija ponašanja se očekuju i potrebna su u teškim situacijama. Na primjer, prijatelj me može zamoliti da iskoristim iglu kako bi uklonila trn koji ona ne može dohvatiti. To bi učinila, ukoliko me traži, iako to znači da će potencijalno boljeti. Međutim, samo zato što sam spremna to učiniti, ne znači da sam spremna učiti je kako da radi na svom novom poslu na način da je ubodem iglom svaki put kad pogriješi.

5.  R+ treneri koriste kažnjavanje ali toga nisu svjesni (ili to jednostavno ne žele priznati).

Ovo je jednostavno smiješno. Mi smo uglavnom ti koji  pokušavaju ostaviti mitove iza sebe i učiti o znanosti koja se krije iza dobrog treniranja. No, takva izjava može doći od nekoga tko jednostavno ne razumije što je točno to što mi radimo; netko tko misli da kazna jednostavno mora biti negdje unutar toga! Nekad i jest. Oni od nas koji koriste negativno kažnjavanje (P-) znaju kada ga koriste! Jedna od varijacija gore navedene pogršene pretpostavke jest i ona: ”Kada trenirate, ne date uvijek psu poslasticu. Uskraćujete nagradu i to je kažnjavanje har har har.” Ne, zapravo nije. Dok god ne postoji posljedica za pogrešan pokušaj to nije kažnjavanje. To je gašenje ponašanja. Gašenje samo po sebi nije baš lagana stvar za psa, ali se inače niti ne koristi samo za sebe već uključuje druge metode. Najčešće drugo ponašanje ili više drugih ponašanja su potkrijepljivana te pomažemo životinji napraviti prijelaz na izvođenje nekih od tih ponašanja umjesto nepoželjnog. Mi, također znamo i otvoreno priznajemo da neki alati vrlo lagano upadaju u averzivno korištenje. Nije novost da obična ogrlica može biti korištena za se psa ozlijedi. Upravo zato, kada počinjemo koristiti bilo kakvu opremu na psu, koristimo protuuvjetovanje da pomognemo psu stvoriti pozitivne asocijacije, te učimo psa ponašanjima koja će umanjiti šanse za nelagodu prilikom nošenja opreme. Ovo je potpuno suprotno od korištenja averzivnih karakteristika opreme u svrhu dobivanja ponašanja.

6.  Trening baziran na pozitivnom poticanju je jednako stresan za pse kao i balansirani ili averzivni tip treninga.

Rad sa pozitivnim oticanjem svakako može biti stresan. Međutim, stresori generalno imaju veze sa nedostatkom vještine (greške trenera) ili dodatna averzivna situacija koja nije planirana. Nije logično argumentirati da metoda koja se sastoji od davanja hrane ili igranja sa psom kada odradi poželjno ponašanje je jednako averzivna kao i metoda koja ovisi o primjeni neugode, boli ili zastrašivanja.

Zajedničke karakteristike

Svaka od ovih točaka je fokusirana na kažnjavanje ili averzivne podražaje. Jasno je kako je to slaba točka razumijevanja R+ treninga. Gore nabrojane pretpostavke, također, možemo uredno posložiti u dvije kategorije. Prve četiri pogrešno predstavljaju R+ trening. Impliciraju da je nemoguće ili neučinkovito. Zadnje dvije zamagljuju liniju između R+ treninga i treninga koji uključuje namjerno korištenje averziva.

U retoričkim terminima, prve 4 su slamnati-čovjek argumenti, a zadnje dvije koriste tu quoque logičku pogrešku povrh continuum logičke pogreške. (Linkovi vode na definicije i primjere termina).

Međutim, koliko god je iritirajuće čitati i slušati to iznova i iznova, pokušavam imati na umu kako navedene pretpostsvke mogu biti izrečene iz neznanja prije nego zlobe. Ovo je jasno objašnjeno u linku o slamnatom čovjeku. Svi mi smo odrasli u kulturi koja nas uči da koristimo averzivne podražaje kako bi promjenili nepoželjno ponašanje. ”Kulturalna magla” oko učenja i ponašanja na koju se Dr. Susan Friedman referira čini nas skeptičnima oko nagrađivanja i može uzrokovati da to izjednačimo sa jednostavnim udovoljavanjem ili čak moralnom korupcijom.

Sigurna sam da su mnogi od ljudi koji koriste gornje argumente potpuno neupoznati sa planiranjem i preciznošću koja neupitno ulazi u trening temeljen na pozitivnom poticanju. Znam da sam ja bila. Prešla sam to slušajući sve vas koji ste strpljivo objašnjavali procese uključene u R+ trening. Nadam se da ćete nastaviti opisivati svijetu što radite!

 

PREVEDENO SA: http://eileenanddogs.com/2015/05/05/myths-about-positive-reinforcement-based-training/
Oglasi